📒

Notes

一手笔记 · 持续生长中

这里是我平时沉淀的一手笔记：Agent 学习、工程化选型对比（Embedding、向量库、AI SDK 等）、面试里遇到的好题目。还没打磨成博客，但都是最新的思考——比成稿博客更接近"现在在想什么"。

views | comments

显示第 1-11 条，共 11 条

Hermes Agent 记忆架构：从 L0 到 L2 的四层设计

Hermes Agent 的记忆系统完整概览——系统提示词装配（L0）、持久化记忆工具（L1）、外部记忆插件（L1.5）、会话搜索（L2）、以及上下文压缩与 session 分裂。不依赖向量数据库。SQLite FTS5 + LLM 摘要 + 文件级持久化。

研究 · 2026年5月24日 · 更新于 5月24日 ·
aiagentllmmemoryretrievalsearchsqlitearchitecture
· 0 views

已整理
Prompt Caching 工程实践：Anthropic 的缓存设计与 defer_loading 模式

从 Claude Code 的 prompt caching 实践出发，整理缓存设计哲学、OpenAI/Anthropic/Google 的差异、defer_loading 占位模式。

研究 · 2026年5月24日 · 更新于 5月24日 ·
aiagentllmpromptperformancesoftware engineering
· 0 views

已整理
Hermes Agent memory 系统的工程安全机制

解析 Hermes memory_tool.py 中六项关键安全设计：注入扫描、文件锁、reload-under-lock、超容拒绝写、原子写入、子串匹配删除。

研究 · 2026年5月4日 · 更新于 5月4日 ·
aiagentsecuritysoftware engineeringconcurrency
· 0 views

已整理
Faiss vs Chroma 向量库选型取舍

围绕 Faiss、Chroma 及相关向量库在 RAG / 向量检索场景中的定位差异与索引算法取舍整理。

研究 · 2026年4月16日 · 更新于 5月20日 ·
aillmragretrievalvector databasefaisschromamilvusqdrantweaviatepgvectorann
· 0 views

已整理
RAG 检索细节与 Pipeline 设计

围绕 Embedding、Reranker、Chunking、Hybrid Search、Query Transformation 等 RAG 检索细节的整理。

研究 · 2026年4月16日 ·
aillmragretrievalembeddingrerankerreference
· 0 views

已整理
Vercel AI SDK 中的 Message 类型整理

记录 Vercel AI SDK 中 Message 分层、SSE 流式协议，以及实际开发时的状态管理建议。

参考 · 2026年4月10日 · 更新于 4月10日 ·
aillmfrontendreacttypescriptagentreference
· 0 views

已整理
Agent Routing 与多智能体成本控制

围绕 agent route / agent routing 的基础概念、常见实现方式，以及 multi-agent 系统里的成本控制思路整理。

研究 · 2026年4月4日 · 更新于 4月4日 ·
aiagentllmmulti-agentorchestrationroutingworkflow
· 0 views

已整理
现代 Next.js 技术栈选型取舍：Drizzle / Prisma、Arctic / Auth.js、Jotai / Redux

围绕一段 Grok 对话整理现代 Next.js 项目在 ORM、认证、状态管理上的实际选型取舍与判断标准。

研究 · 2026年3月30日 · 更新于 3月30日 ·
frontendtypescriptreactsoftware engineeringagentreference
· 0 views

已整理
Harness Engineering 与 Codex 生产实践

关于 OpenAI 团队如何在几乎 100% 由 Codex 编写代码的前提下构建生产级项目的实践整理。

研究 · 2026年3月14日 · 更新于 3月14日 ·
aiagentcodexsoftware engineeringworkflow
· 0 views

已整理
Jina Embeddings API 深度解析

关于 Jina Embeddings 在多语言检索、长文本、Late Chunking、v4/v5 选型上的整理笔记。

研究 · 2026年3月14日 · 更新于 4月16日 ·
aillmragembeddingrerankerjinaqwen
· 0 views

已整理
Prompt Injection 纵深防御笔记

整理 OpenAI、Anthropic 与常见工程防御手段在提示词注入场景下的核心思路与面试答法。

研究 · 2026年3月14日 · 更新于 3月14日 ·
aiagentpromptsecurityllm
· 0 views

已整理

Notes

Hermes Agent 记忆架构：从 L0 到 L2 的四层设计

Prompt Caching 工程实践：Anthropic 的缓存设计与 defer_loading 模式

Hermes Agent memory 系统的工程安全机制

Faiss vs Chroma 向量库选型取舍

RAG 检索细节与 Pipeline 设计

Vercel AI SDK 中的 Message 类型整理

Agent Routing 与多智能体成本控制

现代 Next.js 技术栈选型取舍：Drizzle / Prisma、Arctic / Auth.js、Jotai / Redux

Harness Engineering 与 Codex 生产实践

Jina Embeddings API 深度解析

Prompt Injection 纵深防御笔记