- 已整理
Hermes Agent 记忆架构:从 L0 到 L2 的四层设计
Hermes Agent 的记忆系统完整概览——系统提示词装配(L0)、持久化记忆工具(L1)、外部记忆插件(L1.5)、会话搜索(L2)、以及上下文压缩与 session 分裂。不依赖向量数据库。SQLite FTS5 + LLM 摘要 + 文件级持久化。
研究 · · 更新于 5月24日 ·aiagentllmmemoryretrievalsearchsqlitearchitecture· 0 views - 已整理
Prompt Caching 工程实践:Anthropic 的缓存设计与 defer_loading 模式
从 Claude Code 的 prompt caching 实践出发,整理缓存设计哲学、OpenAI/Anthropic/Google 的差异、defer_loading 占位模式。
研究 · · 更新于 5月24日 ·aiagentllmpromptperformancesoftware engineering· 0 views - 已整理
Hermes Agent memory 系统的工程安全机制
解析 Hermes memory_tool.py 中六项关键安全设计:注入扫描、文件锁、reload-under-lock、超容拒绝写、原子写入、子串匹配删除。
研究 · · 更新于 5月4日 ·aiagentsecuritysoftware engineeringconcurrency· 0 views - 已整理
Faiss vs Chroma 向量库选型取舍
围绕 Faiss、Chroma 及相关向量库在 RAG / 向量检索场景中的定位差异与索引算法取舍整理。
研究 · · 更新于 5月20日 ·aillmragretrievalvector databasefaisschromamilvusqdrantweaviatepgvectorann· 0 views - 已整理
RAG 检索细节与 Pipeline 设计
围绕 Embedding、Reranker、Chunking、Hybrid Search、Query Transformation 等 RAG 检索细节的整理。
研究 · ·aillmragretrievalembeddingrerankerreference· 0 views - 已整理
Vercel AI SDK 中的 Message 类型整理
记录 Vercel AI SDK 中 Message 分层、SSE 流式协议,以及实际开发时的状态管理建议。
参考 · · 更新于 4月10日 ·aillmfrontendreacttypescriptagentreference· 0 views - 已整理
Agent Routing 与多智能体成本控制
围绕 agent route / agent routing 的基础概念、常见实现方式,以及 multi-agent 系统里的成本控制思路整理。
研究 · · 更新于 4月4日 ·aiagentllmmulti-agentorchestrationroutingworkflow· 0 views - 已整理
现代 Next.js 技术栈选型取舍:Drizzle / Prisma、Arctic / Auth.js、Jotai / Redux
围绕一段 Grok 对话整理现代 Next.js 项目在 ORM、认证、状态管理上的实际选型取舍与判断标准。
研究 · · 更新于 3月30日 ·frontendtypescriptreactsoftware engineeringagentreference· 0 views - 已整理
Harness Engineering 与 Codex 生产实践
关于 OpenAI 团队如何在几乎 100% 由 Codex 编写代码的前提下构建生产级项目的实践整理。
研究 · · 更新于 3月14日 ·aiagentcodexsoftware engineeringworkflow· 0 views - 已整理
Jina Embeddings API 深度解析
关于 Jina Embeddings 在多语言检索、长文本、Late Chunking、v4/v5 选型上的整理笔记。
研究 · · 更新于 4月16日 ·aillmragembeddingrerankerjinaqwen· 0 views - 已整理
Prompt Injection 纵深防御笔记
整理 OpenAI、Anthropic 与常见工程防御手段在提示词注入场景下的核心思路与面试答法。
研究 · · 更新于 3月14日 ·aiagentpromptsecurityllm· 0 views
📒
Notes
一手笔记 · 持续生长中
这里是我平时沉淀的一手笔记:Agent 学习、工程化选型对比(Embedding、向量库、AI SDK 等)、面试里遇到的好题目。 还没打磨成博客,但都是最新的思考——比成稿博客更接近"现在在想什么"。
views
| comments
显示第 1-11 条,共 11 条