Archives
All the articles I've archived.
2026 2
March 2
-
一个 PostgreSQL 怎么同时搞定向量检索和全文检索
pgvector + tsvector 双索引,一个数据库解决 RAG 的全部存储需求
-
RAG 文档摄入的 5 阶段并发 Pipeline 怎么设计
解析 → 分 chunk → 攒批 → embedding → 入库,每个阶段独立伸缩
2025 8
December 2
-
给 RAG 的 Prompt 装个预算——Token 动态分配怎么做
LLM 上下文窗口有限,检索结果、会话记忆、用户问题怎么分 token?
-
RAG 检索到底怎么做到又准又全——混合检索 + RRF 融合实战
向量检索和全文检索各有盲区,双路并行 + RRF 融合才是正解
November 4
-
Anthropic 的 SSE 和 OpenAI 的不一样——我是怎么做实时协议转换的
把 Anthropic 的流式事件翻译成 OpenAI 格式,零拷贝,逐 chunk 转发
-
我的 LLM Gateway 怎么做到上游挂了用户无感的
多供应商故障转移 + 熔断 + 健康检查联动实战
-
把熔断器塞进 http.RoundTripper——Go 里最优雅的做法
不改业务代码,在 Transport 层透明实现 per-provider 熔断
-
给 API 网关做限流——令牌桶 + TTL 自动回收实战
每个 token 一个桶,不活跃的桶自动回收,不让内存泄漏
October 2
-
encoding/json 太慢了,我手写了一个零分配 JSON 构建器
在协议转换热路径上,为什么我不用标准库,以及怎么做到零分配
-
用 Redis 给 AGV 做电池调度——ZSet + 分布式锁 + 状态机
怎么用最简单的技术栈解决仓储场景的调度问题