Fuxiang Wang
RSS Feed这里是我的个人网站,主要记录 AI infrastructure、LLM Gateway、RAG 系统、Go 后端和性能工程里的设计、实现与取舍。
我会在这里持续发布技术文章、项目复盘和工程笔记。可以直接阅读最新文章,或访问 GitHub 查看我的项目和代码。
Links:
Recent Posts
-
一个 PostgreSQL 怎么同时搞定向量检索和全文检索
pgvector + tsvector 双索引,一个数据库解决 RAG 的全部存储需求
-
RAG 文档摄入的 5 阶段并发 Pipeline 怎么设计
解析 → 分 chunk → 攒批 → embedding → 入库,每个阶段独立伸缩
-
给 RAG 的 Prompt 装个预算——Token 动态分配怎么做
LLM 上下文窗口有限,检索结果、会话记忆、用户问题怎么分 token?
-
RAG 检索到底怎么做到又准又全——混合检索 + RRF 融合实战
向量检索和全文检索各有盲区,双路并行 + RRF 融合才是正解