Less than 1 minute
- MySQL25
- interview17
- python12
- java11
- ECS10
- Linux10
- nowcoder9
- git6
- go6
- spring6
- Computer Base6
- postgresql5
- wsl5
- Intro4
- 源码分析4
- computer tower4
- llm3
- Logging Framework3
- c3
- Environment setup3
- redis2
- 架构2
- vlm2
- docker2
- c++2
- milvus2
- wechat2
- MySQL查询深入优化2
- architect1
- Tools1
- icon1
- markdown1
- docker compose1
- Nginx1
- k8s1
- ssh1
- springboot1
- Design Patterns1
- Term1
- CLion1
- windows1
- chocolatey1
- Blog1
- vue1
- trouble shooting1
检索算法
检索,retrieval,是 RAG 中最重要的第一步。完整的检索流程包含两个阶段:表征(将文本转化为数学表示) 与 匹配(在数据库中寻找最相似的结果)。
稀疏检索(Sparse Retrieval)
稀疏检索主要基于关键词匹配。它非常擅长处理精确匹配(如人名、产品型号、特定术语),但难以理解同义词。
传统稀疏检索
- TF-IDF: 经典的加权方法,根据词频(TF)和逆文档频率(IDF)计算权重。
- BM25(Best Matching 25)
神经稀疏检索
About 3 min
