发布于 11 小时前
摘要
意图识别与多路由调度策略 为什么需要意图识别 1. 一根筋的 RAG 系统会出什么问题 不做意图识别,所有消息都走 RAG 检索, …
所虑时光疾,常怀紧迫情,蹒跚行步慢,落后最宜鞭。
意图识别与多路由调度策略 为什么需要意图识别 1. 一根筋的 RAG 系统会出什么问题 不做意图识别,所有消息都走 RAG 检索, …
多轮对话记忆设计 实际上,大模型 API 的每次请求都是完全独立的。模型不会保存任何对话状态——它没有上一轮对话的概念,没有这个用 …
不要把所有活儿都丢给“Tools(工具)”去干,要学会用“Resources(资源)”和“Prompts(提示词)”。 我用通俗的 …
MCP协议入门与实践 skills跟mcp解决的问题不一样。 mcp很早这个概念就出来了,是一种协议、模型间调用三方能力的一个类似 …
理解函数调用Function Call RAG 只能查知识库的局限 回顾一下 RAG 的工作流程:用户提问 → 向量检索 → 召回 …
prompt工程 假设你在维护一个电商客服知识库,用户问:iPhone 16 Pro Max 拆封后还能退吗? 经过混合检索 + …
第9小节:向量数据库的原理与选型 mysql你写成json文件,检索的时候,你必须把所有向量都读出来,在内存里逐个计算相似度。这就 …
元数据的作用与管理 元数据是在分块之后、向量化之前加入的。分块完成后,你得到的是一个个纯文本块,这时候给每个块打上标签,记录它的来 …