认识模型上下文协议（MCP）（上）

1. 模型上下文协议 MCP是什么

模型上下文协议是一个标准化的接口和框架，允许AI模型与外部工具、资源和环境无缝交互。它可以被视为是AI系统和外部服务都可以使用的通用适配器，可以相互理解而无需自定义粘合代码。

MCP协议使AI应用中的每一个相关方都受益。

MCP是一种开放协议，用于AI应用程序或代理环境和外界服务之间的结构化通信。通过统一接口，MCP打破了数据孤岛和互操作性障碍。例如，在MCP下，无论AI需要查询SQL数据库、调用Web API还是执行脚本，都使用相同的协议和消息格式。

此外，MCP的灵感来源于语言服务器协议（LSP）在开发工具领域的成功。LSP定义了一个标准，以便编辑器可以以统一的方式与任何编程语言的分析引擎对话，而不是每个编辑器都需要为每种语言定制一个插件。

同样，MCP还支持AI助手来与任何实现MCP服务标准的工具进行对话。AI Agent可以根据任务上下文自主发现、选择和协调工具，而不是局限于设计时连接的固定工具箱。

LLM根据上下文窗口生成响应，即提供给模型的文本输入，这通常包括用户的输入提示、对话历史记录、指令或提供给模型的额外输入。模型的响应完全由这些上下文及其训练决定。但是，有几点需要注意：

3. 早期的上下文管理方法

4. MCP技术出现前4.1 静态提示（预工具）

最初，使用LLM意味着在提示中提供所有必要的信息并希望它能给出答案。如果模型不知道某些信息，那么它就没有直接的方法来找出答案。

4.2 检索增强生成

在RAG系统中，外部系统（而不是模型本身）进行搜索或数据库查找，然后将结果作为上下文提供给模型。这有助于获取最新信息金额特定领域知识，但它仍然将模型视为数据的被动消费者，模型本身并没有主动发起这些查询。此外，RAG主要解决知识查找，不允许模型执行操作或使用工具。

4.3 提示链接和代理

一些高级应用程序开始使用代理，其中的模型输出可以被解释为执行操作的命令。这种技术通常被称为ReAct模式或者通过思维链提示的工具使用，它功能强大，但比较临时，相对脆弱。

4.4 函数调用机制

函数调用通过将自然语言意图转换为API调用来弥合语言和代码之间的差距。因为MxN问题并没有让开发者的工作变得容易。

在没有统一协议的情况下，将多个AI模型与多个工具集成需要为每对模型定制连接，这种碎片化不仅给开发人员带来了困难，也限制了AI系统本身的发展。AI Agent也无法轻松地与其他Agent共享工具或上下文，而且添加新功能也很繁琐。

文章版权归作者所有，未经允许请勿转载。

5个月前

0650

5个月前

0630

5个月前

0570

5个月前

0750

暂无评论

暂无评论...