【翻译、转载】【译文】模型上下文协议（Model Context Protocol, MCP）简介

原文地址：

https://michaelwapp.medium.com/model-context-protocol-mcp-an-introduction-guide-25736f3dd672

在人工智能和 AI 驱动应用日新月异的格局中，一种与大型语言模型（LLM）交互的新方式正在兴起。随着 AI 智能体（Agent）的崛起带来了系统间高效交互的需求，高效的模型交互变得比以往任何时候都更加重要。

模型上下文协议（Model Context Protocol, MCP）是一种新兴标准，旨在简化 AI 模型与外部系统的交互方式，确保基于上下文的响应并实现与各种应用的无缝集成。但 MCP 究竟是什么？为何它在开发者和 AI 爱好者中日益受到关注？

本文将解释 MCP 是什么，它是如何工作的，以及它为何对 AI 交互的未来至关重要。

在这里插入图片描述

什么是模型上下文协议？

其核心是，模型上下文协议是一种标准化的方式，让 AI 系统能够在对话期间访问外部信息源。可以将其想象为赋予 AI 模型在需要时**“查找信息或执行操作”**的能力，而不是仅仅依赖其预训练知识或当前的对话上下文。

想象一下你正在与一个 AI 助手对话。没有 MCP，AI 只能利用其训练数据（有知识截止日期）以及你在当前对话中明确告知它的内容。有了 MCP，AI 可以动态地访问外部信息源——如数据库、API 或文档存储库——以提供更准确、最新和个性化的响应。

模型上下文协议是 Anthropic 发起的一个开源项目。他们的工作旨在创建一个统一的协议，允许 AI 系统以一致的方式请求和接收外部数据，无论底层实现如何。这种标准化对于构建更可靠、更透明的 AI 助手至关重要，这些助手能够为用户提供及时准确的信息。
在这里插入图片描述

MCP 是如何工作的？

模型上下文协议通过几个组件之间的结构化通信模式运作：

用户 (User)：与 AI 系统交互的人（例如，通过聊天界面、SaaS 应用程序或任何其他与 AI 通信的方式）。
AI 模型 (AI Model)：处理用户查询的大型语言模型（如 GPT-4、Claude 或其他模型）。
MCP 服务器 (MCP Server)：一个中间件服务，它解释模型对额外上下文的请求，并获取相关信息。
信息源 (Information Sources)：提供模型请求信息的外部数据存储库、API 或服务。

以下是典型的 MCP 交互流程：

用户向 AI 模型发送提示 (prompt)。
模型处理提示，并确定需要额外的上下文来提供准确的响应。
模型按照 MCP 格式生成对特定信息的请求。
MCP 服务器接收此请求，对其进行解释，并查询适当的信息源。
信息源将请求的数据返回给 MCP 服务器。
MCP 服务器格式化数据并将其发送回模型。
模型将这些新信息整合到其上下文中，并为用户生成响应。

这个过程无缝发生，且通常近乎实时，给人一种 AI 助手知识更渊博、能力更强的印象。

MCP 的技术结构

现在让我们看看模型上下文协议的底层工作原理：

请求结构

当 AI 模型需要额外的上下文时，它会生成一个结构化的请求，通常包括：

{"queries": [{"provider": "github","query": "the last 10 files changed in the main branch of the example repository","parameters": {"repo_name": "example"}}]
}

在这个例子中，你可以看到：

queries: 查询对象的数组，允许同时发起多个信息请求。
provider: 指定使用哪个信息源（在此例中是 “github”，可能指向一个搜索引擎或知识库）。
query: 实际的查询文本。
parameters: 额外的配置选项，例如 repo_name。

请注意，这是一个简化版本，因为 AI 模型使用此上下文请求格式的更复杂版本来查询外部源。

响应格式

MCP 服务器随后以模型能够解释的标准化格式返回数据：

{"responses": [{"provider": "github","status": "success","results": [{"filename": "app.py","commit_id": "c21100226d66741de8d56fb8351d83e5723a5e32"},{"filename": "requrirements.txt","commit_id": "c21100226d66741de8d56fb8351d83e5723a5e32"},// 更多结果...]}]
}