The Future of MCP — David Soria Parra, Anthropic

重塑连接:2026 AI Agent 的全连接时代

从 MCP 协议的演进,看下一代知识工作者 Agent 的基础设施构建

一、超越插件:MCP 应用的诞生

定义MCP Application (模型上下文协议应用):这是一种自带用户界面(UI)的 Agent。它不是通过插件、SDK 实现,也不是由模型在客户端动态渲染或硬编码在产品中的,而是通过 MCP 服务器提供的。

核心论点你可以将这个服务器部署在云端、ChatGPT 或 VS Code Cursor 中,它都能无缝运行。实现这一点的关键,在于语义(Semantics)与协议。客户端和服务器必须相互理解,知道如何渲染 UI,知道有 UI 正在传输。更独特的是,MCP 服务器不仅能交付应用,还能同时交付工具(Tools),允许人类通过应用与其交互,同时允许模型通过工具与其交互。

二、18个月的狂飙:1.1亿次下载的里程碑

数据/证据在 AI 的生命周期里,18个月宛如永恒。一年多前,MCP 仅仅是一份规范文档和几个仅限本地运行的 SDK。而今天,我们达到了惊人的 1.1 亿次月下载量

  • 对比作为参考,过去十年最成功的开源项目之一 React,达到同样的下载体量花费了大约两倍的时间。
  • 生态这 1.1 亿次下载不仅来自我们,还包括 OpenAI、Google 的 SDK、LangChain,以及成千上万将其作为依赖项拉取的框架和工具。这意味我们拥有了一个全行业通用的标准语言
  • 案例/故事开发者们构建了极其丰富的生态:从 WhatsApp、Blender 的玩具项目,到 Linear、Slack、Notion 的 SaaS 级集成,再到无数闭门构建的、连接企业内部系统与 AI 应用的私有服务器。

三、2026 愿景:从“本地编码员”到“全能知识工作者”

核心论点我们仍处于起步阶段。如果说 2024 年是构建 Demo 的展示期,2025 年是探索“编码 Agent(Coding Agents)”的爆发期,那么 2026 年将是把 Agent 真正推向生产环境的落地之年

洞察编码 Agent 拥有最理想的运行场景:本地化、可验证、有编译器、有开发者随时兜底。但随着模型能力的提升,我们将迎来通用 Agent(General Agents)时代。它们将承担金融分析师、营销人员等真实的知识工作。

“通用 Agent 不需要调用本地编译器,它们需要的是同时连接 5 个 SaaS 应用和一个共享云盘。对它们而言,最核心的命题是:连接性(Connectivity)。”

四、连接性技术栈:Skills, CLI 与 MCP

核心论点连接性从来不是单一的解决方案(无论是纯计算机使用还是纯 MCP)。正确的做法是建立一个“连接性技术栈”,在合适的场景使用合适的工具。2026 年构建 Agent,需综合考量以下三大支柱:

  • 1. Skills(技能):封装领域知识(Domain Knowledge),将其放入简单的文件中,主要用于复用特定能力。
  • 2. CLI(命令行接口):非常适合本地编码 Agent。在预训练中已存在(如 Git),且模型能自动发现其能力。前提是必须拥有一个安全的沙盒或代码执行环境。
  • 3. MCP(模型上下文协议):当缺乏本地沙盒时,MCP 是不可或缺的“结缔组织”。

决策指南何时必须使用 MCP?
当你需要丰富的语义、需要 UI 来展示长耗时任务、需要资源管理、需要平台无关的解耦架构、需要企业级的授权与治理策略(那些枯燥但重要的企业级需求),或者想要尝试 MCP 应用等前沿特性时。

五、客户端升级:渐进式发现与编程式调用

核心论点目前的 Agent 表现仍有欠缺,部分原因是我们尚未充分利用连接技术的组合。首先,我们需要在客户端(Agent Harness 端)进行两大架构升级:

1. 渐进式发现 (Progressive Discovery)

问题过去,由于处于实验阶段,开发者习惯将所有工具一股脑塞进上下文窗口,导致严重的“上下文膨胀(Context Bloat)”。协议只负责传输信息,处理信息的责任在客户端。

解决方案使用“工具搜索(Tool Search)”来延迟加载工具。只给模型一个“加载工具”的工具,让模型在真正需要时才去按需加载。这能极大降低工具上下文的 Token 消耗。

2. 编程式工具调用 (Programmatic Tool Calling / Code Mode)

问题传统的“调用工具 -> 获取结果 -> 调用下一个工具”模式,让模型承担了过多的编排工作,导致极高的推理延迟。

解决方案给模型提供一个 REPL 工具(如 V8 Isolate、Lua 解释器等执行环境),让模型直接编写脚本来自动组合和执行任务。结合 MCP 的 Structured Output(结构化输出)功能,模型可以获知返回值的类型信息,从而完美地实现逻辑过滤与工具的无缝串联。

六、服务端重构:为 Agent 设计,而非搬运 API

核心论点服务端开发者必须停止简单粗暴地将 REST API 一对一转换为 MCP 服务器的做法。

  • 策略 1为 Agent 的交互逻辑而设计:想象一下作为人类你会如何希望与该系统交互,这往往是设计 Agent 接口的绝佳起点。
  • 策略 2服务端编排:像 Cloudflare MCP 服务器那样,不仅提供工具,更提供执行环境,让模型在服务端完成编排,进一步降低 Token 消耗和延迟。
  • 策略 3利用丰富语义:大胆使用 MCP 独有的特性,如交付 MCP 应用、通过 MCP 传输 Skills、使用异步任务(Tasks)和启发式交互(Elicitations)。

七、协议演进路线图:MCP 的下一步

核心论点为了支撑未来的全连接时代,MCP 协议本身也将在核心性能、集成广度和扩展机制上迎来重大升级:

  • 优化核心 (Improve the Core):
    • 即将推出无状态传输协议 (Stateless Transport Protocol)(预计 6 月),解决当前流式 HTTP 在大型云厂商扩展困难的问题,让部署 MCP 服务器像部署普通 REST 服务器一样简单。
    • 改进异步任务原语,实现真正的 Agent-to-Agent 通信。
    • 发布汲取了 FastMCP 经验的 TypeScript 和 Python SDK v2 版本。
  • 无处不在的集成 (Integrate Everywhere):
    • 推出跨应用访问 (Cross-app access):与身份提供商合作,实现企业内部的单点登录(SSO),Agent 访问不同服务器无需重复验证。
    • 实现服务器自动发现 (Server Discovery):通过标准化 URL,让爬虫、浏览器和 Agent 能自动发现网站背后的 MCP 服务器。
  • 扩展机制 (Extension Mechanisms):
    • 重点推出 Skills over MCP:允许服务器作者在提供大量工具的同时,直接打包附带“领域知识/使用说明”,无需依赖外部插件注册表即可持续更新技能。

八、结语:迈向全连接的 2026

总结目前的 MCP 已经具备了非常良好的基础。2026 年的主题将是把 Agent 推向“全连接(Full Connectivity)”。最顶级的 Agent 不会局限于单一手段,它们将融会贯通地使用计算机视觉/操作(Computer Use)、命令行(CLIs)、MCP 以及技能(Skills),以获得最广泛的操作能力。

呼吁MCP 作为一个由开源社区和基金会驱动的项目,极其渴望听到开发者的声音。请加入我们的 Discord,在 Issue 中告诉我们:我们哪里做错了?哪里做对了?让我们共同在持续的反馈中,构建出属于未来的基础设施。

评论