AI 前沿 · 深度解析

模块化即未来：IBM Granite 4.1、Bob 与企业 AI 的下一个范式

当"万能大模型"遭遇预算天花板，专业化、可组合的 AI 系统正在悄悄改写企业智能化的游戏规则。

来源：Mixture of Experts 播客嘉宾：Marina Danilevsky · Gabe Goodhart · Kotaro Watanabe · Jamie Garcia 话题：企业 AI · 分布式训练 · 量子计算

Granite 4.1 IBM Bob DeepSeek V4 DéLoCo 量子计算

一、企业不需要"全能神"，它需要"对的人做对的事"

IBM 本周发布了 Granite 4.1 系列模型与全新 AI 开发伙伴 Bob，在前沿大模型纷纷竞逐"通用智能"的当下，这次发布显得格外另类——它几乎不谈"智慧"，只谈"分工"。

Granite 4.1 并非一个单一模型，而是一个完整的家族：语言模型（3B 至 30B 参数）、视觉模型、语音模型，以及向量嵌入模型。每一类都专攻一个核心任务，而非包揽一切。

企业关心的是：你能不能读懂表格？至于能不能生成科幻插图？那根本不在考虑范围内。企业要的，是把活干完。

— Marina Danilevsky，IBM 高级研究科学家

视觉模型重点攻克表格与图表理解；语音模型则把体积压到极致，专注转录与翻译，力求部署到尽可能多的终端设备。语言模型聚焦指令遵循与工具调用，作为 RAG 流水线或 Agent 工作流中的"背景研究员"。

3B–30B 语言模型参数规模

4 类语言 / 视觉 / 语音 / 嵌入

可组合按需调用 · 降本增效

二、Bob：让 Agent 学会"精打细算"

Bob 是 IBM 推出的系统级 AI 开发伙伴，其核心逻辑是：不要用昂贵的前沿模型做所有事情。它像一个智能调度中心，将不同任务路由给最合适的模型——繁重的推理交给 Mistral 或 Granite，简单的补全交给轻量专用模型，安全审查则有专门的微调版本。

我们已经见过太多公司在第一季度就把全年的 token 预算烧光的故事。这种"token 轰炸"的方式，对企业来说根本不可持续。

— Gabe Goodhart，IBM 首席架构师

Kotaro 补充了一个独特视角：COBOL、主机代码——这些运行在金融、银行系统深处、由数万亿行代码组成的"遗产"，主流编程 Agent 几乎不认识它们。而 Bob 将其视为头等公民，这不是功能，是护城河。

模块化不是妥协，而是成熟。就像 80 年代操作系统从巨型程序演进为可组合服务一样，AI 基础设施正在经历同一场革命。"一个大模型搞定一切"的时代，在企业语境下根本不可持续。

三、DéLoCo：分布式训练的一次重要押注

Google DeepMind 发布了论文 DéLoCo（Distributed Low Communication），提出了一种跨多数据中心进行大模型训练的新方法。其核心突破在于：在关键计算节点引入"容错窗口"，使训练不再依赖同一数据中心内的超紧密耦合 GPU 集群。

为什么这很重要？因为当前的"单一超大规模数据中心"模式正在触碰两堵墙：其一是电网容量（北弗吉尼亚的电网已经接近饱和），其二是硬件供应链瓶颈。DéLoCo 提供的，是一种将训练负载分散到多地、甚至混用新旧代 GPU 的可能性。

88% DéLoCo 有效吞吐率

27% 传统集群有效吞吐率

训练会走向联邦化，而推理会继续集中化。这两种拓扑将驱动截然不同的硬件优化方向。

— Kotaro Watanabe，IBM 首席研究科学家

Marina 还指出，这项技术在政策层面同样有意义：如果训练可以在电网压力大时迁移到其他节点，监管机构就有机会设置实际可操作的用电限制，而不是面临"要么全开要么走人"的二元困局。

四、DeepSeek V4：开源模型的新边界

DeepSeek 发布了参数量达 1.6 万亿的 V4 模型，但实际激活参数仅 490 亿——3% 的激活率，是其推理经济性的核心秘密。闭源大模型若想匹配这一推理成本，需要从底层重建服务基础设施。

Marina 特别关注其注意力机制的改进：百万级上下文窗口在代码 Agent 场景下意义重大——将整个代码仓库扔进去，让模型自己判断哪里重要。这不是噱头，是真实的工程需求。

两年前基于"上下文太贵、必须分块检索"假设搭建的 RAG 流水线，正在被重新审视。当百万 token 上下文成为默认配置，"检索"还是"直接塞进去"的权衡，答案正在悄然改变。

五、量子计算：需要整个村庄的力量

量子方向，IBM 量子合作伙伴总监 Jamie Garcia 带来了一个务实的视角：量子计算的每一次进步，都依赖物理学家、软件工程师、化学家、生物学家的协同。IBM 正在与 MIT、UIUC、Georgia Tech 等机构深化合作，探索量子与 HPC、AI 协同解决实际问题的路径。

所谓"量子优势"，定义是：含有量子计算组件的工作流，在解决特定问题时比纯经典计算更快、更准或更省钱。Jamie 认为，化学、材料科学、金融优化与生命科学是最接近这一阶段的领域。

量子不是大数据机器，它有自己最擅长的任务。我们需要 QPU 与 GPU、CPU 协同编排，充分发挥异构计算平台的潜力。

— Jamie Garcia，IBM 量子战略合作总监

从 Granite 4.1 的专业分工，到 Bob 的智能调度，再到 DéLoCo 的分布式训练与 DeepSeek 的推理经济学——这一周的 AI 前沿，指向同一个方向：效率、可组合性与可持续性，正在取代"更大更全"成为新的竞争维度。企业 AI 的下一章，不是谁拥有最聪明的模型，而是谁构建了最合理的系统。