算力告急：谷歌悄然对Meta实施Gemini使用上限

人工智能基础设施的供需矛盾正在全球顶级科技公司之间激化。据知情人士透露，谷歌约于今年3月告知Meta，无法满足其全部Gemini算力需求，并对这家社交媒体巨头实施了使用上限——即便是全球最大的AI服务商，也难以应对汹涌而来的算力需求。

据英国《金融时报》报道，上述限制至今仍未解除，已导致Meta多个内部AI项目遭到干扰和延误。受此影响，Meta已要求员工提高AI算力使用效率，在内部推行对AI token的精打细算。谷歌与Meta均拒绝就此置评。

这一局面迫使谷歌加快扩容步伐。谷歌本月早些时候与埃隆·马斯克旗下SpaceX签订了一份每月9.2亿美元的算力租赁协议。谷歌CEO桑达尔·皮查伊在今年一季度财报会议上坦言："近期我们在算力方面确实面临制约，如果能够满足需求，云业务收入将会更高。"

Meta并非孤例。多位知情人士指出，其他谷歌企业客户同样受到程度不一的限制，而Meta因需求规模异常庞大受影响最深。这场风波折射出AI推理工作负载的爆炸式增长，已成为整个行业面临的最大挑战之一。

算力瓶颈持续承压，大客户首当其冲

尽管各大科技公司已在芯片、数据中心和电力供应上砸下数百亿美元，AI算力供给仍难以追上需求增速。

谷歌一季度云业务收入首次突破200亿美元，已签署但尚未交付的云合同积压量环比几乎翻番，超过4600亿美元。皮查伊明确表示，算力制约在近期内仍将持续。

在此背景下，Meta受到的冲击尤为突出。知情人士表示，正是Meta等大型企业客户的高强度需求，直接推动谷歌加速寻求外部算力来源。随着企业大规模部署聊天机器人、编程助手和AI智能体，推理工作负载——即模型训练完成后在实际应用中执行任务所消耗的算力——正成为行业的核心瓶颈。

Meta内部项目受阻，加速转向自研模型

Meta在内部广泛使用Gemini，涵盖平台安全审核（包括识别诈骗内容、清除有害信息）、客服及广告辅助聊天机器人，以及部分内部工作流和代码开发，同时搭配使用Anthropic的Claude等其他模型。

据知情人士透露，Meta最初选择Gemini，是因为其表现优于公司自研的Llama开源模型。然而随着算力限制的收紧，Meta正加快向自研模型迁移。多位知情人士表示，Meta近期已开始优先推广其新推出的Muse Spark模型，该模型被认为在性能上已能与Gemini相抗衡，有助于降低对外部模型的依赖。

Meta CEO马克·扎克伯格此前持续加大对AI人才和基础设施的投入，致力于打造其所称的"个人超级智能"。与谷歌不同，Meta没有云业务，正在加速自建数据中心体系，并承诺到2028年在美国累计投资6000亿美元。

谷歌借道SpaceX扩容，行业寻求破局

面对算力压力，谷歌本月与SpaceX签署每月9.2亿美元的算力租赁协议，以弥补基础设施缺口。AI实验室Anthropic上月也与SpaceX达成了类似协议。

谷歌对Meta采取限制措施一事，为外界提供了一个罕见窗口，得以窥见全球顶级AI服务商在算力分配上所面临的真实压力。当前，整个AI行业的基础设施瓶颈正从训练侧蔓延至推理侧，供需矛盾的化解仍有赖于新一轮大规模资本投入的落地兑现。