人工智能基础设施的供需矛盾正在全球顶级科技公司之间激化。据知情人士透露,谷歌约于今年3月告知Meta,无法满足其全部Gemini算力需求,并对这家社交媒体巨头实施了使用上限——即便是全球最大的AI服务商,也难以应对汹涌而来的算力需求。

据英国《金融时报》报道,上述限制至今仍未解除,已导致Meta多个内部AI项目遭到干扰和延误。受此影响,Meta已要求员工提高AI算力使用效率,在内部推行对AI token的精打细算。谷歌与Meta均拒绝就此置评。

这一局面迫使谷歌加快扩容步伐。谷歌本月早些时候与埃隆·马斯克旗下SpaceX签订了一份每月9.2亿美元的算力租赁协议。谷歌CEO桑达尔·皮查伊在今年一季度财报会议上坦言:"近期我们在算力方面确实面临制约,如果能够满足需求,云业务收入将会更高。"

Meta并非孤例。多位知情人士指出,其他谷歌企业客户同样受到程度不一的限制,而Meta因需求规模异常庞大受影响最深。这场风波折射出AI推理工作负载的爆炸式增长,已成为整个行业面临的最大挑战之一。

算力瓶颈持续承压,大客户首当其冲

尽管各大科技公司已在芯片、数据中心和电力供应上砸下数百亿美元,AI算力供给仍难以追上需求增速。

谷歌一季度云业务收入首次突破200亿美元,已签署但尚未交付的云合同积压量环比几乎翻番,超过4600亿美元。皮查伊明确表示,算力制约在近期内仍将持续。

在此背景下,Meta受到的冲击尤为突出。知情人士表示,正是Meta等大型企业客户的高强度需求,直接推动谷歌加速寻求外部算力来源。随着企业大规模部署聊天机器人、编程助手和AI智能体,推理工作负载——即模型训练完成后在实际应用中执行任务所消耗的算力——正成为行业的核心瓶颈。

Meta内部项目受阻,加速转向自研模型

Meta在内部广泛使用Gemini,涵盖平台安全审核(包括识别诈骗内容、清除有害信息)、客服及广告辅助聊天机器人,以及部分内部工作流和代码开发,同时搭配使用Anthropic的Claude等其他模型。

据知情人士透露,Meta最初选择Gemini,是因为其表现优于公司自研的Llama开源模型。然而随着算力限制的收紧,Meta正加快向自研模型迁移。多位知情人士表示,Meta近期已开始优先推广其新推出的Muse Spark模型,该模型被认为在性能上已能与Gemini相抗衡,有助于降低对外部模型的依赖。

Meta CEO马克·扎克伯格此前持续加大对AI人才和基础设施的投入,致力于打造其所称的"个人超级智能"。与谷歌不同,Meta没有云业务,正在加速自建数据中心体系,并承诺到2028年在美国累计投资6000亿美元。

谷歌借道SpaceX扩容,行业寻求破局

面对算力压力,谷歌本月与SpaceX签署每月9.2亿美元的算力租赁协议,以弥补基础设施缺口。AI实验室Anthropic上月也与SpaceX达成了类似协议。

谷歌对Meta采取限制措施一事,为外界提供了一个罕见窗口,得以窥见全球顶级AI服务商在算力分配上所面临的真实压力。当前,整个AI行业的基础设施瓶颈正从训练侧蔓延至推理侧,供需矛盾的化解仍有赖于新一轮大规模资本投入的落地兑现。