文 | 阑夕

在今天的发布会之前,行业里已经在传千问月活过亿的消息,考虑到千问真正开始在C端发力推广还不到两个月,这个里程碑可以说是相当过硬了。

我在微博发过一次投票,让大家选择自己使用最多的AI应用,总计有1.5万人参与,其中千问拿到了4887张票,仅次于豆包,高于DeepSeek和ChatGPT。

这种投票当然算不得数,但在这么短的时间里,一款新App能够刷出如此高的存在感,并不是走在路上会经常见到的画面。

我在测试机上体验了这次千问主要发布的任务助理和阿里系生态调用两大突破,点奶茶、订酒店、做攻略、甚至是抢购捡漏,都能交给千问去办。

怎么说呢,看到阿里不再把「办事」能力局限于做PPT等办公场景,我是很欣慰的,那是一条注定越走越窄的路,鼓励牛马给自己换一台拉得更快的磨,这切入点也不太好宣传⋯⋯

生活场景才是用户侧的第一入口,这不是秘密,只是生活本身的多样性,天然需要模型自带高度泛化的能力,这和所有人在报销发票、润色文档、美化PPT等方面需求都差不多,是完全不同的级别。

千问相当于把一个在现实里长出手脚的Manus装进了体内——都说Manus「套壳」却又在近一年的时间里无人能够复制——这次换成千问真的要把Agent折叠成应用层的基础能力之一了,无论成否,都是在把大模型的价值带入下一个版本。

阿姆斯特朗在月球上留下脚印后说的那句话人尽皆知——「这是个人的一小步,却是人类的一大步」——历史也会如实记载2026年的这场开幕,千问App迈出的一小步,也是大模型行业迈出的一大步。

正如今天发布会的主题,从「有问必答」到「有问必达」,这中间的跨度,就是千问在这一轮要实现的真正价值。

· · ·

千问团队在演示千问写报告的时候,用得最多的评价语是:「这赶得上一个P8了。」

不得不说,由阿里的人自己来评估工作质量,说服力不是一般的高,对P8的岗位冲击也不是一般的大。

但大家在上手使用的时候,真正想要看到的,还是它能在后台默默打开高德地图和淘宝闪购替用户下单的能力值,要的就是全程零干预的爽感。

所以阿里副总裁吴嘉今天在发布会现场用千问点奶茶的画面,对于整个行业来说都有提振效应,人人都知道AI的办事能力会被越拓越宽,但当它真的在眼前发生了,还是会不由生出那种所谓的未来感。

考虑到ChatGPT和Gemini都在把购物能力当成扩大服务边界的亮点,相比它们还需要去找沃尔玛这种零售商去谈合作——亚马逊是不可能「屈尊」让自己OTT化的——这就显得阿里在做同样的事情时,能有更加丝滑的效率。

一家人不说两家话,从支持力度来看,基本上阿里全系产品都接受了被千问调用的「新规矩」,所谓的一号位项目,就是可以为所欲为⋯⋯

事实上,AI行业在过去一年里之所以也被称为Agent元年,是因为在拼智能上,头部模型已经进入了高度对齐的僵持阶段,不再存在有哪家模型断崖式领先的战况。

大模型竞技场Lmarena统计了GPT-4之后所有模型能在Sota(排名第一)位置上坐稳的平均天数,只有35天,在这种卷法面前,用户的忠诚度无从说起,只会「慕强」。

所以AI大厂都在急于为模型插上「手脚」,光有「头脑」是不够的,得有做事的行动力,但新的问题在于,在离开聊天框之后,绝大多数的交互,都需要被交互方的配合。

就好比说,一辆引擎轰鸣的赛车,如果上不了路,它的速度再快,也只能在原地打转。

我们也看到了很多样式的尝试方案,有MCP这种主打开放协议的,有接管鼠标键盘这种复古派别的,有发力GUI这种系统级技术的,但在兜兜转转一大圈后,可能还是要接受一个现实:

让大厂自己来集成自己的生态,可能才更容易实现不流血的光荣革命。

· · ·

前几天,清华大学举办的AGI-Next峰会上大佬云集,虽然各有各的主张和立场,但对「ChatBot的竞争已经结束」这个判断,现场是有共识的。

考虑到Manus最初还曾和阿里接触并试图用千问作为基础模型开展国内业务的往事,千问的团队应该明白自己是在啃下一块怎样的硬骨头。

事实上,在没有多模态、没有高日活、没有全家桶、更不会一键脱衣的情况下,Anthropic依然在第一梯队里且收入增长速度甚至已经开始超过OpenAI,靠的就是Claude「好用」。

是的,在模型的聪明程度拉不开特别大的差距时,「好用」的价值就成了新的胜负手。

这也是千问正在扩大优势的地方,基于全球领先的基座模型,千问强化了App的工程体系,把增加的技能点加到了解决具体事情而不只是回答问题的新模式。

就像是在学校里,会做题当然是竞争力,但走上社会,被夸「动手能力很强」,才是真的能上岗就业。

我让新版千问帮我找带有几个指定角色的卡二手手游账号,并给出最省钱的可购买选择,从虚拟机的任务执行情况来看,千问确实能够科学化的拆解任务,按步骤去逐步推进,从搜集交易网站,到用什么关键词筛选,再到对符合要求的商品进行对比评估,最后给我一个高性价比的清单。

我也相信这是一个足够非标准化的需求,不太可能被忙于加班的产品经理们作为预设场景去训练,但优秀的强化学习(RL),就应该自带举一反三的执行力。

更不用提其实在很多购物场景里,人们通常很难精确地描述出具体需求,这时便需要千问的介入去引导用户,并共同做出最终决策。

而更大的亮点,其实还来自于千问想打造的集成式体验,阿里系的所有产品能力,都可以被整合进同一个入口里,一切都可以在千问发起、完成。

至于最重要的交互,自然语言就是毫无争议的第一语言,无需冗余思考,不用来回切换,也不存在任何使用门槛,AI可以帮助用户做出全链路的参考、决策和操作。

从这个角度来看,千问的进化,是超出预期的。

· · ·

我其实花了一点时间,才理解了为什么那么多AI产品的发布会都会用点奶茶来当包袱。

都怪乔布斯。

他老人家在发布第一代iPhone的时候,就通过地理定位+触控拨号的方式,向距离会场最近的星巴克订咖啡,虽然实际上并没有下单,但这种前所未有的交互形式,依然震惊了所有人,并极其生动的展现了移动互联网应该长什么样。

而千问的交互——靠一句话,让AI给你领完券后下单最优惠的几十杯奶茶,还能满足不同朋友的不同口味——这又通向一个有着言出法随般科幻感的近景未来。

一个人类负责决定和检核、AI哼哧哼哧干活和交付的主体化时代。

在「太空漫游2001」里,库布里克设计了一个精妙绝伦的转场:

一个猿人首次意识到,荒野残骸里的骨头可以用来当成工具,可以用来敲碎食物、狩猎动物,而在他将这块骨头抛向天空时,镜头突然变成了人类智慧的集大成者,一艘航行在宇宙里的飞船。

人类借助工具一路进化,最终完成了自我超越,这个原本只能用电影语言和隐喻技巧才能完成的晦涩表达,在半个世纪以后的今天,总算听到了现实世界的回响。