前两天知危编辑部总能刷到一些帖子,说阿里巴巴大楼一到晚上就会开启灯光秀——

整栋楼亮起了千问 logo,一会打出 1.15 的日期,一会亮起了巨大问号,配合着夜色,很像开放世界游戏里等待触发的隐藏任务。

很多网友都在怀疑,“是不是阿里又有大事要宣布了?”

当我们点进评论区后,发现这里直接成了互联网懂哥和人脉哥的秀场。

有人分析苹果要宣布接入国产 AI 了,也有人说阿里采购了一堆新显卡,还有人说那天周四估计是一批新人入职。随着吃瓜群众的加入,这些猜测也逐渐离谱,最离谱的一条是:动森更新。

直到今天 1 月 15 日,答案终于揭晓。先说重点:上面兄弟说得都不对。

就在上午阿里开了个发布会,宣布千问 App 一口气上线 400 多项新功能,全部进入测试阶段,未来将面向用户免费开放。

虽然此次千问既没发新模型,也没有卷跑分(毕竟不是在半夜),但却踏踏实实干了两件大事,接入阿里生态 + 上线任务助理。

这次千问打通了淘宝、淘宝闪购、支付宝、飞猪、高德五大业务。也就是说,你可以让 AI 直接帮你点外卖、订机票、订酒店、做旅游攻略。

简而言之,就是用千问 App 让阿里的生态闭环了。

另一个重头戏则是任务助理。

在 App 首页左下角新增了一个入口,专门处理需要多步骤完成的复杂任务:打电话订餐厅、品牌调研、汇报经营情况、处理财务文件、开发网站。。。目前还在定向邀测中。

400 多项功能同时进入测试,放眼全球 AI 应用市场,这个规模和节奏确实少见。用阿里自己的话说,这是全球首个支持 agent 完成真实复杂任务的 AI 应用。

当然,AI 圈的狼来了我们也听了太多遍。

为了验证这是不是又一次的 PPT 创新,知危编辑部搞到了一个测试资格。挑了几个日常高频场景测一下,看看千问能不能办事。

作为媒体,工作中最常见场景就是突然的出差。

以前遇到这种情况,得赶紧打开 App、查航班、比时间。假如我们现在临时要去趟广州,能不能直接把压力给到千问?

我们在千问输入:后天晚上要去广州,订一张杭州到广州的机票。

反应很快噢,千问在推荐了几家航司后直接弹出了机票选择页面,整个过程不需要你在各大购票平台筛选日期。

注意,这不仅仅是一个搜索结果,因为接入了飞猪,所以你点击后可以直接跳转飞猪完成支付。

第一个测试,编辑部整体还比较满意,再看下一个。

每天下午,编辑部就会进入不喝奶茶就无法写稿的时间。可每次选奶茶都是一场内耗:喝哪家?喝什么?

我们试着把需求抛给千问:点一杯珍珠奶茶,去冰。

没想到一张嘴,就看出来千问这小子是喝过奶茶的。

它先是确认了最关键的配送地址,然后再给你推荐附近符合条件的珍珠奶茶,接着追问我是否需要调整甜度或杯型。

关键,它不是只推荐一款奶茶,你还可以像交友软件一样左右滑动,自己挑选心仪的对象。

在确认页面,你依然可以更换口味、规格,最后通过支付宝直接付款。

测到这里,体验已经很顺畅了,但我们觉得还不够。

既然要追求效率,那“打开App-输入文字”这套动作还是太慢。

我们突发奇想:利用 iPhone 的快捷指令,把 Action Button 侧边键设置成“打开千问”,体验如何。

试了一下,效果出乎意料地好。

现在不管我在刷微博还是看自己行程,只要想点外卖、想查机票、想问点什么——

一按住侧边键,千问直接弹出,配合语音输入,说一句话就能搞定。

如果你不想设置侧边键也没关系,在“辅助功能-触控-轻点背部”里设置一下,敲两下手机背面也能实现同样的效果(要是还不会,可以让千问手把手教你)。

这个体验有点像给手机装了个随叫随到的生活助理,只要一找它,它就在手边了。

如果说点外卖、买机票只是属于生活上的锦上添花,那千问接入支付宝政务服务,可能真的能救急。

千问这次接入了支付宝的政务服务,能办 50 多项民生事务——从社保查询到公积金提取,从交通罚款到证件办理。

比如我问千问:我想把社保从杭州迁到上海,需要什么手续跟证件,有没有在线通道?

它给出的回答相当完整:

先讲核心前提,社保状态要满足什么条件;然后是办理通道,在给了操作步骤之后,千问居然直接贴上了支付宝“随申办”的小程序,点击就能跳转,不用自己再去搜了;最后它列出了需要准备的证件材料,以及注意事项。

换做以前,这种问题要么自己去社媒翻半天帖子,要么打电话排队问人工。现在千问能直接给你一份完整攻略,还把入口直接塞到你面前,帮你更快地把事办了。

到这,还是基础能力的测试。

千问发布会这次提到的“任务助理”,号称能处理更复杂的长链条任务。

所以我们决定上点难度。

很多时候旅游都是一时兴起,只想去那几个心心念念的地方,但一想到要规划动辄三天的吃住行,头就大了。

我们打开任务助理,输入了一段旅游需求:

周末想去南京玩,需要一份完整的行程规划。预算 3000 块,其中红山动物园和南京博物院必去

点击发送后,千问的状态栏开始忙碌起来。你能看到它在实时调用工具,一会“正在使用飞猪搜索南京热门景点”,一会显示“正在查看高德地图”,右下角网页也是刷得飞起。

大约几分钟后千问调研完毕,直接甩过来一个 HTML 文件。

好家伙,这是一份排版工整,非常详实的旅游攻略,滑起来大概有半米长。

在攻略的开头部分,你就能清楚地看到这 3 天每一天的行程路线。

而从安排来看,红山动物园和博物院这两个必选项都有了,景点之间的衔接也算顺路,距离也都计算出来了。

虽然别家也能做出类似攻略,但在这里各个目的地你可以查看详情页,直接用高德导航,打车。即便是景点需要买票、酒店需要预定,也都可以用飞猪一键购买。

由于我上个月刚去南京玩过,我注意到攻略里提到的注意事项真的非常准。

红山动物园想要体验好就得早点去,那会动物更活跃,而且一进动物园最好观光车一路坐到底,然后慢慢往下逛,不然走路能累死。夫子庙这些商业街区最好是晚上去,看看氛围就行了。

真要说美中不足,就是千问有点像个购物狂。我们明明给了 3000 元充裕预算,结果它大手一挥,把 2000 多块都划进了“购物”预算里,而留给吃饭的钱一天才 100 块,超支了还说我预算紧张。。。

实测下来,我们做个总结。

说实话,目前的体验并非完美无缺。 “任务助理”还在邀测期,有时候反应不够灵敏,对于某些过于复杂的需求,它还稍微显得稚嫩。

但在那些已经跑通的场景里,订机票、点奶茶,查政务,这种体验提升是断层式的。AI 把原本需要你翻阅十几页攻略、打五个电话、跑三次窗口、在 App 之间不断跳转才能搞定的事,变成了一次两分钟的对话。

这种有实际输出的交付,我认为才是千问这次更新最大的价值。

一直以来,AI 能不能真正办事,取决于它的脑子够不够聪明,手脚够不够长。光有最强大脑,没有手脚,AI 只能陪聊。反过来,光有手脚没有大脑,那也不过是狂堆功能罢了。

在这个逻辑下,我们再看现在的 AI 战局,会发现阿里其实拿了一手好牌。一边是持续迭代的千问大模型撑起最强大脑,一边是国内最完整的生活服务生态来充当手脚。

放眼全球,OpenAI 去年 10 月宣布接入沃尔玛,上个月也接入了 Instacart(百货配送平台);Perplexity 刚和 PayPal 谈妥合作;就在几天前,谷歌也宣布要和沃尔玛搞 AI 购物——但目前还停留在已宣布阶段,功能尚未上线。

这些巨头们的动作其实就暗示 AI 行业已经进入新赛季了,拼的不再只是模型参数,还要看这个模型能不能长手长脚,干点实事。

而这,恰恰是阿里的主场

你看,谷歌要做 AI 购物,得先去敲沃尔玛的门摇人谈合作,再想办法打通支付,还要解决物流履约——相当于先攒一个局,把各路人马请到一张牌桌上。

但阿里不一样。阿里做了 20 年的基建,淘宝、闪购、飞猪、高德、支付宝这些衣食住行的基础设施都是亲儿子。不用摇人,不用搭桥,千问的手直接就能伸进真实世界。这也是为什么,当其他巨头还在谈合作、发 demo 时候,千问已经把“搜索—决策—支付—履约”这条链路跑通,直接开放测试了。

虽然从对话到办事,看起来就是换了一个词,但这一步可能还真就是 AI 通往未来的关键跨越。

千问,已经先迈出去了。