2025 年 12 月,豆包手机助手技术预览版的发布引发热烈关注和讨论。

  然而,人们的关注点一般都在于字节跳动如此激进的做法是否 “ 不讲武德 ”。

  但在与知危交流的几位业内专家看来,豆包手机助手正在启动一场深刻的变革,字节跳动在下一盘更大的棋。

  如果说移动互联网生态是一潭看似平静、实则利益固化的 “ 深水湖 ”,那么豆包手机助手的出现,则是在湖底引爆了一个深水炸弹。

  在豆包手机助手出现前,各大超级 APP 已经形成了稳固的 “ 孤岛生态 ”,彼此互不往来,用户在不同 APP 间跳转极其繁琐。豆包手机助手一举砸破了 APP 之间的围墙,它通过系统级权限强行 “ 识屏 ” 和 “ 代操作 ”,让沉寂已久的应用生态泛起剧烈波动。

  这场波动不可逆也不可阻挡,原因很简单,它反映了用户的真实需求。

  对于用户,这是效率和体验的升级,对于生态中的重要玩家比如手机厂商、应用厂商,特别是中小企业或新入局者,将有机会在新的利益博弈巨浪中崛起,最后,这也是苦于烧钱大战的大模型厂商寻求变现的良机。

  用更加正式的语言表达,移动互联网正经历着一场从 “ APP 为中心 ” 到 “ Agent 为中心 ” 的范式转移,它也是顺应互联网入口遵循 “ 聚合-解绑 ” 或 “ 分久必合,合久必分 ” 的周期规律的自然体现。甚至,我们今年已经见证了这场变革更加悄无声息的镜像版本,也就是 AI 搜索以及增长迅猛的 GEO 市场。

  在与知危沟通的专家们看来,随着智能硬件生态的逐渐成熟,移动互联网和 AI 手机助手也将寻求更加合适的载体。也就是说,这场变革的主角,绝不会仅仅是手机。

  尽管对于变革终点有共识,但对于演进的路径、最终赢家归属,专家们有着不同的见解。

  有人寄希望于 “ 协议文明 ”,认为终局将是大模型厂商、手机厂商、应用厂商、开发者乃至用户的生态共生,有人则认为 “ 丛林法则 ” 不可避免,胜出者或利益最大化者将是大模型厂商,用户消费心理和内卷环境将极力推进这一结果。

  在接下来的内容中,我们将首先解读豆包手机助手引发现象的关键点,比如 APP 厂商封锁豆包手机助手的实质考虑和未来变化;然后,我们将讨论这场新趋势的具体表现,它对旧有生态构成比如 APP 广告的具体影响,并解答为何趋势不可逆;最后,我们会重点探讨这场新趋势下的最后赢家归属和原因,以及在演变到终局的过程中,各方将如何博弈,这种博弈模式或商业竞争环境的特点,以及与海外相比的差异。

  正文较长,有 1.7 万字,我们将其分成了 7 个段落,您可按需阅读。

  对于目前多个 APP 对豆包手机助手进行的限制,白鲸开源 CEO 郭炜向知危表示,确实更多是出于安全方面的考虑,特别是银行类、支付类 APP,“ 豆包手机助手仍然在试错,目前它对安全维度的考量确实还不够周全,尤其令人担心的是它可能模拟人脸识别,或者在底层截取相关数据,所以出现一些限制是非常正常的。”

  “ 微信集成了微信支付,这就让情况变得更加复杂和微妙。但淘宝、闲鱼对豆包手机助手的限制,我认为就不属于金融安全层面的考虑。”

  前 OPPO 商业数据挖掘组组长及 “ 数据虫巢 ” 主理人黄崇远表示,“ 就目前行业现状,对于很多 APP 比如电商,其商品的相关信息,本身就存在企业之间的爬取与反爬的相互攻防。对于豆包手机助手,可以尝试与 APP 厂商建立 ‘ 数据付费使用 ’ 的条款或协议,但原则一定是经过了用户的授权,而且目前是没有成熟的案例可供参考的。”

  另一方面,豆包手机助手引发的安全问题似乎也不是很难解决。

  比如,人们对豆包手机助手的一个担忧是其被用于黑灰产中的群控系统。对于目前风控技术是否能区分 AI 手机助手和群控系统,狮桥集团高级风控总监蒋宏解释道,“ AI 手机助手获得了手机更加底层的权限,并且使用了大模型灵活的交互能力,操作模式接近人类,群控大多数是基于规则的批量操作,机械重复度更高。通过权限合法性、行为模式( 人类化 vs 机械性 )、设备环境( 真实设备 vs 模拟器 )、多设备关联分析等手段,一定程度上是可以实现区分的。”

  “ 当然,现阶段的风控系统有一些反欺诈的规则和模型来识别批量欺诈行为,可以防范一部分群控欺诈行为,但是 AI 手机助手的加入,确实让识别的难度增加了,一些原来可以识别的模式不再可用,所以需要风控系统持续升级才能应对。”

  “ 对于互联网金融业务而言,反欺诈更加注重身份信息的核实,而不是操作模式上的风险。”

  “ 乐观地讲,AI 手机助手的威胁还是相对可控。”

  但 phone-use 开源技术框架的出现可能加剧相关风险,“ 开源特性降低黑产技术门槛,容易被用于非法目的的自动化操作。黑产利用模式可能包括:批量注册养号、自动化薅羊毛/刷量、模拟操作实施诈骗。应对方式上,可以增加操作行为模式特征和模型、升级设备指纹、精细化行为建模等。”

  “ 总体来看,AI 或大模型时代确实衍生了不少新黑产类型,比如 AI 内容伪造( 换脸/虚假内容 )、智能自动化攻击、AIGC 批量养号等。为此,风控需要进行升级,比如利用大语言模型能力升级现有的风控模型,增加多模态识别、动态特征挖掘等风控模型能力。”

  “ 目前还有很多未解决的问题,比如黑产技术迭代快导致防御被动、数据隐私与风控需求冲突、欺诈样本相对少不足以训练好的反欺诈模型、安全与用户体验难平衡等。”

  社区开源动态以及投资机构、行业专家向知危描述的信息都表明,AI 手机助手的真实技术门槛其实并不高。

  而据了解,“ 跨应用调度 ” 在国内手机行业确实有先例,但后来监管部门叫停,如今行业内已不再轻易公开讨论这个话题。

  《 UI 智能化与前端智能化:工程技术、实现方法与编程思想 》作者甄焱鲲表示,“ 不是友商不会做,而是不敢做、不愿做、不能做。豆包的尝试更像是 ‘ 压力测试 ’,为行业探明政策底线和商业雷区,相比功能,其价值更在于推动规则重构。这条路风险极高,但是,在国内鼓励AI发展的宏观背景下,或许会是一个精准的破局点。”

  豆包手机助手引发的冲突确实超乎想象,目前各方发声都比较谨慎,与此同时各种假消息和辟谣声明满天飞。比如,近期关于 “ OPPO 拒绝与字节合作豆包手机 ” 的市场传闻,OPPO 就亲自回应该消息不实。

  实际上,大模型技术引发的 “ 跨平台调用 ” 类型的商业冲突并非首次,AI 搜索就是非常典型的场景。Perplexity 就曾被多家媒体平台起诉爬取行为未经授权。在国内,与 AI 搜索相关的诉讼案例尚未出现,这里就大致体现出了冲突量级的差异。

  甄焱鲲解释道,“ 区别在于操作深度和商业模式冲击程度。AI 搜索主要是在信息层面对内容进行摘要和引用,虽然也涉及数据爬取,但不会直接替代用户的操作行为和商业决策。而 AI 手机助手能够直接执行购买、支付等商业行为,这直接影响了平台的交易闭环和数据控制权。”

  “ 更重要的是,AI 助手取代了人的浏览行为,使得推荐算法带来的注意力机制被颠覆,这不仅影响广告收入,还影响流量分发和会员收入。”

  “ 通常达成合作的方式是建立数据授权协议,但目前缺乏成熟的行业标准。先例方面,搜索引擎与内容平台之间建立了 robots 协议和商业合作协议,但 AI 助手的主动操作模式与搜索引擎的被动爬取有本质区别。搜索引擎的爬取是被动的、可控制的,而 AI 助手的操作是主动的、不可预测的,对平台商业模式的冲击更为直接和剧烈。”

  黄崇远补充道,“ 本质区别是,AI 搜索是 ‘ 信息层赋能 ’,而 AI 手机助手是 ‘ 操作层替代 ’,后者对 APP 生态的破坏性更强,因此引发的抵制更激烈。”

  AI 手机助手的产业颠覆性巨大,并且可预见阻力将会很大,甚至也会触及字节跳动自己的基本盘,比如抖音 APP。那么,为什么字节跳动要推出如此激进的豆包手机助手?

  郭炜表示,“ 从方向上来看,这绝对是字节未来的一个突破口。”

  “ 未来的智能终端一定不再是手机。‘ 豆包手机助手 ’ 其实只是字节在手机上的一个试水而已。不应该过度关注豆包本身,而应该关注 AI 以及未来的交互形式。将来可能不再有 APP 的概念,而是一种基于 Agent 或者某种新型组件的交互生态。”

  “ 他们真正要做的是下一代智能硬件,所以绝对会投入巨大精力深挖。”

  黄崇远也持类似观点,并补充道,“ 从字节内部的 Ocean 团队的动作( 收购 PICO VR、Oladance 耳机等 )来看,他们的目标很清晰,就是 ‘ 大模型+超级APP+硬件终端 ’。”

  “ 虽然目前有不少应用方在对抗,但这是一个大势所趋的方向。因为从人的角度来说,解放双手,提升效率,让终端变成一个大的 ‘ 对话入口 ’,让 APP 变成一个底层工具,这对于人的服务体验来说,是巨大的效率提升,只不过还需要衡量数据隐私的问题。”

  郭炜进一步基于豆包手机助手的原理来佐证,“ 之前人们提到的所谓 ‘ 豆包建立了独立于应用沙盒的通信管道 ’ 的理解,应该是不准确的。”

  “ 实际的技术实现逻辑是:它直接在安卓底层模拟了一个手机屏幕。这个屏幕对于用户是不可见的,用户只有通过点击中间的状态栏才能把它调出来。所以它完全不需要一个物理屏幕。它在后台模拟这个屏幕后,大约每隔 3 秒会截一次屏,并将截图发送到云端进行 AI 解析。云端解析完成后,会返回下一步的操作指令,可能是点击、拖拽或挪动。它再把这些操作反向作用于那个模拟屏幕。”

  “ 可以理解为,豆包在操作一个 ‘ ToDesk ’( 远程桌面控制 ),只不过这个 ‘ ToDesk ’ 的屏幕用户看不见。基于这种逻辑,这个虚拟桌面理论上是可以操作任何内容的,这也就解释了它为什么拥有如此高的权限。”

  “ 按照这个原理,智能终端最后发展的形态并不必要是手机。它现在有屏幕,会让第一批用户觉得安全一点或提供习惯转换的缓冲时间。但等用户熟悉以后,比如假设将来 PICO VR 和豆包手机进行结合,那用户戴着 PICO VR,其实操作的也是用户的手机,这时是不需要屏幕的。”

  “ 如果再放宽一些,它甚至不一定是在用户本地设备上,也可以是云端的一个虚拟服务,道理是一样的。”

  这其实相当于互联网流量从各个孤立的 APP 重新汇集到统一的 AI 交互界面,几乎等于是行业重新洗牌。

  而且,用户接收到的信息并不是原始的,而是经过了大量的二次处理。这是否意味着这个流量池的总量其实是变小了的,商家竞争将会变得更加激烈?

  郭炜表示,这个问题其实要辨证地看,“ 首先,这个变化未必完全等同于 ‘ 洗牌 ’。人们现在刷抖音,也不可能刷 24 小时,但眼镜可以戴 16 到 20 个小时,耳机也可以连续戴 8 个小时。所以,它对人的占用和交互时间会更长。只是目前这种形态的具体形式和价值还没有完全被找到。”

  “ 所以,很容易理解现在市面上为什么会卷智能眼镜。当然,目前的 AI 眼镜产品都还是过渡产品,强调录像、拍照功能而不强调交互都是本末倒置,还费电,用绿光来显示内容也对眼睛健康不利。交互和屏幕设计一定要做好,它既不能影响我正常看东西,又要让我方便地看到我需要的信息,这并不容易。更不用提重量这个显而易见又常被忽视的问题。”

  总体来看,郭炜对未来保持乐观,“ 我已经在豆包身上看到了一些苗头。接下来是谁来接这个棒继续往下走,还很难说,但很可能会像 iPhone 当年一样,引领一次大的变革。”

  “ 如果 AI 助手形态最终定型,它确实会成为一个新的流量入口。但最终还是要看谁能真正解决问题,大家才会明白该怎么做。”

  AI 智能终端需要解决什么问题?这个发展趋势可能再一次戛然而止吗?

  对于后者,郭炜给出了否定的回答,“ 一旦这种新的硬件场景出来之后,发展就是不可逆的。为什么豆包手机这么火?其实就是因为这就是用户最终的需求,是不能违背的。”

  “ 因为说实话,移动互联网发展到目前这个阶段,频繁地点手机屏幕这个动作本身就已经很反人类了,特别是像比价这种场景。人永远是懒的,能更简单地办成一件事,就不会愿意去点一堆 APP 再把事情搞完。 所以用户一定会去找更简单的方式来解决问题。对用户来说,最简单的方式不是点屏幕,而是自然语言,是视觉,是听觉。这正是从最终用户角度要解决的问题。”

  “ 下一代流量入口的争夺,一定会让人们用更简单的方式来使用 APP。GUI 这种方式,在这个过程中会慢慢落后于时代。”

  甄焱鲲表示,最终对刚需的判断还是在于用户个人使用手机无法完成的事情,因人而异,“ 对于操作手机不熟练、接触时间不长的中老年人,AI 手机助手的刚需可能更侧重:找到、安装并使用 APP 解决具体的问题,例如:医疗保险异地备案。不仅是操作,还包括资料的管理、信息的生成、表单的填写等。”

  黄崇远表示,“ 移动端生态一定会将孤岛打破的。对于用户来说,在乎的是整个使用流程是不是更加顺畅、便捷、高效,体验更加良好。生态孤岛不是用户的诉求,用户并不在乎。但短期来看,AI 的完全托管也不是一个刚需,因为人的习惯迁移是需要时间和教育过程的,部分人甚至是在有意识的在对抗 AI,避免形成依赖。”

  郭炜则认为,这个教育可能已经在手机以外的场景完成了,“ 现在新能源车几乎全都配备了语音控制,比如通过语音把车窗打开,已经成了标配。开车、行走的时候使用手机,往往操作困难或有风险,如果用豆包如果配一个眼镜或耳机,就很容易实现了。”

  从博弈的角度来看,在这个赛道里大家也已经没有太多犹豫的时间,“ 尤其是在中国这么卷的环境里,只要 AI 助手厂商先拿到大量最终用户,就有极大的谈判优势,到时没有一个 APP 厂商不会屈服。如果不屈服,就会有新的 APP 出现,去对接 AI 助手获取的用户,旧 APP 原来的领头作用可能就消失了。”

  黄崇远补充道,“ 先发优势一方面是占据了定义权,另一方面是更加前置的技术积累。当行业顺利发展,先发的优势就会很明显。行业认知、市场口碑、技术积累,以及生态伙伴的壮大,都会带来额外的议价权。”

  一家大数据基础设施企业级 SaaS 公司创始人王通( 化名 )向知危表示,“ 以中国的制造能力以及在智能领域的突破能力,再加上政策环境相对宽松,相对于全球来说,在 APP 和最新技术领域,对个人隐私的限制没那么严,而且从个人角度来看,大家对隐私的在意程度也没有那么高。我相信如果下一代 iPhone 不好好努力,下一个划时代手机可能会在中国出现。”

  而且,这个赛道的玩家可能不仅是对未来焦虑,对现状也存在焦虑。甄焱鲲表示,“ 传统 APP 应用生态,因为流量天花板和增长阻滞,迫切需要新的商业动力,进一步推升了 AI 应用成为破局点的可能性。” 以字节跳动为例,他们目前一个主要挑战是核心业务遭遇天花板。首先,抖音国内日活( DAU )增速从 2020 年惊人的 50%( 基于 TechCrunch 和 CNBC 的报道 ),到今年已经降至 6%( 据雪球分析 )。竞争对手的威胁也很大,微信视频号月活在 2022 年就达到了 8 亿,超过了抖音。

  “ 对于互联网公司,可以认为公司价值 = 用户时长 × 变现效率 × 市场预期( 资本市场对未来增长潜力的溢价,例如高成长公司可能获得更高的估值倍数 )。当用户时长见顶,必须重构变现效率和市场预期,豆包 AI 手机助手是能同时提升两者的杠杆。”

  既然趋势不可逆,那么在新趋势下,各类 APP 该如何存活或借机重获竞争优势?传统互联网生态的常见变现玩法将经历什么变化?

  一旦趋势开始启动演化,所有 APP 厂商都要开始行动起来,郭炜表示,“ 比如淘宝不配合,但可能京东配合,那将来这个入口的流量就会被京东拿走。即便大厂都不配合,也可能一些新的或中小垂直电商会配合,比如得物、当当等。如果要预估演进的速度有多快、多彻底,可以参考如今 AI 搜索替代传统搜索的速度和程度。”

  “ 中小 APP 厂商如果选择拥抱这个路线,可以为豆包做一些 GEO 优化或特殊场景的适配,让自己更可能被选择和使用,从而在新的流量入口中占据优势或先机。比如,APP 厂商可能针对豆包做非常方便的 API 和搜索、Agent 交互设计。也可能是直接通过语音、文字或者一段总结来回答用户的问题,而不是通过图片。这样操作起来比直接去传统电商用屏幕搜索,反应更快、速度更高、质量更好。 自然而然,它会被豆包排在前面。”

  豆包手机助手在使用过程中会自主关闭广告,这其实也暗示了一个趋势,也就是说,原来 APP 上各种广告贴片、弹窗,在新趋势下为了优化 AI 助手的使用,APP厂商也可能会选择减少、优化甚至清除广告,“这是必然的,因为交互方式发生了彻底的变化。”

  黄崇远表示,“ 传统的广告投放做法对于消费者来说,确实很多时候是一种 ‘ 绕 ’ 不过去的打扰。从 AI 手机覆盖的范围和趋势来说,预计能影响到 30% 以上。”

  郭炜补充道,“ 损失的广告收益可能会通过 GEO 或其他形式来变现,即便投广告也不会再用旧方法。”

  黄崇远持相同观点,“ AI 自动化变成了流量的最上层,取代了人的顶层流量逻辑,所以 ‘ 广告 ’ 需要上移投放到 AI 这一层,不一定是目前这种形态,可能更加‘原生’,即让用户更加容易接受,并且一定是可以给用户带来更加有用的信息。”

  “ 其次,以比价为例,哪怕价格一致的情况下,AI 手机助手如何排序以及商品选择建议等,本身也具有商业化的潜在空间。对于用户来说,如果 ‘ 广告 ’ 能藏得更深,并且对于其体验和诉求满足没有坏处,其实无所谓了。”

  AI 比价功能也是广告之外的一个受到热烈讨论的争议点,黄崇远补充道,“ 比价其实对于用户来说是利好的,只不过背后关联了很多利益冲突,例如比价可能会倒逼不同企业进行恶性降价、压缩利润空间,以及引起数据泄露风险等。但是从长远的角度来看,利好用户的趋势是不变的,这也意味着大势不可逆。但是需要找到好的解决方案,例如数据合理授权、数据使用付费、国家制定法规、约束合理使用逻辑等等。”

  甄焱鲲表示,“ 在新趋势下,用户注意力经济的损失是实打实的,价值回归服务本身而非用户注意力将成为趋势。”

  “ 假设服务本身的价值无法被用户认可,AI 助手调用的 APP 会被用户卸载,或者基于用户的选择造成同质化 APP 调用几率降低,附加的新广告形式、新流量分配机制、新收费模式和数据价值回报等,都将无法成立。”

  “ 长远来看,和 A2A 协议类似,面向用户的数据供给,会逐步升级为同时面向 AI 进行数据供给。”

  “ 在 AI 能力尚未完全准备好的今天,快速抢占入口,积累数据、经验,培养团队、人才,对于大公司来说势在必行。但是,对于中小企业,在技术没有完全成熟时,最好的选择要么是观望、要么是短平快的方式挣钱。所以,国内 AI 公司应该根据自己的生态位、现金储备、发展情况做出理性且正确的判断,不能盲目跟风。”

  “ 但也不要小看这场流量入口战的残酷性,表面是技术之争,实质是商业规则重构。GEO 市场的演进揭示了残酷真相,当服务变成自动执行的动作,90% 的中间环节将被消灭。未来的赢家不是流量最大者,而是能在 AI 决策链中占据关键节点者。”

  “ 对普通企业而言,最危险的不是技术落后,而是用旧地图寻找新大陆。当对手不再争夺用户点击,而是争夺 ‘ 帮用户自动完成任务 ’ 的权利时,游戏规则已经彻底改变。生存的关键,在于看清这个本质:在 AI 时代,最好的流量入口,是让用户感觉不到入口的存在。”

  除了 APP 厂商,另一个可能在新趋势下受益的群体是开发者,据了解,字节跳动目前也在吸引第三方开发者将服务和应用集成到豆包手机助手,甄焱鲲表示,“ 开发者通常是弱势的,在豆包手机助手给开发者提供开放 API 时,应该是一个很好的入场时机。”

  “ 但是,影响开发者最大的问题有两个。第一个问题是开发的应用如果依赖豆包提供的能力,一旦豆包被封杀或关闭 API,开发者的付出将付诸东流。由于AI辅助编程大幅度降低了开发者成本,这个问题应该不难解决。第二个问题是豆包如何快速建立利益分配机制,让开发者挣钱,这才是影响开发者参与的最大门槛。一旦参与的开发者多了,豆包手机助手能做的事情也就多了,单靠豆包去建设应用生态是高成本且缓慢的。”

  郭炜总结道,“ 现在互联网、移动互联网已经没有太多创新空间,流量几乎都被大平台收完了。对中小APP厂商而言,新的平台就是一次改天换地的机会。如果我是中小电商平台,一定会 All in,All in 之后,有可能成为下一个电商时代的拼多多,只不过是在 AI 时代的拼多多。”

  AI 助手对互联网生态的颠覆性,涉及到的巨大利益,以及对原有优势占位者的威胁,注定了豆包手机助手本身将面临最为残酷的竞争。

  王通表示,“ 监管主要会关注安全问题,不会直接叫停创新。中国对创新敏感度很高,尤其在 ToC 领域。所以通常的做法是先跑起来,出现问题再逐步完善规范。这也是中国能涌现出很多优秀移动互联网创业公司的原因。”

  所以,肯定会有新的竞争对手出现。那么,谁最有资格上桌,参与 AI 手机助手或 AI 终端助手的竞争呢?知危发现,这个问题的分歧性是最大的。

  黄崇远认为整体格局不会有太大变化,终局也将是百家争鸣式的,并会缓慢地实现,“ 首先,肯定是安卓生态下,苹果生态注定无法做到很 Open 的事。其次,一定是具备一定的 AI 认知,有一定软硬件技术能力的厂商,并且还需要有一定的用户体量,算下来的话,也就是当前的头部手机厂商比如华为小米 OV 荣耀这几家具备这种条件了。”

  “ 从演进过程来看,AI 助手一定是先从单一 APP、从一些系统浅层任务比如闹钟、日历 、天气等手机厂商自身可控的系统 APP 入手,再慢慢地到一些外部 APP,再逐步覆盖整个终端。但头部厂商还是会忌惮监管风险,国内手机厂商( 如华为、小米 )自身拥有 APP 生态,激进的跨应用操作会 ‘ 左右手互搏 ’。”

  “ 接下来的发展可以分为三个时期。短期内 APP 厂商继续强化风控,做 AI 自动化的对抗,甚至更激进点,屏蔽硬件对于 APP 的使用授权。中期 APP 厂商预计会走合作的道路,因为各家厂商其实都想做,只不过有些技术还没有到位,有些被先发抢了。所以中期一定是一个手机厂商与头部 AI 企业各类合作百花齐放的状态。长期来看,一定需要法律法规去做乱象约束,其次就是要在这个逻辑中找到新的商业模式,毕竟做任何事,最终还是需要有投入产出的 ROI。”

  甄焱鲲持类似观点,“长期来看,真正赢家将是那些把监管约束转化为产品优势的公司,如同苹果将隐私保护变成卖点。”

  但甄焱鲲也认为,需要海外厂商先做出表率,“ 在移动端生态中,最适合做 AI 手机助手的是操作系统和硬件厂商。因为,这类厂商不仅掌握着海量的用户( 应用分发渠道 ),同时也能够从硬件和操作系统底层提供最丰富的上下文和操作接口。用最丰富的上下文能让 AI 理解用户和场景,用最丰富的操作接口能让 AI 能够真正解决用户的实际问题,这样才能带来用户价值。”

  “ 但是,当下操作系统和硬件厂商仍然被传统应用的惯性所裹挟,无法让应用生态立即参与到这场变革中去。可能的演进过程,大概率是苹果、谷歌等巨头做出成功案例,其它厂商再行跟进,AI 应用逐渐繁荣,倒逼传统应用不得不妥协、变革、开放。这一定是一个漫长的过程,就像当年的数字内容干掉很多传统内容一样,有的厂商固步自封被历史淘汰,有的厂商成功转型依旧繁荣,这个过程中势必有很多间隙,让有理想、有能力的企业家借势崛起。”

  对比鲜明的事,郭炜的观点最为激进,并认为发展速度将是极快的,“ 手机厂商其实不敢轻易尝试,因为既得利益关系复杂,所以豆包自己做手机。在这个赛道上,有资格进入的玩家不一定是手机厂商,而是大模型厂商,因为竞争的核心是大模型。”

  “ 大模型厂商在硬件上可能还需要承担一些成本,但对他们来说,基于 AI 做手机比反过来要简单。换句话说,他们天然有成本优势,因为可以调用自己的大模型。”

  “ 豆包之所以不敢大量发货,我相信是经过成本核算后的结果。并不是说它做不出手机,而是手机做出来之后,如果想让豆包手机流畅使用,背后豆包的大模型 API 和解析调用量非常巨大,成本很高。”

  “ 比如对于单个用户,假设每 3 秒截图进行处理,豆包手机每天使用 8 小时,一个月就要花费百元以上,当然估计会有一些优化措施。但哪怕一个月只有 10 元成本,并通过烧钱大战去抢大量用户( 这也是大厂大概率会用的策略 ),这个成本也会很惊人。”

  “ 所以,竞争门槛其实不在于技术本身,而在于大模型使用的门槛,此外还包括 GPU 供给等。”

  “ 如果手机厂商不擅长自建大模型,势必需要用外部大模型和各种 API,这就要付出极高费用。所以对手机厂商来说,刚开始不一定能赚这笔钱,可能就像当年的 Nokia 一样,不一定认为安卓是自己的方向。只有像 iPhone 或豆包这些原本没有负担的厂商,上来就 All in 一个新的形式,才会创造出新的产品。否则大家还会用原来的 Nokia,最多做个 Windows Phone。所以手机厂商受制于现有经济结构,绑在原来的业务上,很难跳出来做新的尝试。”

  此外,phone-use 框架也不是没有门槛的,王通解释道,“ 比如豆包手机助手发布不久后开源的 phone-use 框架,跟豆包差远了。豆包在底层操作系统上做了很多改进和优化,模型和 API 也做了专门的适配和优化。这个开源框架没有底层权限,它只能在手机屏幕上截图做操作。 本质上,它的技术门槛也不高,甚至比豆包更低,从演示来看用户体验也一般。”

  大模型厂商不仅能够跨越竞争门槛,另一方面,它们也会有很强的入场意愿,郭炜表示,“ 现在中国的大模型增长已经遇到了瓶颈。特别是创业公司比如月之暗面等,它们其实缺一个抓手。如果光做问答助手,怎么赚钱,卖给谁?通过 B2B 卖给企业,市场不够大;卖给海外,海外有 ChatGPT,竞争不过。所以对它们来说,要么像 MiniMax 做垂直应用、做视频等,要么就得另谋出路。其实AI助手这件事本就应该是它们做的,而不应该仅仅靠豆包去做。”

  “ 创业公司一般很难支撑烧钱大战,但也可以采用订阅模式,即便如此,他们相对于需要调用 API 的厂商也会有低价优势。”

  “ 还有一种更灵活的方式,所谓 ‘ 羊毛出在狗身上 ’,也就是不需要用户付费,而让 APP 厂商付费。对于新的流量入口,拥有大量用户和数据的传统 APP 有资格向大模型厂商收钱。但一旦大模型厂商积累了足够的用户,对于希望适应新入口的新型 APP,为了从大模型厂商获取用户,除了 GEO,也可能直接向大模型厂商付费,从而大模型厂商就有底气免费向用户提供 AI 助手服务,就和现在应用市场向 APP 厂商收钱一样。”

  “ 对于大模型厂商来说,付出这部分成本比只给用户提供问答服务更有意义,因为它直接关系到钱,离最终决策和购买更近,毕竟手机使用大模型很容易触发交易。光做问答服务再怎么优化,离钱也远。”

  “ 如果我是大模型厂商,我会觉得既然豆包已经打样了,应该赶紧在这个方向上尝试。在中国做手机,其实可以联名操作,就像豆包那样,中兴、一加等手机厂商也都乐于做这种尝试。当然,相比之下,字节原来也有锤子手机、PICO VR 等硬件基础,它的站位相对更好一些。”

  前面提到,阿里系应用屏蔽豆包不只是出于安全的考虑,背后也可能是竞争性因素,加上阿里原本也是国内头部大模型厂商,就不难理解了,“ 阿里限制豆包手机使用,背后的考虑可能就是,限制流量入口,自己来做。淘宝要拥抱这个趋势,要么也推出 AI 助手,要么自己出款手机,而且也只能在这个层面上跟豆包竞争,而不会在 APP 层面上竞争。阿里不会这么傻,以它的能力,它会做的。将来字节系和阿里系之争,就是手机入口甚至智能入口之争,当然说白了还是流量入口之争。”

  “ 淘宝本来就被字节的电商业务压制得差不多了。如果淘宝在新一代智能硬件上跟不上,字节绝对会全力以赴。对字节而言,这是弯道超车的机会。豆包手机也不会停留在目前的样子,而是会不断迭代。我估计到明年六个月或至多十二月以内,豆包手机的完整形态就会出来。”

  对于阿里是否会入局,甄焱鲲表示,“ 现下,阿里的 Qwen APP 的用户量及增长势头不错,但是,在阿里云的产品中,这只是一个实验性质的项目。而让一个实验性质的项目去竞争一个战略型产品,显然并不现实。但是,阿里在生态位上需要入口和流量。从长远看,AI 助手赛道阿里势必要参与竞逐。”

  郭炜继续说道,“ 此外,基于鸿蒙生态,华为也还是有实力在这个赛道上争夺利益。其它手机厂商受限于模型,而大模型厂商能给类似华为这样的全生态厂商提供足够玩法。如果华为的玩法行得通,后续其它手机厂商也会有潜力。关键还是看,谁能把新型手机真正落地。” 目前,华为已经在 HarmonyOS 6( Mate X7 手机 )通过 A2A 协议对接超过 80 款鸿蒙应用。

  “ 对于整个赛道,预计再过三年,这件事就成型了。”

  大模型厂商的竞争结局通常是赢家通吃,黄崇远则认为,新流量入口时代下一定不是一家能够吃下的,“所谓生态就一定是各方共赢,特别是消费者端不能忽视了。”

  黄崇远指出,A2A 协议作为合适的技术手段,可以促进这种格局的形成,“ 在 A2A 协议下,各自的 Agent 有边界但有交互,从而实现百花齐放。AI 搜索的 GEO 是一个典型代表,是一个目前很多 AI 厂商正在切入的一个逻辑,控制了便捷范围,又是 AI 所擅长的语义理解,以及打传统流量边界的逻辑。”

  “ A2A 协议是当前最可行的解决方案,能同时解决安全风险与利益冲突,但需监管推动与行业协同。华为的行动具备示范效应,进一步需要统一行业标准( 如授权接口、分成比例 ),避免 ‘ 各搞一套 ’。”

  “ 大模型厂商需放弃 ‘ 激进爬取 ’ 策略,接受生态共治,可能也是生态平衡的一种解决方案。”

  关于 “ 各搞一套 ” 这一点,郭炜补充道,“ 现在的 A2A 协议没有国际认可的标准( 但 MCP 就有 ),大家都自己定义,都觉得自己的有道理。其实也就是两边通过 API 传输一些内容,带一点上下文,还不够完整。从开发者角度来看,整个环境很混沌,不知道用哪个,每个都有问题。”

  甄焱鲲认为,A2A 协议是必要但不充分的解决方案,“ 就像给高速公路装了 ETC 闸机,但没解决 ‘ 过路费该收多少 ’ 的问题。要真正破局,必须同步推进三个方面,除了完善 A2A 协议( 华为已领先 )以及出台强制分成比例,还需要建立数据定价市场,但数据定价市场目前在国内还基本是空白。”

  但对于长远的未来,甄焱鲲还是有更乐观的设想,“ 预计在短期内( 1-2 年 ), A2A 方案在华为系设备上可行,但生态规模有限。预计鸿蒙设备覆盖率 30% 时( 约 3 亿台 ),可形成健康循环。其他手机厂商因缺乏操作系统控制权,难以复制该模式。到中期( 3-5 年 ),若能建立跨厂商 A2A 联盟( 比如华为+小米+OPPO 等 ),并配套出台《 AI 服务定价指引 》,可解决 70% 的安全与利益冲突。关键看法律法规层面能否明确 A2A 的法律地位。当然长期风险也存在,最大的隐患不是技术,而是商业抵制导致生态分裂。未来可能出现两个平行世界:华为系的 A2A 规范生态,安全但功能保守,其他安卓系继续封杀激进 AI,或转向更封闭的 ‘ 小程序+AI ’ 模式。”

  “ 我个人比较倾向于:国内拥有自主的移动端手机操作系统,并在这个系统基础上形成行业共识的标准、规范。在这个 AI 应用爆发的年代,传统应用即将被 AI 应用替代,正是一个百废待兴的时代,如果有企业能够填补国产手机操作系统空白,并借助 AI 应用快速催熟应用生态,将极大促进中国移动端市场向新时代迈进发展。”

  “ 华为鸿蒙操作系统确实是目前国内最接近 ‘ 自主可控移动端操作系统 ’ 的。鸿蒙的分布式能力、跨设备协同和端侧智能框架,也确实更贴合 AI 应用形态重构的需求。然而,操作系统能否成为时代平台,决定性因素并不在于 ‘ 是否自研 ’,而在于 ‘ 是否形成生态共识 ’。”

  “ 尽管鸿蒙在国内市场份额已经超过 iOS 位于第二( 第一是 Android ),但其原生应用数量、国际主流应用覆盖、全球开发者参与度和多厂商采纳程度,与 Android 和 iOS 仍存在明显差距,尤其是在全球市场和跨国应用生态层面,尚未形成事实上的行业标准。换言之,鸿蒙已经解决了‘有没有’的问题,正在攻克‘好不好用、愿不愿意为其开发、是否值得长期投入’的问题。”

  “ 在 AI 应用即将重构传统 APP 的关键窗口期,鸿蒙确实拥有一次难得的‘换道竞争’机会。如果能以 AI 原生能力降低开发门槛、催生新的应用范式,并在国内率先形成稳定、可复制的生态正反馈,它有潜力成为中国移动端进入新时代的重要底座。但从当前阶段看,它仍是一项战略上正确、技术上成立、生态上尚在爬坡期的系统,而非已经完成历史使命的‘行业共识标准’。”

  可以看到,要达成稳定的终局,技术条件的满足只是表面,利益冲突问题的解决才是根本。

  黄崇远表示,“ 这些利益冲突涉及 APP 厂商、手机厂商、AI 助手三方的利益如何平衡分配的问题,甚至还有开发者、消费者用户的参与,涉及数据授权、联盟分成、广告分成等。”

  “ 一个好的解决方案是,用户先做数据授权( 用户自己决策 ),APP 向 AI 助手进行数据授权以及开放操作权限收费,AI 助手给终端提供分成,AI 助手通过增值能力向用户收费( 提升效率 ),从而形成商业闭环。”

  “ 海外暂时没有案例可参考,在这个领域的应用走的比我们慢,但是他们的法律法规的一些逻辑是值得借鉴的。”

  甄焱鲲认为,利益冲突的解决需要等待一个关键时刻,“ 传统应用的用户注意力收益被削弱,AI 应用的收益模式不明确,只有在 AI 应用的收益模式的规模或效率显著大于传统应用,才能形成新的利益分配方式。”

  “ 比如对于当前,最务实的路径其实是:在鸿蒙生态跑通 A2A 商业模型,用实际数据证明 ‘ 开放比封闭更赚钱 ’。例如微信发现开放 A2A 接口能让视频号带货转化率提升 20% 时,抵制自然瓦解,这需要耐心。”

  这些做法非常 “ 协议文明 ”,但通常不是国内厂商的第一选择,“ 简单来说,国内移动端生态完全有能力解决 AI 助手带来的这些矛盾,但大家都不太愿意坐下来好好谈。现在的巨头们更喜欢直接用技术手段把对手 ‘ 封杀 ’,而不是一起商量一个大家都接受的规则。”

  “ 要打破这个僵局,除了让老玩家也能赚钱,还需要政府出手定规矩。并且,要推动用户积极做数据授权,厂商也可以给用户 ‘ 发糖 ’,而不是只等用户自愿参与。也就是说,普通用户的数据被 AI 用了,也应该有收益。比如可以设计个 ‘ 数据红包 ’ 功能,用户能选择把这笔钱提现,或者捐给自己喜欢的创作者。让老百姓真正感受到:我的数据我做主,还能换真金白银。”

  “ 国外的经验告诉我们:世界上没有完美的分钱方案,只有不断调整的平衡术。比如 AI 赚 1 块钱可以这样分:数据提供方( APP )拿 4 毛,AI 公司拿 3 毛,用户拿 2 毛,剩下 1 毛放进公益基金。这个比例不是死的,要像菜市场讨价还价一样,根据实际情况动态调整。”

  “ 最可怕的不是分钱不均,而是分钱过程藏着掖着。就像小区物业费去向不明,大家肯定不放心。可以学学欧洲的做法:所有 AI 的决策记录都要像记账本一样公开透明,允许第三方随时查账。”

  在海外,目前最受关注和期待的 AI 助手产品应该是 Apple Intelligence。目前,Apple Intelligence 在海外已经小规模落地了,主要是比较受限的简单功能,比如特定界面中调用写作、实时翻译、消息回复建议、网页摘要等,Siri 本身没有大模型能力,只能机械地调用 ChatGPT,还很不稳定,更不具备让AI操作手机、电脑的能力,可以说比谷歌搜索还保守。

  在甄焱鲲看来,这是适合苹果的节奏,“ 苹果近几年大概率不会推出豆包式的激进 AI 助手。但在推出时,将不是功能的胜利,而是生态治理范式的胜利。可以参考苹果应用商店的成功,在 AI 时代,苹果可能会去构建一个让所有参与者( 用户、开发者、平台、监管者 )都能接受的规则体系,在这个规则体系下,借助其市场占有率和品牌号召力,为生态注入更多利润作为繁荣的催化剂。”

  消费者权益的考虑终归难免相对滞后,利益格局下,AI 模型是否还能保持客观?如果不够客观,如何保证服务质量和风险控制?消费者群体难免会有这层担心,毕竟我们已经见证过商家为快速提高自身品牌曝光,通过黑帽 GEO 污染 AI 搜索,是多么容易的事情,“ 有利益驱使时,很难确保过程中的人为干预:提示词、准入服务门槛设定、决策机制等都有可能影响 AI 的输出。平台可能因为利益,倾向于将服务机会分发给高收益的服务商,但是,一般而言前提是服务商提供的服务质量不能明显低于其它服务商。”

  “ 最严重的情况是平台和服务商共同侵害消费者,对于这种风险以往以大数据杀熟为例,平台和服务商总体上利益最大化,受害者是用户。”

  “ 当然,前面提到的账本公开做法,这才是防止 AI ‘ 偏心 ’ 的根本办法。”

  这自然是非常理想的情况,但在达成和平谈判终局之前,各博弈方还是会默认 “ 丛林法则 ” 优先,其中夺取先发优势的重要性值得一再强调,“ 豆包的激进策略本质是一场高风险高回报的生态位跃迁实验。短期代价是得罪所有超级 App、面临监管处罚、用户信任受损。但若押注成功,长期来看,字节将从 ‘ 应用商店里的租客 ’升级为 ‘ 操作系统时代的房东 ’。这是精心设计的战略杠杆,用最小成本撬动最大行业变革。”

  “ 当所有玩家被迫围绕豆包制定规则时,字节就赢了生态定义权。比如当豆包先覆盖 30% 高端手机用户,APP 厂商将被迫适配。然后就可以打造数据飞轮,越多 APP 接入,豆包决策越精准,吸引更多用户。最后,豆包把控规则制定权,首个建立跨应用标准的企业将主导分润比例。”

  “ 对字节而言,这不是 ‘ 要不要激进 ’ 的选择,而是 ‘ 不激进就等死 ’ 的必然,参考滴滴的例子就知道先发优势的重要性以及竞争有多残酷。在 AI 入口争夺战中,议价权不来自道德正确,而来自不可替代性。”

  “ 即便目前看似刚需性不强,也没关系。互联网史上所有革命性产品( 比如iPhone、微信等 )最初都被质疑 ‘ 非刚需 ’,但最终它们重新定义了什么是 ‘ 刚需 ’。”

  郭炜补充道,“ 在中国这样的商业竞争环境下,相比海外,这种更新换代甚至彻底颠覆的过程会更快、更顺利,就像当年的中国移动互联网一样。”

  “ 中国现在整个移动互联网的基础,比美国和其他地方都要好很多,现在是全球最发达的。 对于 AI 智能终端,无论将来发展的结果是 Agent 形态还是某种新型 APP,下一代形态一定是基于现有的移动互联网。”

  这种新科技趋势下变革的彻底性、颠覆性,确实能恰当描述海内外的商业环境差异,甚至能体现在每一个个体的消费心理中。

  郭炜表示,“ 比如为什么苹果的 Apple Intelligence 发展如此慢?我近期刚听了一个全球著名 AI 随身硬件公司的分享,正好提到这个问题。 要知道,海外对个人隐私的保护之严格是无与伦比的,宁可没有这个功能,也不会采集任何个人手机的数据。哪怕是像豆包手机那样,把屏幕截下来传到云端,还有比价这样的功能,在海外都是会被罚的,苹果内部的 regulation 也会进一步带来限制。”

  “ 而且,海外用户也会觉得这是对他们的冒犯,宁可不方便,也要保护自己的隐私,用户习惯本身就不一样。”

  “ 所以,那种非常彻底的颠覆式创新只有在中国和一些东南亚国家会发生,因为这些地方更倾向先开放和迭代。就像豆包手机一样,它做了很多创新,也有很多问题。一般是等逐步收敛解决这些问题后,再去做全球化。如果不做这一步,可能新的硬件形式是什么都不知道。”

  黄崇远持相同观点,“ 国内的应用研发的效率是很高的,人口多市场也大,很多时候是需求和市场驱动技术,所以往往很多新的创新齐头并进,法律法规还没有 ‘ 反应 ’ 过来的时候就已经铺天盖地了,后面法律口子、风控口子才会逐步完善。这是好事也是坏事,好事就是很容易创新,能够经历足够的论证,坏事就是中间过程中会引起很多问题。而海外很多时候是风险合规先行,技术再跟进,就会很滞后。”

  甄焱鲲补充道:“ 国外的 APP 生态不如国内发达,大量信息停留在更开放的 Web 生态中,问题发生的概率会更高。国内的 APP 生态发达,大量信息停留在各大超级 APP 的封闭领域内,豆包作为一个现象级产品并不具备普遍性,问题发生的概率会更低一些。”

  截至目前,海外的 AI 产业已经发生多起大模型厂商、AI 应用厂商和传统媒体平台之间的版权纠纷。比如,OpenAI 与《 时代 》杂志、《 华尔街日报 》于 2024 年达成高额授权协议,以引用这两家机构的资讯数据。但 OpenAI 也一直和《 纽约时报 》僵持不下,《 纽约时报 》甚至要求 OpenAI 提供 2000 万条 ChatGPT 用户聊天记录,OpenAI 则坚决反对,但最终被法院裁定要求提交,目前纠纷仍未彻底解决。类似地,在近期,华纳音乐与 Suno 平台达成版权侵权诉讼和解,音乐人可以自由选择是否授权 Suno 使用其作品进行 AI 音乐生成。

  甄焱鲲表示,“ 这些案例提示我们,当 ‘ 豆包们 ’ 不再试图 ‘ 颠覆规则 ’,而是成为 ‘ 新规则共建者 ’ 时,三方利益平衡才有可能实现。这需要大公司放弃短期垄断收益,换取长期生态繁荣。”

  王通表示,“ 相比之下,中国本身对知识产权保护程度没有海外高,一方面这对于创业和新兴事物是优势,但对于传统媒体和原创信息保护很弱,创作者很难通过法律手段保障自己的知识产权,基本是被白嫖。结果是,现在中国传统杂志基本上消失,只剩一些内刊,甚至如今手写稿在中国只剩不到 1%,全球可能还有 10%。甚至国内的音乐玩法也变了,现在很多音乐制作人自己用 Suno 来创作,也显得很激进。”

  “ 对应到豆包手机事件,它也可能会白嫖一些传统 APP。如果有些 APP 不愿意被白嫖,也可能会有其他 APP 愿意上来被白嫖。到最后,会像养蛊一样,通过各种竞争和试探,最终冒出几个 ‘ 蛊王 ’,这是中国的玩法。”

  版权保护不足,可能不利于内容生态的良性发展,长期来看是否会影响大模型的质量?海外的 AI 编程工具中,其实面向专业用户的 Cursor 比面向小白用户的 Lovable 更成功,Cursor鼓励专业人员与 AI 对话,这样也能持续积累更多优质数据,也让 Cursor 创造了从套壳 AI 公司到自研大模型的神话。相比之下,国内产品似乎整体上更加面向小白用户,“ 中国最擅长做消费级应用,使用者大多是小白用户,所以玩法和海外不一样。”

  “ 从大模型角度来看,中国在原创方面不是领先者而是跟随者,未来几年也是如此。就像中国做互联网时,基础框架和核心创新最初都是美国的。”

  “ 中国会先把应用端跑起来,发展到大规模后,再反推基础建设。就像移动互联网一样,中国的基础设施之所以强,是因为用户量起来后,迫使底层技术、数据、基础代码、开源项目发展起来。美国则通常从基础开始再慢慢经过几个层次推到最终应用。”

  “ 所以,不用太担心基础模型的问题。以现在中国模型的水平,其实已经完全够小白用户使用了,不需要再更强的模型。”

  “ 只有像我们这种写代码的、偏专业的用户,才能明显感觉到国内模型不行,海外模型准确率更高、幻觉更少。中国大模型编程能力跟海外目前差两年以上,这不是我的意见,是中国 AI 圈专家的总体看法。”

  “ 比如我们公司的程序员,没人会用中国大模型做编程,毕竟还不如自己动手编,从用户体验来讲,差得太远了。随便让它编一个专业点的程序,比如捕捉视频手势,中国哪个大模型能自己编出来?编不出来的。即便能够编出来,准确率也差很多。我最近还让一个国内大模型帮我去改一个 GUI 的启动,其实就改个参数,这都没做出来,但 Gemini 就做出来了。”

  “ 所以在编程或其他专业领域,成本低根本构不成优势。中国大模型的优势不在模型的先进性,在于它能给小白做应用。”

  尽管还保有技术优势,欧洲和美国也都已经意识到过度保守的法规对 AI 发展和竞争可能带来不利,目前正积极推动 AI 监管放松和简化。比如欧委会提议修订欧盟《 人工智能法案 》,对于开发高风险 AI 系统的公司,相关企业将享有一个宽限期( 最长 16 个月 ),以逐步适应并符合监管要求。

  黄崇远表示,“ 这意味着全球的 AI 竞争一定会加速,事实上已经在加速了。”

  王通表示,“ 其实美国更可能落实监管放松,但我觉得他们在应用层面还是卷不过中国。即使监管放松,用户也可能投诉上来,这就不是监管的问题。像豆包手机的出现,估计欧美用户会很震惊,‘ 这东西居然能出来,居然有人用,居然不违法 ’。”

  “ 中国用户在这方面是全球最活跃、最接受创新的,但同时也最 ‘ 随意 ’,没有太多品牌忠诚,更倾向于哪方便、哪便宜就用哪个。即使有人担心隐私,也挡不住‘先用先享受’的心理。”

  至此,可以看出,欧美擅长技术底层、标准化、基础科研,从无到有打造原型,中国则在用户规模、场景落地和快速迭代上极致化,把已有技术推向庞大市场并形成爆发性的应用,这种 “ 1 到 100 ” 的能力在硬件、移动互联网、AI 应用等场景都体现得非常明显。两者优势不同,路径和节奏也完全不同。

  豆包手机助手一石激起千层浪,或许很快会出现各大厂商齐头并进 AI 智能终端的场面,且拭目以待。