金磊 发自 凹非寺
量子位 | 公众号 QbitAI
扣子,来了个大版本的升级——3.0正式发布!
现在做一个游戏,只需要给扣子看一眼就行。
例如我们给扣子发了个视频,然后只说了一句:
看一眼这个游戏,做一个类似《我的世界》的游戏项目。
一气呵成,一气呵成。
即便Prompt如此之简单,但《我的世界》界面、操作和交互,都在短短几分钟之内被扣子实现了出来。
但这个并非是扣子3.0这次大版本更新的重点。
这一次,扣子没死磕一个AI让它抗下所有事,反之,是让一群术业有专攻的Agent,组团来给你打工。
一句话概括,就是——
@一下,新一代AI团队,全队开工了。
除此之外,扣子的手机端 (iOS / Android)、电脑端(Mac OS / Windows)、网页端(coze.cn),也统统一道儿完成了更新。
你甚至可以用手机远程遥控电脑来完成工作!
那么现在的扣子3.0,它还能替我们做些什么具体的工作?效果又如何?
一波实测,Let’s go!
先来看第一个实测。
我们给扣子3.0抛了一个科技媒体编辑非常高频的需求:
做一个AI热点追踪仪表盘的网页Demo,用来每天追踪AI行业热点。
这个需求看起来简单,但真正做起来并不只是写个页面。
编辑要先判断今天哪些新闻值得写;还要补背景、查事实、找角度;接着要把需求拆成页面模块;最后才是代码实现。
所以我们没有让一个AI从头干到尾,而是在同一个项目里安排了4个Agent协作:
其中,小曜是扣子3.0自带的Agent;选题写作Agent、产品设计Agent和前端开发Agent,则是通过新建云端Agent的方式来自定义的。
在创建好需要的Agent之后,我们只需要新建一个项目,@这个几个Agent,然后附上一段Prompt即可:
做一个“AI热点追踪仪表盘”的网页Demo,用来每天追踪AI行业热点。 页面要求也尽量贴近真实工作场景:顶部是“今日AI热点总览”,中间是6张热点卡片,每张卡片包含标题、热度、写作角度和风险提醒;右侧是“选题优先级排序”;底部给出“今日可写文章标题建议”。
任务下达瞬间,几个专家Agent就各自开忙了:
在Agent们有来无往地交流过后,一个AI热点追踪仪表盘就这么水灵灵地诞生了!
以前的AI处理这类任务,通常会得到一个大而全的回答:前面讲选题,中间讲页面,后面突然开始写代码。
但扣子3.0的工作方式更像项目推进,整个过程的价值,在于它把一个复杂任务拆成了不同角色的连续劳动。
在上面的实测中,拉进项目里的Agent,正如我们刚才提到的,要么是扣子3.0自带的,要么就是在云端新建的。
不过对于你在本地已经用熟练的Agent,例如Claude Code、Codex CLI、OpenClaw等,扣子3.0现在也是支持一键导进来的。
如此一来,这事就从自己组一个AI团队,变成了把你原来用顺手的AI工具也拉进团队。
这一次,我们就可以用扣子3.0做一个更工程化的事儿了:
还是做“AI热点追踪仪表盘”,但要求不只是生成页面Demo,而是变成一个本地能跑的项目。
再接下来,我们进一步做个更有产品感的实测——
做一个AI编辑部桌宠。
Prompt是这样的:
开发一个“AI编辑部桌宠”的网页应用Demo。它常驻在电脑桌面角落,面向科技媒体编辑使用。技术栈使用React + Tailwind,整体风格可爱、轻量、有科技感。 桌宠形象可以是小机器人、小猫或者小光球,需要有4种状态: 待机时眨眼、轻微漂浮;思考时头顶出现加载动画;提醒时弹出气泡,说“今天还有3个热点值得跟进”;夸夸状态下,完成任务后给编辑一句鼓励。 左侧是“今日任务”列表,包括追热点、查资料、写标题、改稿子。右侧是“桌宠对话气泡”,展示它给编辑的提醒。底部有三个按钮:“帮我找选题”“帮我改标题”“提醒我休息一下”。 点击不同按钮后,桌宠状态要发生变化。 点“帮我找选题”,桌宠进入思考状态,并输出3个AI行业选题;点“帮我改标题”,桌宠给出3个更吸睛的标题版本;点“提醒我休息一下”,桌宠切换成关心语气,提醒用户休息。
虽然这类应用很迷你,但却足以考验扣子3.0几件事:
能不能把一个模糊创意变成清晰产品结构,能不能把好玩和有用结合起来,能不能直接生成可运行代码并说明后续如何扩展。
从效果来看,扣子3.0已经做到了从产品设定、交互逻辑、前端页面,一直走到后续工程扩展。
实测继续。
我们接下来再把一个选题内容直接变成一个视频。
首先,我们在编辑部群里,@多个Agent,用下面这句Prompt生成一篇文章(有种让Agent自己卷起来,我们只需pick好的结果的感觉):
选择今天一篇关英伟达的选题,并生成1000字的科技文章。
然后我们新建一个视频项目:
把刚才生成好的文章丢进去,再附上一句简单的Prompt:
生成一条45秒短视频方案,风格要科技感、节奏快,适合微信公众号视频号或小红书传播。
视频生成项目默认的模型是Seedance 2.0,也有很多视频的风格可选择:
不到一会,适配编辑部文章的短视频就好了:
短视频创作的麻烦,在于它从来不是单点任务。脚本、分镜、角色、道具、镜头、字幕、配乐、剪辑节奏,每一个环节都能单独写一大段,但真正难的是它们要互相对齐。
扣子3.0的项目化能力在这里能发挥作用:角色、道具、文档等资产可以在项目里沉淀下来,后续不必每次重新定义。
最后一个实测,是手机和电脑的联动。
我们在本地电脑桌面上放了一个英伟达财报的PDF,然后在扣子3.0的手机端,直接让它从电脑桌面读取文件并解读:
我电脑桌面上有一个英伟达财报的文件,帮我调取并做分析。
过去很多AI工具最大的断点就在这里:它能给建议,但拿不到你的本地材料;它能写提纲,但不知道你电脑里那份速记到底讲了什么;它能分析趋势,但你还得先把文件上传、整理、复制、粘贴。
桌面端和移动端打通后,Agent可以在获得授权的前提下处理本地文件,任务也能在手机上继续推进。
如此一来,任务便不再被某一台电脑绑住,这正是Agent产品从工具走向协作对象的关键。
把这几组实测放在一起看,扣子3.0最重要的升级,其实可以拆成三层。
第一层,是项目化。
过去很多AI对话更像临时问答,你今天问一个问题,明天再问一个问题,中间的资料、角色、产物经常散落在不同会话里。
扣子3.0把任务从对话推进到项目。资料、角色、任务、产物都放进一个项目空间里,围绕同一个目标持续推进。
这点其实是很重要的。
因为真实工作很少是一问一答解决的。写一篇稿子、做一个Demo、剪一条视频、开发一个小应用,都需要多轮推进、多角色协作、不断沉淀中间产物。
第二层,是Agent编排。
扣子3.0强调多人多Agent协作,不是把几个模型摆在一起让用户自己切,而是让不同Agent按角色参与任务。
选题Agent负责判断,资料Agent负责补背景,产品Agent负责拆结构,代码Agent负责实现,本地Claude Code或Codex负责工程检查。
角色清楚之后,任务自然就更容易推进。
这也解释了为什么“@一下全员就位”是这次升级的核心表达,因为用户需要的是一组可以被调度的AI伙伴。
第三层,是工具链打通。
Agent要真正干活,不能只停留在对话框里。
扣子3.0这次覆盖了编程项目、视频项目、本地Agent接入、行业技能包、多端同步、桌面端本地文件处理等一整套能力。
编程项目里,可以做网页、App、小程序,支持导入GitHub项目或本地项目继续开发,也支持一键部署到线上。视频项目里,可以围绕剧本、分镜、视频、音乐、续集生成持续迭代。行业技能包则把自媒体、法律、金融、互联网、医疗健康等场景里的专业能力打包成可调用的技能。
换句话说,面对一些垂直行业里的复杂任务,用户不需要从零调教Agent,也能先加载一套更接近专家经验的解题模板。
更准确地说,这些技能包不是简单给 Agent 加几个提示词,而是把行业数据库、专业方法和高频工作流封装成可调用能力。
比如金融场景里,可以围绕A股、基金等任务调用实时数据引擎和专业分析能力;法律场景里,可以检索法律法规和专业内容,辅助合同审阅、诉讼策略材料整理;医疗健康场景里,可以识别体检报告、结构化提取关键信息、整理健康档案;自媒体和科研场景里,也有爆款笔记洞察、标题生成、论文检索、文献引用溯源等技能。
这意味着,Agent 不只是更会回答,而是能带着更贴近行业经验的能力进入具体任务。对新人来说,它降低了从零摸索的门槛;对专业人士来说,它可以先接住检索、整理、初稿、结构化分析这些高频环节,把人的时间留给真正需要判断和经验的部分。
这些能力放在一起,才让Agent从会说走向能做。
过去一年,AI产品的竞争很容易被简化成模型能力竞争:
谁更聪明,谁推理更强,谁写代码更好,谁上下文更长。
这些当然重要,但到了Agent产品阶段,另一个问题开始变得更关键:
一个AI再聪明,能不能和其他AI、工具、人类一起工作?
扣子3.0给出的答案,是把Agent产品做成一个协作系统。
它面向的不只是开发者,也包括创作者、复杂业务工作者和新手用户。
开发者可以接入Claude Code、Codex CLI、OpenClaw等本地Agent,也可以在编程项目里并行开发;创作者可以把脚本、分镜、视频、音乐和续集放进同一个项目;复杂业务工作者可以调用行业技能包;新手用户则不需要理解API、MCP这些概念,也能先从一个项目开始。
这背后其实是Agent产品的一个重要方向:
真正好用的Agent,不应该只比单点能力,而要看它能不能进入真实工作流。
能不能把任务拆开,能不能接住上下文,能不能调用工具,能不能沉淀资产,能不能跨端延续,能不能让用户少切窗口、少搬材料、少重复解释。
如果说早期AI产品像一个随问随答的聪明人,那扣子3.0想做的,更像一个能开工的小团队。
它不一定每个环节都替你做到极致,但它开始让不同Agent围绕同一个项目协作起来。
这就是这次升级最值得关注的地方。
AI Agent的下一步,不只是更强的模型,而是更像真实团队的工作系统。
以后你打开一个项目,@一下,AI全队开工。