扣子3.0实测：手机就能远程遥控你电脑里的Agent,可以手机远程控制电脑

金磊发自凹非寺
量子位 | 公众号 QbitAI

扣子，来了个大版本的升级——3.0正式发布！

现在做一个游戏，只需要给扣子看一眼就行。

例如我们给扣子发了个视频，然后只说了一句：

看一眼这个游戏，做一个类似《我的世界》的游戏项目。

一气呵成，一气呵成。

即便Prompt如此之简单，但《我的世界》界面、操作和交互，都在短短几分钟之内被扣子实现了出来。

但这个并非是扣子3.0这次大版本更新的重点。

这一次，扣子没死磕一个AI让它抗下所有事，反之，是让一群术业有专攻的Agent，组团来给你打工。

一句话概括，就是——

@一下，新一代AI团队，全队开工了。

除此之外，扣子的手机端（iOS / Android）、电脑端（Mac OS / Windows）、网页端（coze.cn），也统统一道儿完成了更新。

你甚至可以用手机远程遥控电脑来完成工作！

那么现在的扣子3.0，它还能替我们做些什么具体的工作？效果又如何？

一波实测，Let’s go！

@一下就能全员就位

先来看第一个实测。

我们给扣子3.0抛了一个科技媒体编辑非常高频的需求：

做一个AI热点追踪仪表盘的网页Demo，用来每天追踪AI行业热点。

这个需求看起来简单，但真正做起来并不只是写个页面。

编辑要先判断今天哪些新闻值得写；还要补背景、查事实、找角度；接着要把需求拆成页面模块；最后才是代码实现。

所以我们没有让一个AI从头干到尾，而是在同一个项目里安排了4个Agent协作：

其中，小曜是扣子3.0自带的Agent；选题写作Agent、产品设计Agent和前端开发Agent，则是通过新建云端Agent的方式来自定义的。

在创建好需要的Agent之后，我们只需要新建一个项目，@这个几个Agent，然后附上一段Prompt即可：

做一个“AI热点追踪仪表盘”的网页Demo，用来每天追踪AI行业热点。页面要求也尽量贴近真实工作场景：顶部是“今日AI热点总览”，中间是6张热点卡片，每张卡片包含标题、热度、写作角度和风险提醒；右侧是“选题优先级排序”；底部给出“今日可写文章标题建议”。

任务下达瞬间，几个专家Agent就各自开忙了：

在Agent们有来无往地交流过后，一个AI热点追踪仪表盘就这么水灵灵地诞生了！

以前的AI处理这类任务，通常会得到一个大而全的回答：前面讲选题，中间讲页面，后面突然开始写代码。

但扣子3.0的工作方式更像项目推进，整个过程的价值，在于它把一个复杂任务拆成了不同角色的连续劳动。

在上面的实测中，拉进项目里的Agent，正如我们刚才提到的，要么是扣子3.0自带的，要么就是在云端新建的。

不过对于你在本地已经用熟练的Agent，例如Claude Code、Codex CLI、OpenClaw等，扣子3.0现在也是支持一键导进来的。

如此一来，这事就从自己组一个AI团队，变成了把你原来用顺手的AI工具也拉进团队。

这一次，我们就可以用扣子3.0做一个更工程化的事儿了：

还是做“AI热点追踪仪表盘”，但要求不只是生成页面Demo，而是变成一个本地能跑的项目。

再接下来，我们进一步做个更有产品感的实测——

做一个AI编辑部桌宠。

Prompt是这样的：

开发一个“AI编辑部桌宠”的网页应用Demo。它常驻在电脑桌面角落，面向科技媒体编辑使用。技术栈使用React + Tailwind，整体风格可爱、轻量、有科技感。桌宠形象可以是小机器人、小猫或者小光球，需要有4种状态：待机时眨眼、轻微漂浮；思考时头顶出现加载动画；提醒时弹出气泡，说“今天还有3个热点值得跟进”；夸夸状态下，完成任务后给编辑一句鼓励。左侧是“今日任务”列表，包括追热点、查资料、写标题、改稿子。右侧是“桌宠对话气泡”，展示它给编辑的提醒。底部有三个按钮：“帮我找选题”“帮我改标题”“提醒我休息一下”。点击不同按钮后，桌宠状态要发生变化。点“帮我找选题”，桌宠进入思考状态，并输出3个AI行业选题；点“帮我改标题”，桌宠给出3个更吸睛的标题版本；点“提醒我休息一下”，桌宠切换成关心语气，提醒用户休息。

虽然这类应用很迷你，但却足以考验扣子3.0几件事：

能不能把一个模糊创意变成清晰产品结构，能不能把好玩和有用结合起来，能不能直接生成可运行代码并说明后续如何扩展。

从效果来看，扣子3.0已经做到了从产品设定、交互逻辑、前端页面，一直走到后续工程扩展。

实测继续。

我们接下来再把一个选题内容直接变成一个视频。

首先，我们在编辑部群里，@多个Agent，用下面这句Prompt生成一篇文章（有种让Agent自己卷起来，我们只需pick好的结果的感觉）：

选择今天一篇关英伟达的选题，并生成1000字的科技文章。

然后我们新建一个视频项目：

把刚才生成好的文章丢进去，再附上一句简单的Prompt：

生成一条45秒短视频方案，风格要科技感、节奏快，适合微信公众号视频号或小红书传播。

视频生成项目默认的模型是Seedance 2.0，也有很多视频的风格可选择：

不到一会，适配编辑部文章的短视频就好了：

短视频创作的麻烦，在于它从来不是单点任务。脚本、分镜、角色、道具、镜头、字幕、配乐、剪辑节奏，每一个环节都能单独写一大段，但真正难的是它们要互相对齐。

扣子3.0的项目化能力在这里能发挥作用：角色、道具、文档等资产可以在项目里沉淀下来，后续不必每次重新定义。

最后一个实测，是手机和电脑的联动。

我们在本地电脑桌面上放了一个英伟达财报的PDF，然后在扣子3.0的手机端，直接让它从电脑桌面读取文件并解读：

我电脑桌面上有一个英伟达财报的文件，帮我调取并做分析。

过去很多AI工具最大的断点就在这里：它能给建议，但拿不到你的本地材料；它能写提纲，但不知道你电脑里那份速记到底讲了什么；它能分析趋势，但你还得先把文件上传、整理、复制、粘贴。

桌面端和移动端打通后，Agent可以在获得授权的前提下处理本地文件，任务也能在手机上继续推进。

如此一来，任务便不再被某一台电脑绑住，这正是Agent产品从工具走向协作对象的关键。

这次是真的能拉项目

把这几组实测放在一起看，扣子3.0最重要的升级，其实可以拆成三层。

第一层，是项目化。

过去很多AI对话更像临时问答，你今天问一个问题，明天再问一个问题，中间的资料、角色、产物经常散落在不同会话里。

扣子3.0把任务从对话推进到项目。资料、角色、任务、产物都放进一个项目空间里，围绕同一个目标持续推进。

这点其实是很重要的。

因为真实工作很少是一问一答解决的。写一篇稿子、做一个Demo、剪一条视频、开发一个小应用，都需要多轮推进、多角色协作、不断沉淀中间产物。

第二层，是Agent编排。

扣子3.0强调多人多Agent协作，不是把几个模型摆在一起让用户自己切，而是让不同Agent按角色参与任务。

选题Agent负责判断，资料Agent负责补背景，产品Agent负责拆结构，代码Agent负责实现，本地Claude Code或Codex负责工程检查。

角色清楚之后，任务自然就更容易推进。

这也解释了为什么“@一下全员就位”是这次升级的核心表达，因为用户需要的是一组可以被调度的AI伙伴。

第三层，是工具链打通。

Agent要真正干活，不能只停留在对话框里。

扣子3.0这次覆盖了编程项目、视频项目、本地Agent接入、行业技能包、多端同步、桌面端本地文件处理等一整套能力。

编程项目里，可以做网页、App、小程序，支持导入GitHub项目或本地项目继续开发，也支持一键部署到线上。视频项目里，可以围绕剧本、分镜、视频、音乐、续集生成持续迭代。行业技能包则把自媒体、法律、金融、互联网、医疗健康等场景里的专业能力打包成可调用的技能。

换句话说，面对一些垂直行业里的复杂任务，用户不需要从零调教Agent，也能先加载一套更接近专家经验的解题模板。

更准确地说，这些技能包不是简单给 Agent 加几个提示词，而是把行业数据库、专业方法和高频工作流封装成可调用能力。

比如金融场景里，可以围绕A股、基金等任务调用实时数据引擎和专业分析能力；法律场景里，可以检索法律法规和专业内容，辅助合同审阅、诉讼策略材料整理；医疗健康场景里，可以识别体检报告、结构化提取关键信息、整理健康档案；自媒体和科研场景里，也有爆款笔记洞察、标题生成、论文检索、文献引用溯源等技能。

这意味着，Agent 不只是更会回答，而是能带着更贴近行业经验的能力进入具体任务。对新人来说，它降低了从零摸索的门槛；对专业人士来说，它可以先接住检索、整理、初稿、结构化分析这些高频环节，把人的时间留给真正需要判断和经验的部分。

这些能力放在一起，才让Agent从会说走向能做。

从谁更聪明，到谁更会打配合

过去一年，AI产品的竞争很容易被简化成模型能力竞争：

谁更聪明，谁推理更强，谁写代码更好，谁上下文更长。

这些当然重要，但到了Agent产品阶段，另一个问题开始变得更关键：

一个AI再聪明，能不能和其他AI、工具、人类一起工作？

扣子3.0给出的答案，是把Agent产品做成一个协作系统。

它面向的不只是开发者，也包括创作者、复杂业务工作者和新手用户。

开发者可以接入Claude Code、Codex CLI、OpenClaw等本地Agent，也可以在编程项目里并行开发；创作者可以把脚本、分镜、视频、音乐和续集放进同一个项目；复杂业务工作者可以调用行业技能包；新手用户则不需要理解API、MCP这些概念，也能先从一个项目开始。

这背后其实是Agent产品的一个重要方向：

真正好用的Agent，不应该只比单点能力，而要看它能不能进入真实工作流。

能不能把任务拆开，能不能接住上下文，能不能调用工具，能不能沉淀资产，能不能跨端延续，能不能让用户少切窗口、少搬材料、少重复解释。

如果说早期AI产品像一个随问随答的聪明人，那扣子3.0想做的，更像一个能开工的小团队。

它不一定每个环节都替你做到极致，但它开始让不同Agent围绕同一个项目协作起来。

这就是这次升级最值得关注的地方。

AI Agent的下一步，不只是更强的模型，而是更像真实团队的工作系统。

以后你打开一个项目，@一下，AI全队开工。