在全球AI技术竞赛日益激烈的今天,中国AI企业正在用实力证明自己的技术深度。近日, 在2025第三届全国人工智能应用场景创新挑战赛(CICAS)姑苏专项晋级赛中,明略科技(2718.HK)联合北京大学的参赛项目《基于多模态大模型的品牌出海创意生成与情感链接智能平台》从70余个参赛团队中脱颖而出,斩获“特等奖”殊荣,成功晋级全国总决赛。
全国人工智能应用场景创新挑战赛(CICAS)是在科学技术部战略规划司指导支持下,由中国人工智能学会与科技部新一代人工智能发展研究中心联合主办的综合性年度赛事。自2023年办赛以来,共吸引4800余个国内外优秀科技人才团队和优质创新创业项目参与,目前已成为推动AI与实体经济深度融合的重要平台。
在此次比赛中,明略科技自研的Mano灵巧手和HMLLM(超图多模态大语言模型)两大核心技术,分别在"数据获取"和"主观分析"领域实现突破,获得权威认可。
明略科技Mano灵巧手在国际权威评估基准OS-World榜单上,以54.0%的任务成功率刷新纪录,在专有模型赛道排名第一,总榜仅次于Anthropic最新发布的Claude-Sonnet-4.5,位居第二。这一成绩意味着,明略科技自研的72B参数大模型,在与Claude等国际顶尖大模型的同台竞技中取得了领先。
OS-World是业界公认的GUI(图形用户界面)智能体评估基准,测试模型在真实操作系统环境中完成复杂任务的能力。能够在这一榜单上取得第二名的成绩,充分证明了Mano在"操作智能"领域的技术实力。
与此同时,HMLLM超图多模态大语言模型在ACM MM2024 (ACM Multimedia,CCF-A类国际顶级会议)上获得最佳论文提名,提名率仅2%。ACM MM是多媒体领域的顶级学术会议,能够获得最佳论文提名,代表了国际学术界对HMLLM创新性的高度认可。
Mano和HMLLM两项技术的突破,不是孤立的。它们共同构成了从数据获取到主观分析的完整闭环,这是明略科技技术体系的核心竞争力。
Mano灵巧手:从理解到操作的跨越
Mano灵巧手的创新,在于它突破了传统大模型"只能对话不能操作"的局限。
传统大模型擅长理解和生成文本,但在实际操作层面存在明显短板。比如,当你要求大模型"帮我从这个网站采集数据"时,它可以告诉你应该怎么做,但无法真正去操作浏览器、点击按钮、填写表单、提取数据。Mano的突破,正是实现了从"理解"到"行动"的跨越。
Mano具备四大核心能力:
第一,视觉理解能力。Mano能够像人一样"看"屏幕,精准识别任何软件界面元素——按钮、输入框、下拉菜单、图标等。这种视觉理解能力,使得Mano可以在多种浏览器环境中运行,无需针对特定系统进行改造。
第二,自动化任务拆解能力。当接到一个复杂任务时,Mano能够智能拆解为多个子任务,并按照逻辑顺序执行。比如"采集某网站的产品信息",Mano会自动拆解为:打开网站→搜索产品→点击详情页→提取信息→保存数据等步骤。
第三,高性能代码生成能力。Mano实现了高HTML压缩率和代码生成成功率,支持动态、静态和SPA(单页应用)等主流网页类型。这意味着,无论网页结构多么复杂,Mano都能生成有效的操作代码。
第四,智能自主学习能力。Mano能够自主适应新网站,通过"探索→使用→自标注→再训练"的循环,持续进化提升。这种自主学习能力,使得Mano不需要人工标注大量训练数据,就能快速适应新场景。
更重要的是,Mano采用72B参数规模,实现了性能与部署成本的平衡。相比动辄数千亿参数的超大模型,72B参数的Mano可以私有化部署,既保证了性能,又解决了数据安全和成本问题。
HMLLM:从客观内容到主观感知的突破
如果说Mano解决了"数据从哪来"的问题,那么HMLLM则解决了"数据怎么分析"的难题,特别是如何分析消费者的主观感受。
传统的多模态模型,通常融合视觉、文本、音频等"客观内容"信号。HMLLM的创新在于,它首次将脑电、眼动等"主观感知"信号纳入多模态建模,开创了"生理信号+内容信号"融合的新范式。
HMLLM的技术突破体现在三个层面:
第一,超大规模主观个性化数据集。明略科技利用自研设备,采集了1万+真实受试者的脑电与注视点信号,构建了Video-SME与SPA-ADV两大原创数据集,并已开源发表。这些数据记录了受试者在观看不同内容时的真实生理反应——注意力集中在哪里、情绪如何波动、认知负荷有多大。
第二,超图多模态架构创新。HMLLM通过超图结构将视频帧、音频、人口特征与生理信号统一建模,弥合了不同模态之间的语义鸿沟,支持帧级逻辑推理与人群差异解读。
传统的多模态融合,通常采用简单的拼接或注意力机制。超图结构的优势在于,它能够建模更复杂的跨模态关系。比如,某个视频帧(视觉)、某段音乐(听觉)、某个文字(文本)、某个脑电模式(生理)之间,可能存在复杂的关联关系,超图结构能够有效捕捉这些关联。
第三,秒级主观指标预测能力。HMLLM能够实现秒级粒度的注意力、情绪、认知三维建模,预测结果与真人主观感受的一致性(R²)超过89%。
双技术协同:完整的智能分析闭环
Mano和HMLLM两项技术的价值,不仅在于各自的突破,更在于它们的协同效应。
在明略科技的技术架构中,Mano负责前端的可信数据获取,HMLLM负责后端的主观感知分析,两者共同构成了从数据采集到洞察输出的完整闭环。
具体而言,Mano通过MCP(Model Context Protocol)+CDP(Chrome DevTools Protocol)协议操作各类系统,实现自动化、可信化的数据采集。无论是网页数据、社媒内容,还是广告后台数据,Mano都能像人一样操作系统,获取所需信息。
获取数据后,HMLLM对内容进行多模态分析:视觉层面识别场景、产品、表情;音频层面分析语音、音乐、语气;文本层面提取标题、字幕、评论;生理层面预测注意力、情绪、认知。
这种协同机制,解决了AI应用的“第一公里”和“最后一公里”问题。Mano解决了数据获取的“第一公里”,HMLLM解决了洞察生成的“最后一公里”,两者结合形成了端到端的智能系统。
更重要的是,系统配备了加密记忆系统,能够持续沉淀方法论。每次分析的结果、优化的经验,都会被记录下来,用于改进后续的分析。这种"持续使用、持续沉淀"的机制,使得系统越用越智能。
北大基因的技术深度
明略科技的技术突破,离不开其深厚的学术基因。作为北大系AI企业,明略科技的创始人、CEO兼CTO吴明辉毕业于北京大学数学系,后保送本校攻读人工智能硕士。2006年,吴明辉在北大读硕士期间创办了秒针系统,这是中国最早的互联网用户行为和营销数据分析平台之一。
从北大校园走出的明略科技,将学术研究的严谨性与产业应用的实战性深度融合。在负责人吴明辉的带领下,团队在国内外高水平期刊、会议发表论文20余篇,其中:
Mano模型压缩技术荣获AAAI 2026(CCF A类)Oral口头汇报;
HMLLM的论文在ACM MM2024(CCF-A类)获得最佳论文提名;
多篇项目支撑技术的论文均发表于计算机顶刊顶会。
此外,2019年,明略科技获批建设"营销智能"国家新一代人工智能开放创新平台,这一认定标志着其技术能力获得了国家层面的权威认可。明略科技还参与了科技创新2030"新一代人工智能"重大项目,在国家课题支撑下,将基础研究与产业需求深度结合。
2025年,明略科技成功签约为香港特区政府第五批重点企业伙伴,并担任中国商务广告协会AI营销应用工委会理事长兼秘书长单位,展现了其在AI赋能营销领域的领军地位。
从跟跑到领跑的技术跃升
明略科技此次获得特等奖,是对其技术创新的权威认可,更深刻证明了中国AI企业在多模态大模型领域的技术深度。
Mano在OS-World榜单上与Claude等国际顶尖大模型同台竞技并取得领先,HMLLM在ACM MM2024获得最佳论文提名,这些成绩展现了中国AI技术从"跟跑"到"并跑"甚至"领跑"的实力跃升。
从学术研究到产业应用,明略科技构建了完整的创新链条。20余篇顶刊论文证明了学术深度,OS-World榜单第二名证明了工程能力,89%准确率证明了创新突破,实际应用案例证明了商业价值。
这一完整链条,正是中国AI技术从"跟跑"走向"领跑"的关键路径:既能在国际顶级学术会议上发表论文,又能在国际权威评估基准上与顶尖模型竞技,还能将技术转化为实际应用,创造商业价值。
明略科技的特等奖,不仅是对其技术创新的认可,更是对中国AI企业技术实力的证明。在全球AI技术竞赛中,以明略科技为代表的北大系AI企业,正在用实力证明:中国AI技术,不仅能跟上,更能领跑。