1月5日,MiroMind团队正式发布其自研搜索智能体模型MiroThinker 1.5。该团队由陈天桥与清华大学代季峰教授联合发起,专注于发现式智能研究。



据悉,MiroThinker 1.5采用Interactive Scaling技术,将模型训练重点从内部参数(Internal Parameters)扩展转向外部信息交互(External Interaction)。该模型在BrowseComp等基准测试中表现突出,其中30B参数版本在BrowseComp-ZH评测集上实现性能超越,单条调用成本为0.07美元。

据了解,该模型通过三种核心训练机制构建"推理-验证-修正"循环:Evidence-Seeking(主动求证)鼓励模型将关键判断拆解为可验证的子假设;Iterative Verification(多轮校验)要求模型对已有判断进行反证测试;Anti-Hallucination(抗幻觉)对缺乏真实依据的推理路径进行系统性过滤。

训练过程中,团队采用时序敏感训练沙盒技术,构建覆盖多任务类型的可控数据合成体系。每一道题目的"正确答案"均随时间戳动态演化,模型必须在严格的信息可见性约束下进行判断,确保推演与评分符合真实世界的时序逻辑。


目前,MiroThinker 1.5模型已在Hugging Face平台开放下载。(袁宁)

本文来自网易科技报道,更多资讯和深度内容,关注我们。