位置:首页 > 新闻资讯 > 中国AI闪耀国际权威医学评测!MentX多模态医学推理全球第二 中国区第一

在近日公布的国际权威医学多模态推理评测集MedXpertQA的MM子集榜单中,由中国企业缘启智慧(北京)科技有限公司自主研发的医疗AI智能体MentX一举斩获中国区第一名,全球第二,力压GPT-4o、GPT-5-mini等国际主流大模型,展现出“断崖式”领先优势。

此次MedXpertQA评测为全球公开、标准化的多模态医学推理挑战,涵盖复杂临床场景下的影像识别、病历理解与诊断推理能力评估,吸引了来自中美欧多地的主流AI模型参与,被誉为“医疗AI领域的奥林匹克”。在这一国际化舞台上,MentX不仅跻身全球前列,更以显著优势成为中国唯一进入第一梯队的医疗智能体。

数据显示,MentX在“多模态推理”(Reasoning)和“医学理解”(Understanding)两项核心指标上分别取得69.38分和72.36分的优异成绩,综合得分70.19%,仅次于顶尖模型GPT-5(72.18%),但大幅领先于GPT-4o(42.8%)、GPT-5-mini(60.94%)及人类预执业专家水平(45.53%),实现了对国际主流模型的全面超越。

尤为值得关注的是,排名领先的GPT-5系列模型训练数据主要基于欧美人群的医疗记录,相比之下,MentX从研发之初即聚焦中国临床实践,依托国家卫健委临床医学指南和医学共识,深度融合国人的病理特征、诊疗习惯,在电子病历、医学影像与实验室检查等多源信息融合方面更具本土适应性。

“这意味着,MentX不仅在技术指标上赶超国际先进水平,更在临床实用性上更懂‘中国病、中国人’。”一位业内专家向记者表示,“对于中国医生和患者而言,一个基于本土临床实践、符合中国医疗流程的AI系统,其辅助诊断的准确性和可解释性更具现实价值。”

据缘启智慧方面介绍,MentX采用链式思维(Chain-of-Thought)推理架构,能够模拟医生循证诊疗过程,输出清晰的诊断逻辑链,其强大的多模态融合能力可对B超、CT、MRI等影像与文本病历进行精准解读,甚至能准确识别患者的咳嗽声、皮肤的照片,实现全科、多模态医学循证,像真正的医生一样“望闻问切”,显著提升临床决策效率。

业内人士指出,MentX在国际评测中脱颖而出,标志着中国医疗AI已从“跟跑”迈向“并跑”甚至局部“领跑”阶段。随着政策支持与技术迭代加速,国产医疗AI有望在基层医疗、慢病管理、智慧医院等场景中加速落地。

缘启智慧表示,未来将持续优化MentX在真实世界环境中的泛化能力与安全性,推动AI全科诊断系统在全国各级医疗机构普及应用,助力“健康中国”战略纵深推进。

来源:https://news.mydrivers.com/1/1087/1087024.htm
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多