中国AI闪耀国际权威医学评测！MentX多模态医学推理全球第二中国区第一

时间：2025-11-17 | 作者： | 阅读：0

在近日公布的国际权威医学多模态推理评测集MedXpertQA的MM子集榜单中，由中国企业缘启智慧（北京）科技有限公司自主研发的医疗AI智能体MentX一举斩获中国区第一名，全球第二，力压GPT-4o、GPT-5-mini等国际主流大模型，展现出“断崖式”领先优势。

此次MedXpertQA评测为全球公开、标准化的多模态医学推理挑战，涵盖复杂临床场景下的影像识别、病历理解与诊断推理能力评估，吸引了来自中美欧多地的主流AI模型参与，被誉为“医疗AI领域的奥林匹克”。在这一国际化舞台上，MentX不仅跻身全球前列，更以显著优势成为中国唯一进入第一梯队的医疗智能体。

数据显示，MentX在“多模态推理”（Reasoning）和“医学理解”（Understanding）两项核心指标上分别取得69.38分和72.36分的优异成绩，综合得分70.19%，仅次于顶尖模型GPT-5（72.18%），但大幅领先于GPT-4o（42.8%）、GPT-5-mini（60.94%）及人类预执业专家水平（45.53%），实现了对国际主流模型的全面超越。

尤为值得关注的是，排名领先的GPT-5系列模型训练数据主要基于欧美人群的医疗记录，相比之下，MentX从研发之初即聚焦中国临床实践，依托国家卫健委临床医学指南和医学共识，深度融合国人的病理特征、诊疗习惯，在电子病历、医学影像与实验室检查等多源信息融合方面更具本土适应性。

“这意味着，MentX不仅在技术指标上赶超国际先进水平，更在临床实用性上更懂‘中国病、中国人’。”一位业内专家向记者表示，“对于中国医生和患者而言，一个基于本土临床实践、符合中国医疗流程的AI系统，其辅助诊断的准确性和可解释性更具现实价值。”

据缘启智慧方面介绍，MentX采用链式思维（Chain-of-Thought）推理架构，能够模拟医生循证诊疗过程，输出清晰的诊断逻辑链，其强大的多模态融合能力可对B超、CT、MRI等影像与文本病历进行精准解读，甚至能准确识别患者的咳嗽声、皮肤的照片，实现全科、多模态医学循证，像真正的医生一样“望闻问切”，显著提升临床决策效率。

业内人士指出，MentX在国际评测中脱颖而出，标志着中国医疗AI已从“跟跑”迈向“并跑”甚至局部“领跑”阶段。随着政策支持与技术迭代加速，国产医疗AI有望在基层医疗、慢病管理、智慧医院等场景中加速落地。

缘启智慧表示，未来将持续优化MentX在真实世界环境中的泛化能力与安全性，推动AI全科诊断系统在全国各级医疗机构普及应用，助力“健康中国”战略纵深推进。

来源:https://news.mydrivers.com/1/1087/1087024.htm
免责声明：文中图文均来自网络，如有侵权请联系删除，心愿游戏发布此文仅为传递信息，不代表心愿游戏认同其观点或证实其描述。