MiniMax大模型认不出马嘉祺!官方终于给出原因
时间:2026-05-09 | 作者: | 阅读:0快科技5月9日消息,近期有网友发现一个有趣的现象:MiniMax 模型似乎无法正常识别马嘉祺三个字。
起初大家都以为只是偶然出现的小漏洞,但多方实测后发现情况有些离谱:不管切换不同接口、更换使用平台,该问题都能稳定复现。
翻看网友测试截图以及实际调用返回结果能看出,模型其实可以检索到马嘉祺的相关资料,也能完整准确输出他的个人履历、相关经历等信息。可唯独只要提及本名,模型就会出现文字错乱、随意改写名字的情况。
简单来说,人物背景信息基本无误,对应人物也完全匹配,唯独在识别和输出姓名时频频出错。
那么为什么会出现这种情况呢?
今日,MiniMax官微发长文回应M2系列模型无法说出马嘉祺一事,提供了对“嘉祺识别”问题的完整排查过程和技术思考。
MiniMax表示,其从分词器版本对齐、embedding统计分布、语义近邻检索、预训练与后训练模型的few-shot对比实验、后训练数据频次统计以及对全词表lm_head变化幅度的排序扫描等多个维度进行了排查。
最终定位到的原因是:嘉祺在分词器中被合并为一个独立token,但该token在后训练数据中出现频次极低,导致模型在后训练中逐渐遗忘了对该token的生成能力。
修复方案方面,MiniMax构造了一份覆盖全词表的合成数据,核心思想是:通过一个简单的复读任务,为全词表建立一个生成频率的“下限保障”,防止任何token因为完全缺失而退化。
此外,MiniMax表示,将token覆盖度作为后训练数据质量的一项常规监控指标,可以在早期发现潜在的稀疏token退化风险,避免类似问题在线上复现。
来源:https://news.pconline.com.cn/2146/21467871.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- DeepSeek大范围开放识图模式 实现图文交互并公布高效多模态技术框架
- 时间:2026-05-09
-
- 技术驱动资源重构:AI赋能软文营销开启高质量发展新纪元
- 时间:2026-05-09
-
- 迪士尼新CEO上任首刀砍向漫威 核心视觉团队遭整体裁撤引行业震动
- 时间:2026-05-09
-
- CHERRY推出新款XTRFY K5 Ultra磁轴键盘 采用升级TMR魔晶磁轴与半透明外壳设计
- 时间:2026-05-09
-
- 无忧传媒签约达人王暖暖因工作压力身体不适送医抢救 公司宣布暂停其工作直至完全康复
- 时间:2026-05-09
-
- 苹果推送iOS/iPadOS 26.5 RC 2更新 预计下周正式版将带来RCS加密等新功能。
- 时间:2026-05-09
-
- PITAKA 「日落2.0·加州旧梦」芳纶纤维手机壳发布 续写日落时刻新篇章
- 时间:2026-05-09
-
- 共享微出行巨头Lime正式递交IPO申请 去年营收增长但亏损同步扩大
- 时间:2026-05-09
精选合集
更多大家都在玩
大家都在看
更多-
- iPhone白噪音开启教程 苹果手机背景声音设置方法
- 时间:2026-05-09
-
- iCloud空间不足照片会丢失吗 满额后注意事项与解决方法
- 时间:2026-05-09
-
- 小米手机内存清理全攻略 彻底清除系统缓存方法详解
- 时间:2026-05-09
-
- 男生霸气网名大全:精选100个,怎么选?为什么酷?
- 时间:2026-05-09
-
- 男生网名大全:100个精选推荐,怎么选?为什么火?
- 时间:2026-05-09
-
- 《幻灵召唤师》午夜挽歌版本重磅来袭
- 时间:2026-05-09
-
- 拼多多小编推荐机制解析如何提升商品入选概率
- 时间:2026-05-09
-
- 男生网名“枫落无痕”好听吗?精选100个推荐
- 时间:2026-05-09