美团开源原生多模态大模型LongCat-Next 实现视觉与语音原生统一处理 - 心愿游戏

位置：首页 > 新闻资讯 > 美团开源原生多模态大模型LongCat-Next 实现视觉与语音原生统一处理

美团开源原生多模态大模型LongCat-Next 实现视觉与语音原生统一处理

时间：2026-03-27 | 作者： | 阅读：0

3月27日，美团发布并全面开源原生多模态大模型LongCat-Next及其核心组件离散原生分辨率视觉分词器（dNaViT）。

该模型突破传统以语言为中心的架构，将图像、语音与文本统一映射为同源的离散Token，通过纯粹的'下一个Token预测'范式实现视觉与语音的原生处理。

LongCat-Next具备三项关键技术突破：离散原生自回归架构打破模态隔阂、dNaViT构造视觉'词典'、语义对齐完备编码器解决离散化信息损失问题。

《夸克》非常好用的免费AI浏览器

下载APP查看

来源:https://news.pconline.com.cn/2121/21217412.html
免责声明：文中图文均来自网络，如有侵权请联系删除，心愿游戏发布此文仅为传递信息，不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

2026北京亦庄机器人半程马拉松开赛人形机器人速度超越人类选手

时间：2026-04-19
告别网盘套路！迅雷光鸭云盘宣布4月20日上线：不限速、永久免费2TB空间

时间：2026-04-19
终端大厂全球首个！荣耀自研机器人闪电半马率先冲线：用时48分19秒

时间：2026-04-19
小米汽车推出10万公里里程奖励活动车主可领取定制实体徽章

时间：2026-04-18
新手Vlog相机选择：佳能PowerShot V1 轻松拍出质感大片

时间：2026-04-18
苹果2026款Mac Studio前瞻：M5芯片加持最高256GB内存延续专业性能

时间：2026-04-18
企业微信十岁了进化了5次每天服务超7.5亿人

时间：2026-04-18
拿钱排队都不一定给货！国产存储双雄进入先款排产模式

时间：2026-04-18

精选合集

更多

大家都在玩

热门话题

大家都在看

更多

gmail 退出不同版本有什么区别

时间：2026-04-18
方舟发掘猴子在游戏中的多重能力

时间：2026-04-18
《恶魔复仇者TD》以游戏为主的恶魔与塔防之间的殊死战斗

时间：2026-04-18
怎么有效保护恐龙探索游戏机制

时间：2026-04-18
网络热词ん察觉是什么意思

时间：2026-04-18
罗丽好听的网名女生英文(精选100个)

时间：2026-04-18
tcp udp 是什么？基础说明与使用场景

时间：2026-04-18
嵌入式洗碗机安装要拆橱柜吗？

时间：2026-04-18