腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
时间:2025-03-22 | 作者: | 阅读:03月22日消息,腾讯正式发布了自研深度思考模型混元T1正式版,这是腾讯自研的最强推理模型。
腾讯表示,T1不仅吐字快、能秒回,还擅长超长文处理。
通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。
在体现推理模型基础能力的常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于o1。
在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。
T1还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。
混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。
这是工业界首次将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本。
基于出色的长文捕捉能力,混元T1能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。
同时,混合Mamba架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗,在相近的激活参数量下,实现了解码速度提升2倍。
目前腾讯混元T1已经开放体验,同时还上线了API:输入价格为每百万tokens 1元,输出价格为每百万tokens 4元。
福利游戏
相关文章
更多-
- 吧友热议索尼起诉腾讯:两大巨头强强对决!
- 时间:2025-07-29
-
- 腾讯高管称内部30%代码都由AI在写 700多项业务接入AI
- 时间:2025-07-27
-
- 段永平:买茅台、腾讯肯定比存银行好
- 时间:2025-07-22
-
- 腾讯新游星痕共鸣今日上线:承诺永不抽角色 覆盖PC/手机端
- 时间:2025-07-17
-
- 重拳出击!王者荣耀制售外挂案告破:3人被抓
- 时间:2025-07-04
-
- 手机空间有救了!腾讯介绍微信重大更新:聊天记录支持备份U盘、SSD
- 时间:2025-07-04
-
- 腾讯游戏《碳碳岛》今日全平台上线:温馨治愈、轻松解压
- 时间:2025-07-02
-
- 腾讯应用宝电脑版5.0来了!Windows运行安卓应用 CPU占用更低
- 时间:2025-06-25
大家都在玩
热门话题
大家都在看
更多-
- 全链网:俄美领导人阿拉斯加峰会可能会提出乌克兰停火计划
- 时间:2025-08-10
-
- 某鲸鱼在休眠一个月后从币安提取274.22枚BTC,价值约3200万美元
- 时间:2025-08-10
-
- Solana – 这一水平如何帮助 SOL 价格上涨 40%
- 时间:2025-08-10
-
- Galaxy Digital两小时内向交易平台转入22.4万枚SOL,价值4112万美元
- 时间:2025-08-10
-
- 随着山寨币投机行为加剧,比特币的主导地位跌至 60% 以下
- 时间:2025-08-10
-
- Abraxas Capital两账户做空ETH等多币种,浮亏超1.9亿美元
- 时间:2025-08-10
-
- 萨尔瓦多过去7日共增持8枚比特币,总持仓为6,263.18枚
- 时间:2025-08-10
-
- 某鲸鱼过去2个月从币安提取超1万枚ETH用于质押,目前约获利1353万美元
- 时间:2025-08-10