位置:首页 > 新闻资讯 > 百灵Ling-2.6-flash发布:104B 参数,定价每百万token 0.1美元

百灵Ling-2.6-flash发布:104B 参数,定价每百万token 0.1美元

时间:2026-04-22  |  作者:  |  阅读:0

4 月 22 日下午消息,蚂蚁百灵正式推出 Ling-2.6-flash —— 一款总参数量 104B、激活参数 7.4B 的 Instruct 模型,主打“Token 效率”。

Ling-2.6-flash 沿用了 Ling 2.5 的混合线性架构设计,在 4 卡 H20 条件下推理速度最快可达到 340 tokens/s,Prefill 吞吐达到 Nemotron-3-Super 的 2.2 倍。

从 Token 消耗来看,Ling-2.6-flash 的智效比显著提升。在 Artificial Analysis 完整测评中,Ling-2.6-flash 总消耗为 15M tokens,而 Nemotron-3-Super 等模型达到或超过 110M tokens。

另外,Ling-2.6-flash 面向 Agent 场景进行了定向增强,模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等Agent 相关基准上达到同尺寸 SOTA 水平。

API 定价方面,Ling-2.6-flash 输入每百万tokens定价 0.1 美元,输出 0.3 美元。

目前,Ling-2.6-flash 的 API 已正式向用户开放,并提供为期一周的限时免费试用。用户可以通过OpenRouter 、百灵大模型 tbox 获取对应服务。

据了解,该模型后续将通过蚂蚁数科发布商业版本LingDT,服务全球开发者及中小企业。

来源:https://finance.sina.com.cn/roll/2026-04-22/doc-inhvixkk6273803.shtml
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多