位置:首页 > 新闻资讯 > 火山引擎发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro 多模态能力跻身全球第一梯队

12月18日,火山引擎在FORCE原动力大会上正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。豆包大模型在多模态理解、生成能力及Agent能力上已跻身全球第一梯队。据悉,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。

豆包大模型1.8面向多模态Agent场景进行了定向优化,增强了工具调用能力、复杂指令遵循能力及OS Agent能力。在视觉理解方面,其单次视频理解帧数从640帧倍增至1280帧,支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解。

针对视频创作需求,火山引擎推出了Seedance 1.5 pro音视频创作模型,具备影视级的叙事张力,精准捕捉运动细节并细腻呈现人物情绪,在音画同步技术上取得了突破性进展。该模型支持环境音、背景音乐、人声等多种元素,实现了毫秒级的音画同步输出,并支持多人多语言对话,口型对齐精准。

Seedance系列即将上线“Draft样片”功能,可生成低分辨率样片进行预览,关键要素与最终成片高度一致,帮助创作者提升65%的整体效率,并减少60%的无效创作成本。个人用户已可在豆包、即梦AI等平台体验该模型;企业用户可从12月23日起通过火山引擎API接入Seedance 1.5 pro模型服务。

火山引擎还全面升级了企业级AI Agent平台AgentKit,覆盖Agent从开发、部署到管控的全生命周期,并推出了业内首个“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本。

来源:https://news.pconline.com.cn/2040/20404112.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多