AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额
时间:2025-05-15 | 作者: | 阅读:0欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、阿里通义万相Wan2.1-VACE开源 号称首个开源的视频编辑统一模型
通义万相宣布VACE开源,支持多种分辨率和任务,提供一站式视频创作体验,通过多模态输入机制实现高效灵活的视频编辑。
【AiBase提要:】
? 支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务,提高创作效率。
?? 强大的可控重绘能力,基于人体姿态、运动光流等控制生成,支持主体和背景参考。
?? 提出视频条件单元VCU,统一多模态输入,实现多任务自由组合与灵活编辑。
详情链接:https://github.com/Wan-Video/Wan2.1
2、OpenAI 升级 ChatGPT:正式引入GPT-4.1代码能力超强
OpenAI发布了GPT-4.1及其轻量级版本GPT-4.1mini,显著增强了编码能力和指令执行体验,同时优化了用户体验和多模态支持,巩固了其在AI领域的领先地位。
【AiBase提要:】
?? GPT-4.1具备强大的编码能力,处理复杂编程需求更高效,运行速度更快,是开发者和指令处理场景的理想选择。
?? GPT-4.1mini轻量级且高效,在资源受限设备上仍能流畅运行,为免费和付费用户提供广泛访问渠道。
?? ChatGPT新增多项功能如长按复制、表格复制和流式传输,界面优化显著提升用户体验。
3、Stability AI开源341M超轻量文字转语音模型,手机本地可跑,音频生成仅需8秒!
Stability AI发布了一款名为‘Adversarial Post-Training加速的快速文字转音频生成’的超轻量文字转语音模型,参数仅为341M,却能在H100GPU上75毫秒生成12秒音频,在手机CPU上7秒完成同样任务,性能炸裂且多样性强。
【AiBase提要:】
??ARC后训练方法不基于蒸馏,提升模型生成速度与质量。
??模型轻量化设计,支持手机本地运行,大幅提升移动端创意应用体验。
??音频转音频功能实现风格迁移,激发更多创作灵感。
详情链接:https://arxiv.org/pdf/2505.08175
4、Poe 报告:可灵大模型视频生成量约占30%份额 领先Runway
近日发布的2025年春季AI模型使用趋势报告显示,中国快手的可灵多款视频生成模型在文生视频领域表现突出,市场份额达30%,其中可灵2.0模型仅三周就占21%使用比例。自去年6月发布以来,全球用户突破2200万,月活跃用户增长25倍,生成视频和图片数量显著。
【AiBase提要:】
?? 可灵大模型在文生视频领域市场份额达30%,领先Runway等竞争者。
?? 可灵2.0模型自4月发布后三周内即占据21%视频生成市场。
?? 可灵AI全球用户超2200万,月活跃用户增长25倍,生成视频与图片数量显著增加。
5、微软 WizardLM 团队“集体跳槽”腾讯,或已并入混元大模型研发体系
微软的人工智能研究团队 WizardLM 整体加入腾讯 AI 实验室的“混元”团队,标志着腾讯在大模型领域进一步发力。该团队不仅带来了多项技术突破,还通过开源模型展示了其研发实力。
【AiBase提要:】
? 曾隶属于微软的 WizardLM 团队整体加入腾讯混元团队,强化了腾讯在大模型领域的竞争力。
?? Hunyuan-TurboS0416模型首次使用“混元”命名,象征着团队与腾讯的深度融合。
?? 腾讯计划大幅增加 AI 投资,目标是在全球 AI 竞争中占据更为主导的地位。
6、腾讯宣布混元图像2.0将于5月16日全新发布
腾讯混元大模型团队宣布,混元图像2.0将在5月16日发布,这是腾讯在AI视觉领域的重要突破,以‘更智能、更开放、更中国’为核心理念。
【AiBase提要:】
?? 混元图像2.0将于5月16日发布,标志着腾讯在AI视觉领域的又一重要进展。
?? 新工具强调‘更智能、更开放、更中国’,助力创作者和企业迈向AI驱动的视觉生产新时代。
?? 继去年混元大模型升级后,腾讯再次展示其在人工智能领域的持续创新力。
7、上海启动人工智能标识生态联盟,小红书和 MiniMax 等首批入盟
本文介绍了上海市成立的人工智能标识生态联盟,该联盟旨在推动人工智能领域的标识技术发展,提高生成内容的透明度和安全性,并通过政策解读和企业合作,为构建可信的人工智能环境奠定基础。
【AiBase提要:】
?? 联盟由上海市委网信办指导,汇聚多家知名企业,目标是提升AI生成内容的透明度和安全性。
?? 国家互联网应急中心和中国电子技术标准化研究院解读相关政策,强调国际规则与中国特色的结合。
?? 小红书、MiniMax等企业参与标识工作实践,探索多种内容的标识方案并积累治理经验。
8、Lightricks发布LTX-Video-13B精炼模型!10秒生成高清AI视频,速度与质量双飞跃!
以色列科技公司Lightricks发布的开源AI视频生成模型LTX-Video-13B精炼模型,以130亿参数为基础,结合多尺度渲染技术和高效量化优化,将视频生成速度提升至10秒以内,同时保持高质量输出。
【AiBase提要:】
?? 采用多尺度渲染技术,10秒内生成高清视频,速度提升5倍以上。
?? 开源模型,支持低显存设备运行,降低AI视频制作成本。
?? 生成速度提升30倍,媲美专业影视作品,重塑内容创作生态。
详情链接:https://github.com/Lightricks/LTX-Video
9、谷歌AlphaEvolve发布!Gemini自进化AI破解数学难题,优化芯片与数据中心,训练速度飙升32.5%
谷歌DeepMind发布的AlphaEvolve是一款结合Gemini大语言模型与进化算法的AI编码代理,它在多个领域展现了强大的自优化能力,包括数据中心调度、芯片设计、AI训练以及数学研究。
【AiBase提要:】
?? Gemini与进化算法结合,解决复杂问题如芯片优化和数学难题。
?? AlphaEvolve优化数据中心调度,回收0.7%全球算力,节省运营成本。
?? 提升AI训练效率,Gemini模型训练速度提升32.5%,展现强大自我优化能力。
10、腾讯元宝浏览器插件尝鲜版上线Chrome
腾讯元宝浏览器插件尝鲜版上线Chrome平台,提供悬浮球、常驻侧边栏和划词工具栏等功能,提升网页浏览与信息处理效率。
【AiBase提要:】
?悬浮球功能支持一键翻译和总结网页内容,轻松跨越语言障碍并节省阅读时间。
??常驻侧边栏可高效答疑,支持截图提问,大幅提升信息获取效率。
??划词工具栏实现选中文本后的即时搜索或翻译,让信息处理更流畅。
详情链接:https://yuanbao.tencent.com/download
福利游戏
相关文章
更多-
- 笔尖AI「智能校对」如何自动检测语法错误?多语言场景适配
- 时间:2025-06-14
-
- 因“自燃率”高:网传北京多所高校禁用罗马仕充电宝
- 时间:2025-06-14
-
- 天热睡觉选开窗还是开空调!医生答案超乎预料
- 时间:2025-06-14
-
- 泡泡玛特Labubu抢购引发打架互殴 律师解读:黄牛与经营企业得担责
- 时间:2025-06-14
-
- 大唐移动德国起诉小米4G专利侵权 专家:中国公司应抱团取暖 而不是自相残杀
- 时间:2025-06-14
-
- 特朗普公司或进军手机市场 特朗普名字或成手机“招牌”
- 时间:2025-06-14
-
- 技术创新获肯定!地平线携HSD亮相香港车博会
- 时间:2025-06-14
-
- 鸿蒙智行5月智能辅助驾驶报告发布 总里程超3.1亿公里
- 时间:2025-06-14
大家都在玩
大家都在看
更多-
- 区块链虚拟货币全球交易平台top10推荐
- 时间:2025-06-13
-
- 以太坊挖矿视频:探秘未来石头的年份
- 时间:2025-06-13
-
- 卢伟冰:REDMI K Pad对标iPad mini!做4K以内体验最豪华的小平板
- 时间:2025-06-13
-
- 雷克萨斯LX 700h同款3.5T V6混动下放!丰田兰德酷路泽HEV官图发布
- 时间:2025-06-13
-
- 通车进入倒计时!在建世界最高桥成功拆除猫道
- 时间:2025-06-13
-
- 2025币圈十大DAI交易所app排行榜
- 时间:2025-06-13
-
- 25.68万元!创维新增HT-i高原版车型:搭载1.5T插混动力
- 时间:2025-06-13
-
- 我国自研水陆两栖大飞机!AG600“鲲龙”完成高高原测试飞行
- 时间:2025-06-13