位置:首页 > 新闻资讯 > AI日报:腾讯元宝升级一句话搜索图片视频;微信支付MCP上线;谷歌在全球推出 Veo 3

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、腾讯元宝再升级:一句话搜索,图片视频即刻呈现,信息获取更直观!

腾讯元宝的升级功能让信息获取更加直观和高效,用户只需一句话提问即可获得图文并茂的回答,无论是学习新技能还是解决生活难题都变得更加简单。

【AiBase提要:】

?? 一句话搜索,智能匹配图片和视频号内容

?? 学习新技能更直观,提供手把手教学体验

?? 生活小问题也能轻松解决,化身生活小百科

2、微信支付MCP上线:AI与支付的完美结合,开启商业新纪元

微信支付MCP的推出为AI商业化带来了新的可能性,不仅拓宽了AI应用的盈利模式,还通过数据闭环提升了商业效率。

【AiBase提要:】

?? MCP功能为AI应用提供了新的盈利渠道,用户可直接通过支付完成服务获取。

?? MCP构建了数据闭环,使商家能实时调整服务内容和价格以优化ROI。

?? 交易数据成为AI优化服务的来源,提升用户生命周期价值并创造更多盈利机会。

详情链接:https://yuanqi.tencent.com/mcp-shop

3、谷歌Veo3视频生成模型向 Pro / Ultra 会员开放,将新增“照片生成视频”功能

谷歌最新一代AI文生视频模型Veo3已向Google AI Pro和Ultra会员开放,凭借高清画质、音画同步能力和多模态创作功能,成为AI视频生成领域的焦点。其在影视制作、广告营销等领域展现出巨大潜力,并计划新增‘照片生成视频’功能。

【AiBase提要:】

?? Veo3支持生成1080p高清视频,内部测试可达4K分辨率,画面细节丰富且逼真。

?? 首款支持视频与音频同步生成的模型,可自动生成环境音效、角色对白和背景音乐。

?? 支持文字或图像输入生成视频,适用于复杂提示词指令和多镜头叙事,提升创作效率。

4、开源 DeepSeek R1增强版:推理效率提升200%,降低成本

文章详细介绍了DeepSeek-TNG-R1T2-Chimera的创新AoE架构及其在推理效率和性能上的突破,同时分析了MoE架构的优势及权重合并优化技术的应用。

【AiBase提要:】

?? AoE架构通过优化MoE模型,提升推理性能并节省token输出。

?? Chimera版本在MTBench和AIME-2024测试中表现优于普通R1版本。

?? 权重合并与优化技术显著降低模型复杂性和计算成本。

详情链接:https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera

5、美图WHEE推出“一句话修图”功能

WHEE推出的“一句话修图”功能,让用户通过简单的语音指令即可完成复杂的修图操作,极大提升了用户体验。

【AiBase提要:】

??? 通过简单的一句话,用户可以轻松实现修图效果,无需繁琐操作。

??? 支持多种风格切换,如未来感、怀旧文艺范等,满足不同需求。

?? 可以添加或去除文字,精准处理照片中的文字内容。

6、芯片设计公司Ambiq Micro申请美国 IPO,受益于生成式AI推动的市场需求

Ambiq Micro 在2024年实现了16.1%的净销售额增长,尽管仍处于亏损状态,但其在超低功耗半导体领域的技术优势使其在边缘AI市场占据有利地位。公司计划通过IPO筹集资金用于产品开发和市场扩展,同时面临客户集中风险的问题。

【AiBase提要:】

?? Ambiq Micro 在 IPO 申请中报告2024年净销售额增长16.1%,达到7610万美元。

?? 尽管实现销售增长,但公司在2024年仍亏损3970万美元,面临客户集中风险。

?? 公司专注于超低功耗半导体,目标是 “边缘 AI” 市场,满足对高效能芯片的需求。

7、昆仑万维再次开源奖励模型Skywork-Reward-V2

昆仑万维开源了第二代奖励模型Skywork-Reward-V2系列,涵盖8个不同参数规模的模型,在多个主流评测榜单中取得最优成绩。该系列基于高质量混合数据集构建,展现出强大的泛化能力和实用性。

【AiBase提要:】

? Skywork-Reward-V2系列包含8个模型,参数从6亿到80亿不等,全面超越当前最优水平。

?? 构建了4000万对偏好对比的数据集,采用人机协同两阶段流程提升数据质量。

?? 在多个评估基准上表现优异,尤其在通用偏好、正确性及高级能力测试中领先。

详情链接:https://huggingface.co/collections/Skywork/skywork-reward-v2-685cc86ce5d9c9e4be500c84

8、开源革命!Kyutai TTS发布:超低延迟语音合成,AI语音新纪元来袭!

Kyutai TTS的发布标志着开源AI语音技术迈入新阶段,其超低延迟、高精度语音输出及多语言支持为开发者提供了强大的工具,推动了语音交互技术的普及与创新。

【AiBase提要:】

?? Kyutai TTS支持文本流式传输,延迟低至350毫秒,显著提升实时语音交互体验。

?? 语音生成精准度高,英语和法语的词错误率分别低至2.82和3.29,同时支持单词时间戳输出。

?? 开源模式允许自由使用、修改和分发,推动全球AI社区创新与技术进步。

详情链接:https://kyutai.org/next/tts

9、Figma 拟以约200亿美元估值登陆纽交所,AI 设计未来可期

Figma拟以200亿美元估值登陆纽交所,凭借其财务稳健性、技术创新和市场扩展战略,展现了强大的增长潜力。

【AiBase提要:】

?? Figma计划以约200亿美元估值在纽交所上市,成为2025年备受瞩目的科技IPO之一。

?? 财务表现强劲,2024年收入达7.49亿美元,且拥有15.4亿美元现金储备。

?? Figma积极布局AI技术,推出Figma Make等工具,未来将整合生成式AI优化设计流程。

10.字节跳动开源 Trae-Agent,助力智能开发新体验

字节跳动开源 Trae-Agent,提升编程效率,支持多语言模型,提供强大开发工具。

【AiBase 提要:】

?? ** 多模型支持 **:兼容 OpenAI 等多种语言模型,灵活适配开发需求。

??? ** 功能集成 **:内置文件编辑和脚本执行,支持复杂编程场景。

?? ** 日志记录 **:自动保存操作日志,提升开发透明度与调试便利性。

产品链接:[Trae-Agent GitHub](https://github.com/trae-agent)

福利游戏

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多