位置:首页 > 安卓教程 > Canonical Myna本地语音转文字:Ubuntu 26.10 AI听写功能

Canonical Myna本地语音转文字:Ubuntu 26.10 AI听写功能

时间:2026-06-19  |  作者:318050  |  阅读:0

6月17日,Canonical正式公布了一项名为Project Myna的新项目。

目标是:在Ubuntu桌面操作系统中实现原生语音转文字功能

项目名字取自擅长模仿人类说话的鹩哥(八哥)——Myna。首个版本计划随Ubuntu 26.10(代号Stonking Stingray)一同发布,并成为Ubuntu桌面体验的核心组成部分。

Canonical 推出本地语音转文字项目 Myna,为 Ubuntu 26.10 引入 AI 听写功能

功能定位:纯听写工具,非语音助手

Myna被定位为原生桌面听写工具,不是语音助手,也不是语音控制系统。

用户只需按下键盘快捷键即可开始说话。转录后的文字会直接插入当前应用程序中。整个听写过程有明确的视觉反馈。

功能范围刻意收窄,首版不涉及以下功能:

  • 语音助手
  • 语音命令
  • 桌面控制
  • 翻译工具
  • 自动语言检测

目标就是将基础听写体验做扎实。

技术架构:本地AI模型,离线运行

Myna使用AI语音识别模型,所有任务都在用户本地机器上运行。下载安装模型后,完全不需要互联网连接。这对隐私敏感的场景是重要加分项。

首版以Wayland上的Ubuntu桌面为目标,GNOME是主要验证环境。架构保持开放,未来可以支持更多桌面环境。

隐私保护:数据不上传,用完即弃

隐私方面做了周全考虑:

  • 麦克风仅在用户主动激活听写时才会被访问
  • 音频数据在内存中处理后立即被丢弃,不会上传到任何外部服务

整体采用模块化设计:语音识别、用户交互、听写管理和文本注入分别由独立组件处理。这样后续可以对各部分单独改进,不影响整体体验。

社区参与:欢迎反馈,源码已公开

Canonical桌面团队成员Jean Baptiste Lallement表示,团队希望在“过多设计决策固定下来之前”获得社区反馈。

特别欢迎以下用户参与:

  • 依赖听写或辅助技术的用户
  • 已在Linux上使用语音识别的用户
  • 开发者、测试人员以及文档编写者

项目源码和架构文档已在GPLv3协议下托管于GitHub。

未来规划:持续优化,听写更自然准确

在Ubuntu 26.10之后,Canonical计划持续改善Myna与桌面的集成度,并探索让听写更自然、更准确的方法。

后续功能的优先级将取决于早期用户反馈和更多社区意见。

来源:整理自互联网
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多