科技
1 天前
谷歌在 Gboard 中添加了由 Gemini 支持的听写功能,这对于听写初创公司来说可能是个坏消息
谷歌的转录功能将首先在三星 Galaxy 和 Google Pixel 手机上推出
周二上午,谷歌在其 Android Show:I/O Edition 2026 活动上宣布推出 Rambler,这是一款针对广泛使用的 Android 键盘应用 Gboard 的全新人工智能语音听写功能。此次发布使谷歌与 Wispr Flow 和 Typeless 等应用程序展开直接竞争,后者是一批不断壮大的人工智能听写应用程序,近年来在桌面和移动设备上吸引了受众,其中大多数尚未在 Android 上站稳脚跟。
就像其他听写应用程序一样,Ramber 删除了“ums”和“ahs”等填充词。它还可以理解句子中间的更正,例如“我将在星期三下午 3 点在我们常去的咖啡店见面……嗯,下午 2 点。”
谷歌表示,它正在使用基于 Gemini 的多语言模型,该模型也支持代码切换。代码切换意味着用户可以在句子中间切换不同语言(例如,从英语到印地语),而 Rambler 会跟着切换而不会丢失上下文。这项功能反映了有多少多语言使用者实际进行交流,而大多数西方听写应用程序对这一功能的支持速度很慢。
该公司表示,Gboard 将向用户明确表明 Rambler 功能正在使用中。它不存储任何录音,仅使用音频来转录用户所说的内容。谷歌在简报中提到,由于你可以在所有应用程序中使用 Rambler 功能,这就像“重新发明键盘”。
正在加载播放器...
在隐私方面,Android 核心体验总监本·格林伍德 (Ben Greenwood) 表示,谷歌结合使用设备端处理和基于云的处理,并“多年来进行了大量投资”,以确保功能“安全和私密”——这是向用户传达的经过深思熟虑的信息,让用户权衡 Rambler 与可能以不同方式处理数据的第三方听写应用程序。
在过去的几年里,出现了许多听写应用程序——Wispr Flow、Willow、SuperWhisper、Monogogue、Handy 和 Typeless。但到目前为止,大部分活动都发生在桌面和 iOS 上,而 Android 的服务相对不足。谷歌本身上个月在 iOS 上发布了 AI Edge Eloquent,这是一款离线优先的听写应用程序,由其设备上的 Gemma AI 模型提供支持。
Rambler 是 Google 迄今为止为缩小这一差距而采取的最明确的举措。这些新功能将仅限于三星 Galaxy 和 Google Pixel 手机,最初在夏季推出,但最终将覆盖其他 Android 设备。这里的核心优势是分布:Gboard 是全球绝大多数 Android 用户的默认键盘,这意味着 Rambler 已为数亿人预装。当平台参与者进入操作系统级别的市场时,独立应用程序需要一个令人信服的理由——更高的准确性、更深入的功能或更强的隐私保证——来证明单独下载的合理性。
对于听写初创公司来说,问题不再是他们是否可以开发出好的东西,而是他们是否可以开发出足够好的东西让用户积极寻找它。
原文
Google adds Gemini-powered Dictation to Gboard, which could be bad news for dictation startups
Google's transcription feature will initially launch with Samsung Galaxy and Google Pixel phones