7月16日,语音输入创企Willow Voice宣布完成420万美元天使融资,由YC领投;紧接着几天前,6月25日另一家语音输入创企Wispr Flow也宣布完成了3000万美元A轮融资。
一直以来,AI语音赛道备受瞩目,但融资多集中于语音合成领域,如头部公司ElevenLabs在今年1月完成了2.5亿美元C轮融资,估值超过30亿美元。
然而,最近的这两笔融资似乎传递了一个信号:专注于“输入”的语音创企正逐渐获得资本的关注。
Willow Voice和Wispr Flow(下文简称Willow和Flow)专注于ASR技术(自动语音识别),两款产品相似,均提供类似“语音输入法”的功能,用户只需按下按钮,即可将讲话内容转录成文字。
尽管这一功能在日常生活和工作中已经较为常见,如微信在2019年推出了“语音转文字”功能,苹果在2012年的iOS 6中也上线了“语音听写”功能,且AI时代的明星创企如ElevenLabs、OpenAI等也覆盖了这一场景,但这两家公司的融资情况表明,市场对这类技术的需求仍然存在。
根据VoiceWriter.io的测试,多数产品的错词率在非格式化文本场景下低于10%,与未经专业训练的人类水平相当。但在格式化文本场景中,由于需要正确输出标点和大小写,所有产品的错词率平均增加了10%。尽管如此,这并未阻止市场对这类技术的投资。
Flow创始人Tanay Kothari在播客中表示,尽管AI在非格式化文本转录时的WER已经很低,但用户仍无法完全信任AI。因此,Flow追求“零编辑信息”,在“AI直接转录内容”和“输出内容”之间增加了“文字处理”的步骤,以提供更准确、可直接使用的文字。
从产品逻辑上看,Flow和Willow完成了“口语输入”到“书面语输出”的流程,因此其使用场景更偏向办公场景。
a16z的年终AI产品盘点中,ElevenLabs的首席设计师和创业者都推荐过Flow,且几乎每天使用。这表明其目标用户主要是硅谷的VC/创业者/高管群体。
然而,由于语音输入相比键盘输入对周围的影响更大,因此更适合在固定工位使用。因此,Flow最初瞄准的是有高效输入需求且经常在外处理工作的用户群体。
鉴于“工作状态下的文本输入”及“非办公室”两个特点,我们设定了To do List、邮件回复、会前备忘录三个场景进行测试。结果显示,Flow和Willow在关键信息识别方面表现良好,但在专业术语和正式文风方面仍存在不足。
虽然Flow和Willow在专业术语和正式文风等场景中距离“零编辑”还有一定差距,但根据媒体报道,Flow的用户粘性和付费率都相当高。截至目前,Wispr Flow的用户规模月环比增长超50%,6个月活跃用户留存率达到80%,付费率高达19%,年收入已达到380万美元。
未能达成“零编辑”目标与用户付费之间,是Flow这类产品虽然还不能让用户完全不动手、但已经提供了差异化的体验。不少用户在Reddit和Product Hunt上表示,在不是那么正式的输入场景下,Flow表现得比其他产品好很多。
Flow的超高粘性和付费率反映出通过语音输入减少人机交互的“摩擦”、实现提效是一个可行方案。随着大模型能力的进一步提升与数据的积累,未来Flow和Willow有望在这一领域取得更大进展。
本文由主机测评网于2026-04-19发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260438585.html