手机打字太慢,语音输入又总出错。商汤输入法AudioClaw想同时解决这两个问题,用AI让语音输入又快又准。
AudioClaw最大的卖点是语音识别+AI润色的一体化处理。你说一段话,它先转成文字,然后AI自动优化表达,去掉口头禅和重复词,最后输出一段通顺的文本。
比如你说:那个,明天下午三点,我们在公司会议室开会,讨论一下下季度的销售计划,嗯,大家记得准备一下资料。
普通语音输入会原样转写,包括那个嗯这些语气词。AudioClaw会优化成:明天下午三点在公司会议室开会,讨论下季度销售计划,请大家提前准备资料。
准确率怎么样
在安静环境下,普通话识别准确率能达到95%以上。带一点口音的普通话也能识别,但准确率会降到85%左右。
比较惊喜的是专业术语识别。我测试了医学、法律、IT几个领域的术语,大部分都能正确识别,比通用输入法好很多。这应该是商汤在垂直领域做了专门训练。
多人对话场景也能区分不同说话人,生成带说话人标签的文字稿。对于会议纪要这类需求很实用。
实时翻译功能
除了语音转文字,AudioClaw还支持边说边翻译。你说中文,对方手机显示英文,延迟大概1-2秒。支持中英日韩四种语言的互译。
翻译质量属于可用级别,日常对话没问题,但复杂的专业讨论还是会有偏差。适合旅游、商务洽谈这类场景。
使用场景
移动办公:在地铁上、咖啡厅里回邮件、写文档,不用掏键盘,说话就行。
会议纪要:开会时打开录音转写,自动出文字稿,还能区分不同发言人。
内容创作:写长文的时候先用语音说思路,AI润色后再手动调整,比直接打字快。
不足之处
离线功能比较弱,大部分AI功能需要联网。在信号不好的地方,识别准确率会明显下降。
另外,目前只支持Android,iOS版还在开发中。苹果用户暂时用不上。
价格
基础功能免费,包括语音输入、简单润色。高级功能如实时翻译、专业术语库、批量转写需要订阅,19元每月。
