看到搜狗还好意思推出智能录音产品,我就觉得挺有勇气的,听说2020年转录文字还收费了,我就觉得挺诧异的,这种几乎无用的东西怎么好意思收钱呢?作为一个智能录音笔的受害者,我觉得必须要用一句手机圈的热点文案回应,搜狗智能录音笔的“方向错了”。
我是有搜狗录音笔和搜狗翻译机的,这个产品刚推出的时候因为转录免费得到了很多媒体人的认同,觉得采访这下有救了。据说搜狗给很多媒体同行都免费送了一个,一开始我以为是送了让大家用,后来觉得应该是害怕大家买了用得不好会骂街,所以就先送一个,这样即便是不好用,起码大家没花钱也不好意思说什么。
和广告说的不同,如果用网上一句话来评价这个产品的话那大概就是“录音五分钟,修改一小时”,当然如果你采访的是央视播音员可能会好一些,反正我经过一些会议录音确实已经放弃了。这里我临时录了一段马云的演讲,供大家参考效果,大概就能理解我所说的,你对着录音要再改一遍的时间消耗。为了方便大家对比,我手头正好还有一个讯飞的智能录音笔,你就知道为什么讯飞录的这个修改起来就容易得多,基本不用听着录音修改了。个人认为,讯飞在识别和语句逻辑上领先的不是一丁半点,即便识别不准确,但语句是通顺的,修改起来就容易很多。
而这次搜狗出的智能录音产品是一个高端产品,所谓的高端产品本质上就是一个简单的手机,可以插SIM卡用来实现在线转文字以及翻译,坦白说和装在手机里的APP没有什么不同,差别只是在于收音能力更为强大,所以识别效果上我不认为有什么本质提升。但你知道它的另一个问题在哪吗?它像手机一样,有待机问题。相信媒体记者不是天天都在采访录音,像我这样经常演讲培训的人反而录音笔用的频次更高一些,你知道当你想用一款录音笔但是它没有电的时候会是多么抓狂吗?这件事情其实出现在我用的这个搜狗翻译机上,在我飞10个小时落地过海关的时候拿出来它正好没电了。
所以在我看来,录音笔首先要录音,其次要大部分时间有电,待机要久一点,关机时耗电低一点。手机这种东西大家知道的,即便你关了机,很多手机也待不了多久就没电了。而录音笔的电池远小于手机,没电更是没得让你出其不意。所以翻译这种场景建议大家还是用手机算了,买翻译机给家长也没有问题,但一定要买小屏的,屏幕越差越好,这样待机的时间能变得更长。所以如果你一定要做触控大彩屏的翻译机,请务必把PD快充做上,不然不是用的时候没电就是录着录着没电了。
说实话我现在重新用回了索尼的录音笔,就好像获得了新生,一个最简单的道理就是它时刻都有电。之前用的搜狗录音笔还有一个比较尴尬的点就是“录音半小时,传输20分钟”,用数据线吗?抱歉我不想带那么多线。而我的索尼录音笔则自带USB,插到电脑上,边传输边充电,瞬间传输完成,短时间就能满电。所以如果一定要做无线传输,麻烦还是跟华为商量一下,看看能不能把“一碰传”技术共享一下,把传输速度提上去。不然要是录了三四个小时,传输起来岂不是要崩溃了。我这个还是最普通的录音,如果是高清录音,文件恐怕比这个要大得多,那传输起来可就更可怕了。你说我有WiFi啊,还可以用4G上传啊,想到一小时高清录音文件的大小那我只能祝你好运了。
至于说同声传译这个功能,第一大部分用不到,第二搜索“搜狗同声传译 笑话”,是不是有刚才翻译的味儿了。
当然不断翻车下的不断努力,还是有机会,但目前这个水平,我觉得还是把什么转录收费取消了吧。怎么好意思收相信你的人的钱呢?
那么你可能要问了,语音识别难道真的不能用来写作或者采访吗?这你就错了,我这篇文章也是用语音写的,所用的产品是一个讯飞智能鼠标,这里没有收讯飞的钱也不多做广告了,反正这个鼠标写作起来非常方便,除了需要一个USB接收器,我还是推荐给了很多文字同行,识别率和效率都好很多。
而录音转文字这件事情我也在使用,我的使用方法是索尼录音笔加讯飞的收费转录,转录一小时录音大概也就十分钟,直接从网上下载转录好的Word版本就可以。前段时间刚用这个方法进行了一次远程采访,对录音的识别还是完全可用。很多了解这个领域的人就会知道,识别人的说话录音和识别网络电话录音,难度还是不太一样的。这个事情也不多说了只是推荐大家了解。
这篇文章没有什么利益相关,纯粹是一个语音输入的高度依赖者的吐槽。因为文字工作者对这种输入方式期待往往很高,他们一遍一遍的被颠覆革命所忽悠,最后用起来产品却非常痛苦,痛苦就算了,还不好意思说,所以只好我来说。毕竟大家的时间都非常宝贵,浪费在这种地方确实难过。
在这里首先希望搜狗能够提升自己的转文字水平,不管识别率是95%还是98%,先把识别的句子搞通顺。我明白搜狗想商业模式转型,想增加一些人工智能方面的输出和收费,但我觉得目前的水平还达不到收费的标准,距离可使用都尚有些许差距。如果效率不能比手打更高,那这种智能识别即便有一些准确度,那也完全没有意义。
其次不要为了智能而智能,多考虑充电和待机,能不能和手机充电保持一致?能不能用充电宝快充?能不能用更快的蓝牙混合传输?能不能把4G模块卸了,少让大家花点流量少办一张电话卡,和手机连一下不就行了么。为什么非要装这么一个耗电巨大的东西呢?最后就是在识别句子没有办法很通顺的情况下,先免费,不要吃相那么难看。同声传译之类的先测试,不要拿出去开会就翻车。不要老觉得想替代人类,先把基础的工作做好。
对于整个智能产品来说我觉得大家也不要为了智能而智能,不要为了触屏而触屏,不要为了高清而高清,多考虑一下待机和充电,考虑一下和电脑的互传互动,和手机的数据共享连接。产品做得更轻一些,价格更便宜一些,使用效率更好一些,真正解放文字工作者,而不是弄一些噱头抬股价。