第一百四十九章 tt智译
推荐阅读:神印王座II皓月当空、深空彼岸、弃宇宙、全职艺术家、第九特区、龙王殿、重生之都市仙尊、财运天降、花娇、好想住你隔壁
一秒记住【思路客小说 www.siluke8.com】,精彩小说无弹窗免费阅读!
凡语要想彻底颠覆社交领域,做k、r的终结者,仅凭当下的完美翻译远远不够。
还需要更进一步,拥有更多的卖点!
当下社交软件的交互,不仅局限于传统的文字,更是包含视频、语音等等。
更重要的是,互相之间的综合交互,例如语音和文字之间的转译。
因此,凡人论坛或者凡语,要颠覆整个领域,逃不过与时俱进。
视频交互容易解决,没多少难度,然而语音就不同了。
尽管当下智能语音输入软件颇多,但精准度以及模糊识别一直是个大问题。
当用户对着语音输入法,兴奋地说了一堆话,结果识别错误颇多,掉字连连,甚至连语义都扭曲了。
至于那些不标准的普通话,以及方言,结果更是惨不忍睹。
说是鸡肋都不为过。
更何况王凡要求的更高!
他想要将一种语言的语音,翻译成另一种语言的语音。
完美实现不同语言之间的对话交互,而不是单纯地局限在文字上的完美交互。
例如英语和华夏语的对话交互。
这需要将英语的语音,转为英文。然后完美翻译成华夏文,再度读出来,变成华夏语,从而传递给另一个人。
反义亦然。
整个过程要确保准确无误,尤其是第一个过程,语音到文字,一旦出现错误,后面整个过程都会出现问题。
而两种文字的完美翻译,当下已经实现,至于最后的文字到语音的阅读,那更不是问题。
只是如此精准地将语音识别,这种近似“智能”的过程,王凡凭自己的力量当然搞不定。
即便当下全球领先的巨头,依旧局限在“模糊识别”的不精确阶段。
不过通过科技衍生系统,一切都将与之不同。
王凡亲自挑选了一些语音识别软件,讯飞、千度、灵犀、云之声、、siri以及微软rtana。
一番比较,各有千秋。
讯飞、千度、灵犀等,比较适合华夏,但对国际方面的处理不太给力。
而、siri以及微软rtana,则擅长国际,很多华夏方面的做不到位。
一番权衡,王凡最终选择了,这款综合性比较优越的语音识别软件。
在此基础上,王凡衍生出一款新的语音识别软件——tt智语。
一番测试,这款语音识别软件的强大让王凡赞不绝口。
不仅能智能识别华夏语、英语、俄语、法语等常用语言,还能识别俚语。
即便王凡对着tt智语爆粗口,都能智能识别或模糊转译。
之所以有些模糊转译,是因为很多方言或者粗口,太过“高端”,当下还没有具体的汉字与之对应,连我们都写不出。
不过很快王凡发现了问题,对于普通话或者近乎普通话,智能识别准确率几乎百分百。
但对于方言音频的识别,有些差强人意,准确率只有百分之九十左右。
尽管这一比例已经很高,足够用户使用。但作为系统出品的黑科技,还是有些不够看。
另外,对于方言音频的识别,会出现两个版本。
例如智能识别《咱们屯里人》时候,出现了两个结果。
一个是标准的普通话版,一个是直接识别的版本:偶滴老嘎,就组在则个屯。偶系则个屯里,土生土长滴羊……
而且联网状态时,普通话版本处于优先等级。断网状态,直接识别版本处于优先等级。
但当王凡选择直接识别版本后,结果无论联不联网,都是直接识别版本处于优先等级。
之后王凡又试验了一些其他的方言音频,同样如此。
只是随着不断他的尝试,和选择,tt智语识别变地愈加准确,方言正确比率已经提升到97%!
而且版本选择都是直接识别版本!
王凡忍不住感叹,tt智语识别不仅识别能力强,更能不断完善、进步。
通过记录、分析用户的习惯,被动扩充方自己的言语音库,使得识别结果更符合使用者的要求,方言识别准确率也逐步提升。
例如王凡选定直接识别版本,其他的方言音频也都会优先呈现直接识别版本。
而对于方言的识别精度,也从90%增加到97%。
为了验证自己的猜想,王凡又找了些方言音频让tt智语测试。
对于不对的地方或者模糊的地方,他同样进行纠正或做出偏好选择。
随着时间的推移,
97.5%,97.9%,98.2%,98.4%,98.5%……
方言识别准确率不断提升,只是提升的幅度,明显越来越小。
最后过了两个小时,依旧没有从98.7增加到98.8。
尽管98.7%这一数据已经比较令人满意,只是之后的增幅实在是小的可怜。
无奈之下,王凡只能暂时放弃。
略微休息,王凡开始思考,语言智能识别软件有了,完美翻译软件也有了,只剩下语音朗读软件。
这种软件技术含量很低,应用市场上一大片。
王凡找了几个,却不太满意。
要么是冷冰冰的机器语言,要么是有限的几个明星的声音,例如郭老师、志玲姐,还有机器猫……
于是王凡再度衍生了一个同声朗读软件。
这个同声,是指朗读时,完美模拟之前录入的声音。甚至连语气、语速都模拟的惟妙惟肖。
例如,刘德华唱屯里人,最后再完美模拟刘德华的声音,进一步朗读出来。
最终王凡又将tt智能语音识别、完美翻译、同声朗读,三者合一,成为一个新的软件——tt智译。
tt智译,可以完美地将一种语言的声音,转译成另一种语言的声音。
整个过程,说话人的语义、语气、语速、语音都近乎丝毫不差。
更过分的是,反应速度惊人,整个过程基本实现秒译!
王凡选定希伯来语输出,接着对tt智译说了声:新年快乐,猴年大吉!
tt智译立即模仿者王凡的声音、语气,用希伯来语回道:猴年大吉。
这让他有种恍惚的感觉,似乎一下子精通了希伯来语。
王凡疲惫地抬起头,窗外夜色正浓,时间已经到了深夜……
————
ps:新年快乐,猴年大吉!三更拜年。(第一更!)
感谢爱上撒旦12、大三木、企鹅的哥哥、、小说很小、账号密码表、房价很会、仁心无天、杰杰her、糖水他哥、北极的天龙、宇宙f、漂扬的风等人的打赏。以及紫藤树花、辉星、我爱水分等人的推荐支持。谢谢。
春节期间不仅正常更新,还加更,连春晚都没看,一直码字,求推荐票安慰……
凡语要想彻底颠覆社交领域,做k、r的终结者,仅凭当下的完美翻译远远不够。
还需要更进一步,拥有更多的卖点!
当下社交软件的交互,不仅局限于传统的文字,更是包含视频、语音等等。
更重要的是,互相之间的综合交互,例如语音和文字之间的转译。
因此,凡人论坛或者凡语,要颠覆整个领域,逃不过与时俱进。
视频交互容易解决,没多少难度,然而语音就不同了。
尽管当下智能语音输入软件颇多,但精准度以及模糊识别一直是个大问题。
当用户对着语音输入法,兴奋地说了一堆话,结果识别错误颇多,掉字连连,甚至连语义都扭曲了。
至于那些不标准的普通话,以及方言,结果更是惨不忍睹。
说是鸡肋都不为过。
更何况王凡要求的更高!
他想要将一种语言的语音,翻译成另一种语言的语音。
完美实现不同语言之间的对话交互,而不是单纯地局限在文字上的完美交互。
例如英语和华夏语的对话交互。
这需要将英语的语音,转为英文。然后完美翻译成华夏文,再度读出来,变成华夏语,从而传递给另一个人。
反义亦然。
整个过程要确保准确无误,尤其是第一个过程,语音到文字,一旦出现错误,后面整个过程都会出现问题。
而两种文字的完美翻译,当下已经实现,至于最后的文字到语音的阅读,那更不是问题。
只是如此精准地将语音识别,这种近似“智能”的过程,王凡凭自己的力量当然搞不定。
即便当下全球领先的巨头,依旧局限在“模糊识别”的不精确阶段。
不过通过科技衍生系统,一切都将与之不同。
王凡亲自挑选了一些语音识别软件,讯飞、千度、灵犀、云之声、、siri以及微软rtana。
一番比较,各有千秋。
讯飞、千度、灵犀等,比较适合华夏,但对国际方面的处理不太给力。
而、siri以及微软rtana,则擅长国际,很多华夏方面的做不到位。
一番权衡,王凡最终选择了,这款综合性比较优越的语音识别软件。
在此基础上,王凡衍生出一款新的语音识别软件——tt智语。
一番测试,这款语音识别软件的强大让王凡赞不绝口。
不仅能智能识别华夏语、英语、俄语、法语等常用语言,还能识别俚语。
即便王凡对着tt智语爆粗口,都能智能识别或模糊转译。
之所以有些模糊转译,是因为很多方言或者粗口,太过“高端”,当下还没有具体的汉字与之对应,连我们都写不出。
不过很快王凡发现了问题,对于普通话或者近乎普通话,智能识别准确率几乎百分百。
但对于方言音频的识别,有些差强人意,准确率只有百分之九十左右。
尽管这一比例已经很高,足够用户使用。但作为系统出品的黑科技,还是有些不够看。
另外,对于方言音频的识别,会出现两个版本。
例如智能识别《咱们屯里人》时候,出现了两个结果。
一个是标准的普通话版,一个是直接识别的版本:偶滴老嘎,就组在则个屯。偶系则个屯里,土生土长滴羊……
而且联网状态时,普通话版本处于优先等级。断网状态,直接识别版本处于优先等级。
但当王凡选择直接识别版本后,结果无论联不联网,都是直接识别版本处于优先等级。
之后王凡又试验了一些其他的方言音频,同样如此。
只是随着不断他的尝试,和选择,tt智语识别变地愈加准确,方言正确比率已经提升到97%!
而且版本选择都是直接识别版本!
王凡忍不住感叹,tt智语识别不仅识别能力强,更能不断完善、进步。
通过记录、分析用户的习惯,被动扩充方自己的言语音库,使得识别结果更符合使用者的要求,方言识别准确率也逐步提升。
例如王凡选定直接识别版本,其他的方言音频也都会优先呈现直接识别版本。
而对于方言的识别精度,也从90%增加到97%。
为了验证自己的猜想,王凡又找了些方言音频让tt智语测试。
对于不对的地方或者模糊的地方,他同样进行纠正或做出偏好选择。
随着时间的推移,
97.5%,97.9%,98.2%,98.4%,98.5%……
方言识别准确率不断提升,只是提升的幅度,明显越来越小。
最后过了两个小时,依旧没有从98.7增加到98.8。
尽管98.7%这一数据已经比较令人满意,只是之后的增幅实在是小的可怜。
无奈之下,王凡只能暂时放弃。
略微休息,王凡开始思考,语言智能识别软件有了,完美翻译软件也有了,只剩下语音朗读软件。
这种软件技术含量很低,应用市场上一大片。
王凡找了几个,却不太满意。
要么是冷冰冰的机器语言,要么是有限的几个明星的声音,例如郭老师、志玲姐,还有机器猫……
于是王凡再度衍生了一个同声朗读软件。
这个同声,是指朗读时,完美模拟之前录入的声音。甚至连语气、语速都模拟的惟妙惟肖。
例如,刘德华唱屯里人,最后再完美模拟刘德华的声音,进一步朗读出来。
最终王凡又将tt智能语音识别、完美翻译、同声朗读,三者合一,成为一个新的软件——tt智译。
tt智译,可以完美地将一种语言的声音,转译成另一种语言的声音。
整个过程,说话人的语义、语气、语速、语音都近乎丝毫不差。
更过分的是,反应速度惊人,整个过程基本实现秒译!
王凡选定希伯来语输出,接着对tt智译说了声:新年快乐,猴年大吉!
tt智译立即模仿者王凡的声音、语气,用希伯来语回道:猴年大吉。
这让他有种恍惚的感觉,似乎一下子精通了希伯来语。
王凡疲惫地抬起头,窗外夜色正浓,时间已经到了深夜……
————
ps:新年快乐,猴年大吉!三更拜年。(第一更!)
感谢爱上撒旦12、大三木、企鹅的哥哥、、小说很小、账号密码表、房价很会、仁心无天、杰杰her、糖水他哥、北极的天龙、宇宙f、漂扬的风等人的打赏。以及紫藤树花、辉星、我爱水分等人的推荐支持。谢谢。
春节期间不仅正常更新,还加更,连春晚都没看,一直码字,求推荐票安慰……