凡語要想徹底顛覆社交領域,做facebook、twitter的終結者,僅憑當下的完美翻譯遠遠不夠。
還需要更進一步,擁有更多的賣點!
當下社交軟件的交互,不僅侷限於傳統的文字,更是包含視頻、語音等等。
更重要的是,互相之間的綜合交互,例如語音和文字之間的轉譯。
因此,凡人論壇或者凡語,要顛覆整個領域,逃不過與時俱進。
視頻交互容易解決,沒多少難度,然而語音就不同了。
儘管當下智能語音輸入軟件頗多,但精準度以及模糊識別一直是個大問題。
當用戶對着語音輸入法,興奮地說了一堆話,結果識別錯誤頗多,掉字連連,甚至連語義都扭曲了。
至於那些不標準的普通話,以及方言,結果更是慘不忍睹。
說是雞肋都不爲過。
更何況王凡要求的更高!
他想要將一種語言的語音,翻譯成另一種語言的語音。
完美實現不同語言之間的對話交互,而不是單純地侷限在文字上的完美交互。
例如英語和華夏語的對話交互。
這需要將英語的語音,轉爲英文。然後完美翻譯成華夏文,再度讀出來,變成華夏語,從而傳遞給另一個人。
反義亦然。
整個過程要確保準確無誤,尤其是第一個過程,語音到文字,一旦出現錯誤,後面整個過程都會出現問題。
而兩種文字的完美翻譯,當下已經實現,至於最後的文字到語音的閱讀,那更不是問題。
只是如此精準地將語音識別,這種近似“智能”的過程,王凡憑自己的力量當然搞不定。
即便當下全球領先的巨頭,依舊侷限在“模糊識別”的不精確階段。
不過通過系統,一切都將與之不同。
王凡親自挑選了一些語音識別軟件,訊飛、千度、靈犀、雲之聲、googlenow、siri以及微軟cortana。
一番比較,各有千秋。
訊飛、千度、靈犀等,比較適合華夏,但對國際方面的處理不太給力。
而googlenow、siri以及微軟cortana,則擅長國際,很多華夏方面的做不到位。
一番權衡,王凡最終選擇了googlenow,這款綜合性比較優越的語音識別軟件。
在此基礎上,王凡衍生出一款新的語音識別軟件——tt智語。
一番測試,這款語音識別軟件的強大讓王凡讚不絕口。
不僅能智能識別華夏語、英語、俄語、法語等常用語言,還能識別俚語。
即便王凡對着tt智語爆粗口,都能智能識別或模糊轉譯。
之所以有些模糊轉譯,是因爲很多方言或者粗口,太過“高端”,當下還沒有具體的漢字與之對應,連我們都寫不出。
不過很快王凡發現了問題,對於普通話或者近乎普通話,智能識別準確率幾乎百分百。
但對於方言音頻的識別,有些差強人意,準確率只有百分之九十左右。
儘管這一比例已經很高,足夠用戶使用。但作爲系統出品的黑科技,還是有些不夠看。
另外,對於方言音頻的識別,會出現兩個版本。
例如智能識別《咱們屯裡人》時候,出現了兩個結果。
一個是標準的普通話版,一個是直接識別的版本:偶滴老嘎,就組在則個屯。偶系則個屯裡,土生土長滴羊……
而且聯網狀態時,普通話版本處於優先等級。斷網狀態,直接識別版本處於優先等級。
但當王凡選擇直接識別版本後,結果無論聯不聯網,都是直接識別版本處於優先等級。
之後王凡又試驗了一些其他的方言音頻,同樣如此。
只是隨着不斷他的嘗試,和選擇,tt智語識別變地愈加準確,方言正確比率已經提升到97%!
而且版本選擇都是直接識別版本!
王凡忍不住感嘆,tt智語識別不僅識別能力強,更能不斷完善、進步。
通過記錄、分析用戶的習慣,被動擴充方自己的言語音庫,使得識別結果更符合使用者的要求,方言識別準確率也逐步提升。
例如王凡選定直接識別版本,其他的方言音頻也都會優先呈現直接識別版本。
而對於方言的識別精度,也從90%增加到97%。
爲了驗證自己的猜想,王凡又找了些方言音頻讓tt智語測試。
對於不對的地方或者模糊的地方,他同樣進行糾正或做出偏好選擇。
隨着時間的推移,
97.5%,97.9%,98.2%,98.4%,98.5%……
方言識別準確率不斷提升,只是提升的幅度,明顯越來越小。
最後過了兩個小時,依舊沒有從98.7增加到98.8。
儘管98.7%這一數據已經比較令人滿意,只是之後的增幅實在是小的可憐。
無奈之下,王凡只能暫時放棄。
略微休息,王凡開始思考,語言智能識別軟件有了,完美翻譯軟件也有了,只剩下語音朗讀軟件。
這種軟件技術含量很低,應用市場上一大片。
王凡找了幾個,卻不太滿意。
要麼是冷冰冰的機器語言,要麼是有限的幾個明星的聲音,例如郭老師、志玲姐,還有機器貓……
於是王凡再度衍生了一個同聲朗讀軟件。
這個同聲,是指朗讀時,完美模擬之前錄入的聲音。甚至連語氣、語速都模擬的惟妙惟肖。
例如,劉德華唱屯裡人,最後再完美模擬劉德華的聲音,進一步朗讀出來。
最終王凡又將tt智能語音識別、完美翻譯、同聲朗讀,三者合一,成爲一個新的軟件——tt智譯。
tt智譯,可以完美地將一種語言的聲音,轉譯成另一種語言的聲音。
整個過程,說話人的語義、語氣、語速、語音都近乎絲毫不差。
更過分的是,反應速度驚人,整個過程基本實現秒譯!
王凡選定希伯來語輸出,接着對tt智譯說了聲:新年快樂,猴年大吉!
tt智譯立即模仿者王凡的聲音、語氣,用希伯來語回道:猴年大吉。
這讓他有種恍惚的感覺,似乎一下子精通了希伯來語。
王凡疲憊地擡起頭,窗外夜色正濃,時間已經到了深夜……
————
ps:新年快樂,猴年大吉!三更拜年。(第一更!)
感謝愛上撒旦12、大三木、企鵝的哥哥、greenc、小說很小、賬號密碼錶、房價很會、仁心無天、傑傑together、糖水他哥、北極的天龍、宇宙f、漂揚的風等人的打賞。以及紫藤樹花、輝星、我愛水分等人的推薦支持。謝謝。
春節期間不僅正常更新,還加更,連春晚都沒看,一直碼字,求推薦票安慰……