繼林志玲、郭德綱之后,羅永浩語音包也于近日上線高德導航,以后飆車的時候可以聽到:“我不是為了輸贏,我就是認真”簡直激動得不能自已!
那么問題來了,高德是如何把羅永浩、林志玲、郭德綱的聲音裝進導航里的呢?難不成真是一句一句錄下來的?
ZEALER向我們進行了揭秘,原來,語音導航內(nèi)容可以分為兩部分:簡單的和復雜的。
簡單的,比如直行、左轉(zhuǎn)、掉頭……真的就是羅永浩、林志玲親自錄下來的。
而比較長的句子則要用到TTS(Text To Speech)技術(shù)了,也就是文本轉(zhuǎn)語音技術(shù),包括Siri、谷歌翻譯用的就是這一技術(shù)。通過計算機語音合成,可以將任意文本轉(zhuǎn)換成具有高自然度的語音。
原理上,只要讓林志玲姐姐把漢語中的21個聲母、37個韻母、5個聲調(diào)組合的不超過3000個語音全部錄一次,播放時,再把每個字的語音串起來就可以了。
這就好比活字印刷術(shù),志玲姐姐每個字的發(fā)音都是一個單字,TTS會把這些單字重新排列組合成導航里的長句子。
雖然組字成句聽起來略顯生硬,但隨著TTS語音技術(shù)的發(fā)展,自然度已經(jīng)越來越高了。
視頻地址:點此。