時間:2017-08-19 11:15:45 作者:琪琪 瀏覽量:93

語音識別令人滿意
就在昨天老羅的錘子新機發布會上,科大訊飛的語音輸入又被帶起了一波節奏,出于對所謂各種發布會慣常性夸大其辭的質疑,我們特別親身對這款輸入法的識別效果進行了一個簡單的測試,看看是不是真的得出和老羅一樣的效果。
經過測試我們發現,在正常的語速環境下,訊飛輸入法的識別效果還是讓人滿意的,這段文本是我們使用語音輸入得出的結果。鑒于測試者的普通話水平還是比較靠譜的,所以具備一定的參考價值:
“北京時間10月19日消息,維基解密創始人阿桑奇早前承諾,將會在11月7日之前曝光一批新的美國總統大選文檔。現在爆料來了,其中一批文檔顯示,希拉里團隊擬定的副總統人選名單里,蘋果CEO庫克的名字赫然在列。”


慢語速下結果(左)和快語速下結果(右)
可以看到在前面較慢的語速下,訊飛輸入法的識別是100%的還原了文檔,而在較快的語速中則出現了部分錯誤。這部分錯誤經過我們的回溯,主要是由于發音的連讀導致的,也就是說即使是在較快的語速中,訊飛輸入法在單個音節的識別上仍然不會有什么問題,但是如果連音較嚴重的話,就會出現偏差。
所以結論就是,如果你在使用語音輸入文本時,可以語速較快,但需要避免出現連音,尤其是北京話那種嘟嘟囔囔的發音方式,很容易出現偏差。
中英混輸是硬傷
那么是否就是說通過語音就能完全解決的輸入需求了呢?答案是否定的,因為我們在體驗的過程中還是發現了一些“硬傷”。其中之一就是英語的穿插使用。
簡單來說就是在我們當前的輸入環境中,經常會遇到中文中夾雜英文的情況,比如下面這段文本,我們用訊飛語音輸入得到的就是這樣一個結果:
“蘋果今年在秋季發布會上發布了一款非常小巧的無線藍牙耳機,取名AirPods,不過有一個細節,讓Beats粉絲非常失望,因為并沒有取名BeatsPods。其實蘋果早在2014年就收購了Beats這個品牌,近兩年來似乎并沒有大動作。但是通過蘋果不斷的擴充iTunes,我們似乎可以預測到之后蘋果的大招。”


英文部分幾乎全折
需要說明的是,我們特意在英文的部分進行了慢語速的著重拼讀,但對比之后我們還是發現,所有的英文部分都出現了問題,沒有一個是對得上號的。
我們在語言選項里只找到了普通話和英文這兩個獨立的選項,并沒有能夠實現中英文混合輸入。這一點上我們想說微軟做得非常好,如果你體驗過Windows的Cortana就應該知道,比如同是用語音說“幫我打開Steam”,Cortana就真的是顯示“幫我打開Steam”并完成啟動程序,而訊飛這里顯示的是“幫我打開視頻”。
最后一點要說的其實并不是說是語音輸入法單個的問題,只是這個問題在語音輸入法中變得尤為明顯,那就是詞庫的豐富度。我們知道平常打字時也會遇到一些名詞或是短語,這些詞在詞庫中并沒有收錄,所以需要我們一個字一個字的在候選欄中篩選出來。
但這個問題到了語音輸入法中就變成比較嚴重的問題了,一旦遇到詞庫中不曾收錄的詞或短語,識別就必然出現問題,但是要知道語音輸入可沒有候選詞讓你選,這時候你就需要手動再打字去更正。這個問題同樣出現在訊飛輸入法上,比如我們說“肥倫的脫口秀今天你看了嗎”“半血亞彌達拉有人來嗎”“菲董新歌你聽了嗎”得到的就是下面的結果:

識別結果
當然我不是要故意刁難語音輸入法,只是說這確實是一個比較突出的問題,盡管在測試的過程中訊飛還是給了我不少“這詞都有”的驚訝(比如然并卵、艾吉奧艾迪托雷、騷當、瑞奇與叮當等等),但是仍然不適合在有生僻詞時使用。
總的來說這次測試下來,訊飛的整體效果還是讓人滿意的,尤其是在語音的識別上,但是語義方面的識別仍然需要加強,尤其是中英文混合輸入是一個亟待解決的痛點。總之就是,功能比較強大,但是放到具體的復雜的語言環境中,仍然難以替代打字輸入,或是說難以完全脫離打字輸入獨立運轉。