時間:2013-02-07 10:47:58 作者:不思議游戲 瀏覽量:223

微軟英庫拼音輸入法開發團隊自述,“我們為什么要開發一個新的中文輸入法”。
輸入法的歷史和今日
中文輸入法有一段漫長的歷史,在個人計算機遠遠還未問世之前(至少從上世紀四十年代開始),發明家們就開始搞電子和機械中文輸入法。而伴隨著PC的問世和普及,我們也迎來了中文輸入法技術革新的浪潮。中文輸入法技術的最終目標是輸入效率,各家競爭的焦點集中在性能、準確率和易用性方面。“輸入法”(Input Method Editor,或IME)這個術語是Windows 95首次使用的,Windows 95還附帶了微軟拼音輸入法第一版(基于拼音的輸入也是如今中文輸入法最主流的形式)。自Windows 95以來,這18年里,輸入法界可謂風起云涌,無論是在技術、還是競爭方面。
如今的輸入法市場競爭非常激烈,本土和國際軟件公司都參與了角逐,這其中尤數提供在線服務的公司。他們參與的理由很簡單:對于絕大多數中國用戶來說,輸入法是一個“入口”。在過去的十年中,隨著網絡和云計算的興起,基于云的輸入法更是給眾多公司打開了在線服務業務方面的機會。人人都希望在這個6億中國互聯網用戶的入口之爭上能夠分一杯羹,這其中的巨大商機是不言而喻的。
問題、趨勢和機會
人們可能會疑惑:既然微軟已經有了一款輸入法產品(微軟拼音輸入法),為什么微軟亞洲研究院還要做這款叫做“英庫拼音輸入法”的新輸入法呢?更何況是在輸入法市場貌似”天下已分、大局已定”的情況下。
答案其實也很簡單,那就是我們認為中文輸入法的癥結實際遠未解決。隨著互聯網時代的崛起,我們已經越來越多地發現,中文用戶在網絡時代使用語言交流的習慣和趨勢在悄然發生重大的變化,而這也催生了一些傳統的中文輸入法無法滿足的使用需求。此外,再加上自然語言處理領域的研究突破,我們相信迎來下一代中文輸入法核心技術的時候終于到了。
先說網絡時代產生的新的用戶需求。例如我們注意到,中文用戶使用英語的頻率逐年增高,中英混雜的使用也在迅速增多。如今,大約有3.25億中國人在學習英語。到2025年,會說英語的中國人預計將超過全世界其他地方的英語母語使用者人數的總和。
然而,雖然有如此多的人在學習和使用英語,我們卻發現中文輸入法軟件里面能夠提供有效和友好的英文輸入輔助功能的少之又少。我們認為,對于中國用戶來說,利用輸入法來輔助英文輸入是最佳方案,因為我們已然對輸入法這個東西很熟悉,而且經由輸入法,我們可以在背后利用上很多相關的技術。
另一方面,英文世界的語言也在急速發生變化,有語言跟蹤系統估計大約每98分鐘就有一個英文新詞被創造出來。這些詞大多根本就沒有常見的中文對應翻譯。而在一些專業領域這一現象顯得尤其明顯,舉個例子,軟件技術書籍。你隨便拿起一本軟件技術書籍都可以看到一摞英文術語。如今英語已經是中國人日常用語的一部分,在很多領域,甚至是必不可少的。既然如此,難道我們的中文輸入法不應該跟上中英混合的趨勢,提供更好、更流暢、新鮮和準確的中英混合輸入體驗嗎?
除此之外,促使我們做英庫拼音輸入法的還有一個很重要的原因。如今我們在線溝通的時候,我們會發現,溝通的內容早已經超越了簡單的文本,進而包含圖片、視頻、音樂、地圖等等“富媒體”內容。上百萬的網絡用戶每天在交流、發微博、寫博客,甚至在文檔中使用這些非文本類內容。而值得注意的是,這些內容往往是經由搜索而來。
那么,既然如此,為什么當我們需要粘貼發送它們的時候,總得離開當前輸入的上下文,跑過去打開一個瀏覽器,輸入網址,輸入搜索關鍵字,完了之后再把搜索的結果(圖片、地圖等等)拷貝粘貼回來呢?這一通來去完全影響了輸入的流暢體驗,打斷了我們寶貴的注意力。為什么我們不能直接在輸入法里面完成這整個的流程呢?