當前位置: UU看書 > 玄幻 > 外星代理人最新章節列表 > 語音應用引爆在即
選擇背景顏色: 選擇字體: 選擇字體大小:

語音應用引爆在即

語音應用引爆在即

2011/11/23

多年來,語音識別技術始終磕磕巴巴、欲語還休。WWW.tsxsw.COM現在,siri橫空出世,將這項技術推向了主流,同時還帶來了非常廣泛的應用前景。

語音識別並不是什麼新鮮事物。多年來,消費電子產品、汽車和自動呼叫中心一直就在“傾聽”使用者的指令。從2009年開始,谷歌公司(google)就一直在採錄語音信箱的資訊。而在此之前三年,微軟公司(microsoft)也將類似的技術置入了windowsvista。那麼,蘋果這個名為siri的全新虛擬個人助理到底有什麼神奇之處呢?

它能讀懂你的心。

換句話說,siri不僅僅是語音識別技術,它還能理解語言——正是這一點開始改變使用者與手機的互動方式。現在,很多人預測,siri將對這項長期以來呼之欲出的技術起到重大推動作用,正如蘋果iphone的觸控系統讓觸控技術躋身主流一樣。這項技術將掃清眾多創新應用發展道路上的障礙。市場調研公司opusresearch稱,今年語音識別行業的產值將達到約27億美元。該公司還預計,2012年,市場將掀起後siri語音應用熱潮。

是什麼讓siri如此與眾不同呢?戰略諮詢公司creativestrategies總裁提姆?巴佳瑞稱,答案在於精確性。他說:“siri推出的是真正的新一代人機界面,它對語音理解及精確把握語音的市場產生了重大影響。”

siri當然談不上完美無缺。這項技術在理解某些口音上還頗為困難,不過蘋果已經在努力解決這些小問題了。但對一款軟體來說,siri的表現可圈可點。siri的始創者是位於加州的門羅帕克市的研究實驗室sriinternational,據它稱,siri的關鍵在於自然語言處理技術。siri的工作原理是:捕捉語音訊號,直接將其轉換為文字,它們與使用者在手機螢幕上看到的文字並無二致。siri然後將這些語句與某些預先編制好的指令配比,比如“撥打電話”,或“編輯簡訊”。

這一技術潛力巨大,絕不是只適用於平板電腦和智能手機。語音識別系統nuance公司是語音識別軟體dragon的開發者,這款軟體在醫療保健行業的應用已經長達十年之久。內科醫生的桌面上正執行著nuance的最新軟體,它利用一個夾式微型話筒來錄音。隨著問診的推進,這款軟體會及時更新病人的電子健康記錄。nuance公司醫療保健部門的資深研發副總裁喬?佩特羅稱:“病人可能在這一秒說的是母親的病史,下一秒又提起父親的病歷。而這些情況這款軟體都能理解。”

【目前用下來,聽書聲音最全最好用的App,集成4大語音合成引擎,超100種音色,更是支持離線朗讀的換源神器,huanyuanapp.org 換源App】

它是如何做到的呢?它的工作原理和siri非常相似:透過從它所識別的語彙中獲取意義,然後參照一個醫療資訊資料庫,將其與病人的病史做比對。隨後,它會運用統計推斷的方法,在其所發現的資訊片段之間建立聯系,甚至為對症治療給出建議。全美大約有45萬名內科醫生正在使用nuance公司的軟體。佩特羅稱,這一技術的準確率超過90%,而且還會隨著時間推移而不斷提高。顯然,這款軟體盈利前景良好,因此nuance公司決定,將其第四財季的收入預期調高約1,000萬美元。

然而,研究人員對這一技術的未來抱有更大的希望。思凱普?裡佐是南加州大學創新技術學院(theuniversityofsoutherncalifornia'sinstituteforcreativetechnologies)的助理總監。他正在開發一種互動仿真技術,用以幫助退伍軍人針對創傷後緊張症(post-traumaticstressdisorder)尋求醫療諮詢服務。這款軟體名為simcoach,它的最終目的是要設法理解人們口語背後的情緒狀態。裡佐稱:“這是個十分巨大的挑戰。因為必須採集語音模式,然後得像人類的大腦那樣對它們進行分析。”裡佐稱,人類或許能察覺自己的好友或家人情緒異常,因為這時人們的語速往往會變慢,重音也更少,但電腦要捕捉這些訊號可就相當困難了。

不過這個領域的有些研究卻能更快獲得成果,而不用再苦苦等待。去年春天,裡佐的研究夥伴——麻省理工學院(mit)教授阿歷克斯?彭特蘭在美國銀行(bankofamerica)的呼叫中心開展了一項類似的語音推斷技術試驗,旨在分析員工的溝通對業務成功的影響。彭特蘭讓員工連續六週在脖子上戴著小型電子設備,它們能記錄員工的實際位置以及身體語言和聲音。所記錄的資料能顯示這些員工是在和誰溝通,他們站著時與溝通物件距離有多遠,談話的語調如何。彭特蘭稱:“我們發現,效率最高的員工不光與大量物件交談,他們還與同樣表現出這種特點的同事交談。”結果,他說,只需要調整一下員工的茶歇時間,使這類員工之間的步調更為同步,這個呼叫中心每年就能節省1,500萬美元。

使用者現在對siri的廣泛關注很可能將大大促進這類研究,並進一步推進其應用。裡佐說:“語音識別技術確實是技術領域至高無上的聖盃(holygrail)。我們已經掌握了這項技術的90%,但剩下的10%要求攻克更多難關。一旦到了引爆點,我們將迎來一片十分廣闊的市場。”看起來,這個引爆點很可能非siri莫屬。