專屬客服號
微信訂閱號
全面提升數據價值
賦能業務提質增效
摘要:通過研究發現,隨著智慧家居、智能客服、智慧教育等人工智能應用層的發展,語音識別技術得到了廣泛應用,眾多企業涌入分享智能語音行業初期紅利,我國智能語音行業已經呈現出馬太效應。目前我國智能語音技術智能化程度并不算高,語義識別、口音、語調、噪音克服等魯棒性問題將是下一階段智能語音技術攻克著力點。
智能語音是語言學、數學、計算機學、以及心理學等多學科交叉應用的結果,研究通過語音實現人機交互,主要包括語音識別、自然語言處理以及語音合成(由于目前研究領域關于語音識別與自然語言處理范疇的界定并不清晰,本文根據技術發展現狀按照并行關系界定)。智能語音廣泛地應用于通信、汽車電子、家庭服務、醫療等領域,是人工智能發展的關鍵技術組成。
我國在智能語音領域進展迅猛,商業化應用落地是主要驅動力
我國智能語音市場年平均復合增長率高于全球水平,行業存在大規模增長紅利。如圖1所示,2011年我國智能語音市場規模僅有6.3億元,之后隨著我國智能語音產業化發展,市場規模呈現出高速增長的態勢,截至2018年底我國智能語音市場規模已達到了159.7億元,期間年平均復合增長率(CAGR)高達58.7%,遠超全球30%的年平均增長水平,意味著我國智能語音擁有巨大的市場需求,行業存在大規模增長紅利,預測2019年我國智能語音市場規模將超過250億元。
圖1 2011-2018年中國智能語音市場規模以及2019年預測
(資料來源:公開資料整理,五度易鏈行業研究中心)
智能語音在不同領域的商業化應用是我國智能語音行業發展的主要驅動力。全球關于語音識別的研究起始于20世紀50年代,我國同時期于1958年開始涉足語音識別領域,標志性事件是中國科學院聲學所利用電子管電路識別10個元音。之后由于國內計算機技術普及率較低以及數字信號等技術發展較為落后,我國語音識別技術發展受到了嚴重制約,逐漸被國外拉開差距。但是近些年隨著我國電子信息技術的飛躍式進步,我國在語音識別領域具備了比肩發達國家的發展條件,同時伴隨著人工智能以及物聯網的發展,語音識別技術與智能家居、智慧教育、智能客服、機器人、無人駕駛等行業不斷探索融合,并在部分領域已經實現了商業化落地,有力推動了我國智能語音行業的發展進步,目前我國相關企業的語音識別準確度普遍達到了97%。
國內語音識別行業出現馬太效應,本土企業國際競爭力較弱
我國智能語音市場形成了以科大訊飛為首的一超多強的競爭格局,行業馬太效應顯現。如圖2所示,科大訊飛市場占比最高,達到了44%,其次是百度市場占比為28%,二者合計占據了國內語音識別72%的市場份額,屬于第一梯隊;其次是蘋果、Nuance等外資企業;最后是國內中小型語音識別企業。由此可見,我國語音識別行業馬太效應已經顯現,科大訊飛、百度等龍頭企業依托自身品牌優勢以及客戶優勢將不斷穩固自身市場地位,并占據更多市場份額,使得中小型企業以及新近企業生存難度加大。
圖2 我國智能語音市場份額占比
(資料來源:公開資料整理,五度易鏈行業研究中心)
國內智能語音企業本土競爭力強,但國際競爭力較弱。如圖3所示,觀察全球智能語音市場競爭格局可以發現,盡管科大訊飛依靠本土優勢占據了國內將近一半的市場份額,但是國際競爭力較弱,僅占據全球5%的市場份額;而Nuance以及蘋果雖然只占據國內10%的市場份額,但是從全球范圍內來看,二者卻占據了全球智能語音47%的市場份額。
圖3 全球智能語音市場份額占比
(資料來源:公開資料整理,五度易鏈行業研究中心)
智能語音魯棒性問題是目前阻礙智能語音發展的關鍵因素
我國智能語音尚處于識別階段,魯棒性問題將是下一階段智能語音技術攻關著力點。目前基于實驗室環境,我國智能語音識別準確率普遍達到了97%以上,但是當處于嘈雜環境中時,疊加語速、語調以及口音等因素,語音識別的準確率會急劇下降,嚴重影響智能語音技術的魯棒性。另一方面,語義識別是智能語音智能化程度的主要體現,但是受限于算法優化進展緩慢,目前機器在語義識別方面還比較薄弱,智能語音整體上智能化程度并不算高。綜合來看,當前智能語音面臨的魯棒性問題主要包括非期待行為與交互任務、地方口音、非母語發聲、語速、語調、聲電轉換與信道傳輸、數據搜集等,只有不斷攻克智能語音魯棒性問題,才能有效擴大當前智能語音技術的內涵與外延,真正實現智能化的人機交互。
結語
我國智能語音行業在經歷了初期發展之后,語音識別技術已經演進的較為成熟,但是在更深層次的語義識別、噪音過濾、語調識別等智能化方面尚未取得長足進步,嚴重阻礙了智能語音與其他行業的深度結合。下一步我國智能語音將真正進入到智能化發展階段,從而通過語音實現真正意義上的人機智能交互。
本文為我公司原創,歡迎轉載,轉載請標明出處,違者必究!
請完善以下信息,我們的顧問會在1個工作日內與您聯系,為您安排產品定制服務
評論