語音辨識:微軟宣布已達到人類理解能力

微軟開發的語音辨識系統現在可以像人類一樣辨識單字。

無論是法語還是尤其是英語,市場上的各種語音辨識工具近年來都取得了明顯的進展。今天輪到了微軟宣布其在微軟人工智慧和研究部門開發的內部解決方案現在等於一個人的理解力。

“我們已經達到了與人類平等的水平”

具體來說,他們的系統的單字辨識錯誤率目前為 5.9%,而上個月為 6.3%。這個身材並不完美,但與正常人相當。事實上,像「have」、「is」、「a」或「the」這樣的字眼對於機器和人類來說常常會造成混亂。事實上,我們在這裡談論的是英語的結果,需要再等幾年才能獲得其他語言的這樣的比率。

為了實現這樣的結果,微軟研究人員透過神經網路系統使用深度學習。除非競爭迅速加劇(Google、Apple、IBM 等),屆時這個新系統將與 Microsoft 工具集成,例如科塔娜,雷德蒙公司應該是這方面最有效的。

之後呢?

但圍繞語音辨識的工作還遠遠未完成。因此,未來團隊希望改善背景噪音情況下的結果,最重要的是從聲音辨識轉變為機器真正理解。微軟人工智慧與研究小組副總裁 Harry Shum 宣稱:「距離電腦能夠理解所說或所顯示內容的真正意義還有很長的路要走。«