一千萬個為什麽

搜索

語音識別(網絡)服務?

我有一個音頻緩沖區,我想在它上面進行語音識別/轉錄。我本地的CPU和RAM有限,所以我想在服務器上執行識別。

是否有任何(網絡)服務允許我這樣做?

到目前為止我的搜索無處可尋......

最佳答案

谷歌剛剛通過HTML5引入了基於瀏覽器的語音引擎訪問。

http://slides.html5rocks.com/#speech-input

為了使這個頁面起作用,我在Ubuntu中按如下方式啟動了Chromium瀏覽器:

$ chromium-browser --enable-speech-input

我相信這個想法是能夠構建使用谷歌語音識別器的應用程序,但我沒有機會深入研究它。

Another interesting project is WAMI from MIT: http://wami.csail.mit.edu

轉載註明原文: 語音識別(網絡)服務?