什么是語(yǔ)音識(shí)別?語(yǔ)音識(shí)別有什么作用
語(yǔ)言作為人類(lèi)交流的基本方式,在幾千年的歷史長(zhǎng)河中不斷傳承。近年來(lái),隨著語(yǔ)音識(shí)別技術(shù)的不斷成熟,它在我們的生活中得到了廣泛的應(yīng)用,成為通過(guò)自然語(yǔ)言進(jìn)行人機(jī)交互的重要方式之一。語(yǔ)音識(shí)別技術(shù)如何讓機(jī)器“理解”人類(lèi)語(yǔ)言?隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,人們對(duì)機(jī)器的依賴(lài)已經(jīng)達(dá)到了一個(gè)非常高的水平。語(yǔ)音識(shí)別技術(shù)使人和機(jī)器通過(guò)自然語(yǔ)言進(jìn)行交互成為可能。通過(guò)語(yǔ)音識(shí)別控制房間照明、空調(diào)溫度和電視相關(guān)操作是很常見(jiàn)的。
根據(jù)識(shí)別對(duì)象的不同,語(yǔ)音識(shí)別任務(wù)大致可以分為三類(lèi),即孤立詞識(shí)別、關(guān)鍵詞識(shí)別(或關(guān)鍵詞檢測(cè))和連續(xù)語(yǔ)音識(shí)別。其中,孤立詞識(shí)別的任務(wù)是識(shí)別先前已知的孤立詞,如“開(kāi)放”和“封閉”。連續(xù)語(yǔ)音識(shí)別的任務(wù)是識(shí)別任何連續(xù)的語(yǔ)音,如句子或段落。連續(xù)語(yǔ)音流中的關(guān)鍵詞檢測(cè)針對(duì)的是連續(xù)語(yǔ)音,但它并不識(shí)別所有的文本,只檢測(cè)一些已知關(guān)鍵詞出現(xiàn)的位置。
根據(jù)目標(biāo)說(shuō)話(huà)人,語(yǔ)音識(shí)別技術(shù)可以分為特定人語(yǔ)音識(shí)別和非特定人語(yǔ)音識(shí)別。前者只能識(shí)別一個(gè)或幾個(gè)人的聲音,而后者可以被任何人使用。顯然,獨(dú)立于人的語(yǔ)音識(shí)別系統(tǒng)更符合實(shí)際需求,但比識(shí)別特定的人要困難得多。
此外,根據(jù)語(yǔ)音設(shè)備和渠道,可分為桌面(PC)語(yǔ)音識(shí)別、電話(huà)語(yǔ)音識(shí)別和嵌入式設(shè)備(手機(jī)、PDA等)語(yǔ)音識(shí)別。不同的采集通道會(huì)扭曲人類(lèi)發(fā)音的聲學(xué)特征,因此我們需要構(gòu)建自己的識(shí)別系統(tǒng)。
語(yǔ)音識(shí)別應(yīng)用廣泛。常見(jiàn)的應(yīng)用系統(tǒng)包括:語(yǔ)音輸入系統(tǒng),比鍵盤(pán)輸入更符合人們的日常習(xí)慣,也更自然;語(yǔ)音控制系統(tǒng),即使用語(yǔ)音識(shí)別控制設(shè)備比手動(dòng)控制更快更方便,可應(yīng)用于工業(yè)控制、語(yǔ)音撥號(hào)系統(tǒng)、智能家電、聲控智能玩具等諸多領(lǐng)域。