智能語音特點(diǎn)突出,4G網(wǎng)絡(luò)為其發(fā)展鋪平道路
進(jìn)入智能手機(jī)時代,網(wǎng)站制作權(quán)重減少,移動互聯(lián)網(wǎng)興起,朝著更為人性化的方向發(fā)展已成既定事實。無論何種設(shè)備,最終必定會做的更為像人,才能更好的為人類服務(wù),這也正是人機(jī)交互過程中最根本的原則。語音作為人類最為原始和自然的信息傳遞方式,具備高效性。人的語言控制能力在長期進(jìn)化過程中也得到了不斷增強(qiáng),與此同時語音的非接觸方式傳播特點(diǎn),也使一些在視覺、觸覺等方面存在障礙(如老年人、弱視、殘障人士)或不適合(如兒童需要保護(hù)視力)的龐大特定人群更加合適。而在安全性方面,雖然很多智能手機(jī)開始大力推廣指紋識別功能,但相關(guān)統(tǒng)計顯示,指紋的盜用(手機(jī)上本身就帶有指紋信息),逐漸成為黑客盜取目標(biāo)手機(jī)信息的一種全新方式,然而語音則相對來說更加安全。
在2G和3G時代,流量的不足限制了智能語音手機(jī)的很多功能。比如海量的語音庫需要網(wǎng)絡(luò)支持,大數(shù)據(jù)處理需要網(wǎng)絡(luò)支持,語音辨識也需要網(wǎng)絡(luò)的支持。隨著4G網(wǎng)絡(luò)的普及,流量大大提升的同時,也為語音的長足進(jìn)步提供了便利條件。當(dāng)對語音識別更加準(zhǔn)確之后,必然推動語音交互的使用體驗,如此循環(huán),對于語音交互應(yīng)用的豐富與發(fā)展將起到重要作用。此外,人工智能算法也在不斷取得突破,未來將機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究引入到語音識別聲學(xué)模型訓(xùn)練,將極大提高聲學(xué)模型準(zhǔn)確率。一旦手機(jī)可以使用深層神經(jīng)網(wǎng)絡(luò)模型后,語音識別的錯誤率將降低30%,從而幫助語音交互形成真正意義上的“從走到跑”。
智能語音形成規(guī)模效應(yīng),實際應(yīng)用好處頗多
因為4G時代的來臨,越來越多的應(yīng)用得到普及,并隨之加入了語音功能。谷歌預(yù)計目前大約有50%的Android設(shè)備通過語音進(jìn)行搜索,咨詢公司SA預(yù)測含語音及手勢觸覺反饋技術(shù)的智能機(jī)目前在中高端智能機(jī)上已經(jīng)很普遍,2014年發(fā)貨規(guī)模將達(dá)到5.7億部,滲透率(占智能機(jī))約一半左右。未來還將向中低端普及。移動智能終端有望成為智能語音技術(shù)的一個最大的規(guī)?;袌?。隨著人類對智能設(shè)備的依賴和人機(jī)之間的交互日益頻繁,原有的操控方式變得越來越復(fù)雜、效率低下,迫切需要誕生一種新的更簡便的操作方式;而語音一旦成為主流的交互手段,可以做到各種設(shè)備指令統(tǒng)一、簡潔,大大降低人類對智能設(shè)備操作的要求、節(jié)省人機(jī)互動的時間。
事實上,智能語音在實際應(yīng)用中也給人類帶來更多好處。以智能語音手機(jī)為例:當(dāng)用戶在駕車時,用語音喚醒手機(jī)和解鎖手機(jī),并用語音撥叫通信錄的同事和好友,就顯得十分方便;筆者的一位編輯朋友就在開會時,錄了一段語音,會后通過語音轉(zhuǎn)文字功能,迅速記錄下會議要點(diǎn),并以最快速度發(fā)送給領(lǐng)導(dǎo)和同事。此外,智能語音還是智能家庭、智能汽車、智能穿戴等領(lǐng)域的“導(dǎo)流入口”,使得智能手機(jī)可以在人與其它智能設(shè)備之間架起溝通的橋梁。
智能語音影響人類,大到汽車小到手機(jī)與搜索
毋庸置疑,智能語音交互將在未來影響到人類,這種影響大到汽車,小到手機(jī)與搜索。國外媒體華爾街日報透露,美國通用汽車公司準(zhǔn)備和VocalIQ公司合作,開發(fā)更加智能的語音系統(tǒng),可以讓車主更加智能的使用語音操作汽車。在百度世界大會上,李彥宏也指出,“移動時代消費(fèi)者的行為在發(fā)生變化,未來五年使用語音來表達(dá)需求的比例將超過50%”。搜索引擎類應(yīng)用也開始進(jìn)入到語音時代。
作為智能語音交互應(yīng)用先鋒的手機(jī)終端來說,谷歌和蘋果雖然入場較早也取得了很多實質(zhì)性進(jìn)展。但經(jīng)過多年的積累,語音技術(shù)已不再是國際巨頭一家獨(dú)大的局面。國內(nèi)智能終端設(shè)備提供商中以中興、聯(lián)想、華為等為代表,與其他兩家不同的是,中興聯(lián)合語音處理芯片商(Audience)、語音識別軟件商(Nuance)、搜索服務(wù)提供商(百度)、內(nèi)容提供方(高德)以及中國科學(xué)院自動化所等科研機(jī)構(gòu),整合行業(yè)領(lǐng)先技術(shù)和資源,促進(jìn)終端語音技術(shù)的發(fā)展,推動智慧語音的規(guī)?;瘧?yīng)用和普及。
所以從未來的手機(jī)發(fā)展趨勢來看,智能語音將很可能成為眾望所歸。這不僅因為利用語音操控手機(jī)更加快捷方便,也源于4G網(wǎng)絡(luò)對于流量的貢獻(xiàn),從而促進(jìn)語音技術(shù)加快成型。未來,不只是巨頭想在智能語音方面有所突破,具備語音交互技術(shù)和功能的智能手機(jī),也很可能成為日后智能手機(jī)市場中一顆耀眼的明星。
文章內(nèi)容來源于網(wǎng)絡(luò),侵刪