科技服務(wù)的科技的科技高級關(guān)鍵詞
IPR Daily,全球視野的知識產(chǎn)權(quán)新銳媒體
摘要
Echo 是一款能夠通過語音控制的智能音箱,人們能夠在房間的任何地方下達指令,來讓它播放音樂、閱讀新聞、購物甚至是叫一份披薩。這個業(yè)務(wù)在提案之初并不受重視,然而今天 Echo 成為了消費者的寵兒,超級碗廣告的主角,亞馬遜的“下一個十億美元級業(yè)務(wù)”。
2011年,當(dāng)亞馬遜硬件高級副總裁Dave Limp首次聽聞關(guān)于 “Echo”這個產(chǎn)品的提案時,他第一反應(yīng)是充滿懷疑的。
2014 年,當(dāng)科技媒體收到 Echo 的第一代產(chǎn)品時,他們都在吐槽“作為播放器來講,它談不上專業(yè);而作為虛擬語音助手來講,它又不及手機自帶的虛擬語音助手方便。Echo 的未來發(fā)展前景還是非常令人擔(dān)憂的。”
然而,今天 Echo 成為了消費者的寵兒,超級碗廣告的主角,亞馬遜的“下一個十億美元級業(yè)務(wù)”。
為什么 Echo 能夠在智能家居領(lǐng)域鶴立雞群?
為什么總是手機?
在傳統(tǒng)智能家居領(lǐng)域,科技廠商希望消費者用手機來控制家庭里的各種電器與基礎(chǔ)設(shè)備,但是這真的是消費者所想要的“智能”么?在他們看來手機不過是遙控器的代替產(chǎn)品罷了!而亞馬遜則希望 Echo 成為現(xiàn)代家庭“管家”,消費者想要干什么,無需摸著找手機,只要隨口說一句命令,Echo 就會為“主人”去操辦了。
那 Echo 又是如何做到的呢?
早在 2010 年前后為了與蘋果的 Siri 及谷歌的 Voice 等語音識別系統(tǒng)競爭,亞馬遜也開始了對語音識別投入了重金進行研發(fā),但是亞馬遜與前兩者不同,手機領(lǐng)域并非它的主場,因此它將自己語音識別技術(shù)的結(jié)晶“Alexa”融入了一款名叫 Echo 的藍牙音箱。
不過,語音識別技術(shù)作為智能家居的核心時總是會面對如對命令音頻內(nèi)容的識別和理解,語音的模糊性以及環(huán)境噪音干擾等問題,那么亞馬遜申請的這些專利中藏著什么獨門秘籍?讓我們從亞馬遜眾多的語音識別專利中一探究竟。
如何聽到主人的命令
為了滿足讓用戶可以在房屋的任何位置呼喚 Echo,亞馬遜的工程師開發(fā)了一種由多個麥克風(fēng)列陣及音頻信號過濾系統(tǒng)構(gòu)成的自動語音識別處理系統(tǒng)(ARS),ARS 系統(tǒng)中的麥克風(fēng)列陣能夠捕捉輕微的聲音;而音頻信號過濾系統(tǒng),則能夠辨別人類口音與諸如家電噪音等環(huán)境音,這兩大獨門“招式”讓 Echo 擁有一對“順風(fēng)耳”在嘈雜的環(huán)境中辨別出主人的命令。
如何理解主人的命令
當(dāng) Echo 聽到主人的“命令”后,它又該如何揣摩主人的意思去完成播放音樂,購買物品亦或者為主人打開某一件電器的任務(wù)?
為此,亞馬遜設(shè)計了一套關(guān)鍵詞識別 (Keyword spotting) 人工智能技術(shù)讓 Echo 將收到的“命令”音頻拆分為多個字段,與云計算系統(tǒng)中儲存的關(guān)鍵詞模型逐一進行對比,與之最為匹配的部分“理解”為主人的真意。因此,只要你來一句:“Alexa, can you turn on the television?”
你家客廳的電視就會被打開了。
“哪一個書呆子小時候沒夢想過有一臺星際迷航中的超級電腦?”
Echo 只是一個智能音箱,但是 Echo 背后還亞馬遜在云計算領(lǐng)域布局的超級服務(wù)器,因此 Echo 作為一個終端讓世人看見以往只在科幻小說中看見的科技平臺,科技服務(wù)于人類,未來又會如何?
亞馬遜已經(jīng)將 Echo 作為了研發(fā)的重點,它必然會不斷進步,同時更多的科技巨頭也會跟進這個領(lǐng)域,從掏出手機到隨口一聲,也許明天只要你動腦想一想呢?
來源:PatSnap智慧芽
作者:陳子豪
編輯:IPRdaily王夢婷
文章不錯,犒勞下辛苦的作者吧