來(lái)源:IPRdaily中文網(wǎng)(IPRdaily.cn)
作者:連立杰 審協(xié)北京中心通信部 IP創(chuàng)新贏
原標(biāo)題:聽(tīng)懂你說(shuō)話才是真的人工智能
前些天,小編接到將十幾個(gè)小時(shí)的講座錄音轉(zhuǎn)文本的任務(wù),傻敲了半天,才想到是否有專業(yè)軟件能解決問(wèn)題?果然有,且轉(zhuǎn)換正確率相當(dāng)高!讓小編狠想扒一扒這產(chǎn)品以及相關(guān)的專利技術(shù)。
今年兩會(huì)期間,“人工智能”這個(gè)詞火了。
因?yàn)椤墩ぷ鲌?bào)告》中首次寫(xiě)入了“人工智能”,這也意味著人工智能(AI)將正式進(jìn)入國(guó)家策略層面。
要想實(shí)現(xiàn)AI,首先就需要讓機(jī)器能夠與人類進(jìn)行對(duì)話,語(yǔ)音識(shí)別便成為AI的熱點(diǎn)技術(shù)。
一、語(yǔ)音識(shí)別技術(shù)的進(jìn)階
今天小編為您介紹的是語(yǔ)音識(shí)別技術(shù)的進(jìn)階——語(yǔ)音轉(zhuǎn)寫(xiě)技術(shù)。
該技術(shù)將自然語(yǔ)言轉(zhuǎn)換為文本輸出,結(jié)合不同語(yǔ)言之間的轉(zhuǎn)換,實(shí)現(xiàn)多語(yǔ)種的文本輸出。
在兩會(huì)期間,科大訊飛公司董事長(zhǎng)劉慶峰向總理李克強(qiáng)展示了他們公司最新研發(fā)的該人工智能技術(shù)產(chǎn)品。
李克強(qiáng)總理聽(tīng)取劉慶峰介紹人工智能“曉譯”翻譯機(jī)
總理“各位代表:現(xiàn)在,我代表國(guó)務(wù)院,向大會(huì)報(bào)告政府工作”的話音剛落,一行通過(guò)該技術(shù)將語(yǔ)音實(shí)時(shí)轉(zhuǎn)換成的字幕,立即就出現(xiàn)在屏幕上。
科大訊飛研發(fā)的語(yǔ)音轉(zhuǎn)寫(xiě)技術(shù)以及相關(guān)的產(chǎn)品專利已經(jīng)獲得授權(quán)(CN 102779508B)。其通過(guò)語(yǔ)音提取、語(yǔ)音識(shí)別、文本標(biāo)注三個(gè)模塊實(shí)現(xiàn)語(yǔ)音到文本轉(zhuǎn)換。
“訊飛聽(tīng)見(jiàn)”為頒獎(jiǎng)典禮提供實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)
語(yǔ)音識(shí)別的難點(diǎn)問(wèn)題在于講話的人有方言、口音或者自己特殊的表達(dá)風(fēng)格。這類問(wèn)題如何解決呢?這就需要聽(tīng)者對(duì)說(shuō)話人的說(shuō)話風(fēng)格要有足夠的了解。
(舉個(gè)栗子:聽(tīng)到了聲音“qìng fēng”,說(shuō)話人想說(shuō)的是一個(gè)名字“慶峰”還是包子鋪“慶豐”?)
看來(lái)要讓冷冰冰的計(jì)算機(jī)了解每個(gè)人的風(fēng)格是一件很復(fù)雜的事情。
從訊飛的語(yǔ)音自適應(yīng)專利技術(shù)(CN 105895104A)來(lái)看,其根據(jù)說(shuō)話人聲音的特征建立模型,基于此模型對(duì)說(shuō)話人的聲音進(jìn)行識(shí)別??磥?lái),能夠獲得說(shuō)話人聲音特征的建模方法就是語(yǔ)音識(shí)別中的關(guān)鍵技術(shù)。
為了能夠準(zhǔn)確、快速的掌握說(shuō)話人的聲音特征,多種性能各異的建模方法被應(yīng)用于語(yǔ)音識(shí)別中,在研發(fā)的過(guò)程中,先后出現(xiàn)了DNN(深度神經(jīng)網(wǎng)絡(luò))、CNN(卷積神經(jīng)網(wǎng)絡(luò))、LSTM(時(shí)間遞歸神經(jīng)網(wǎng)絡(luò))、Deep CNN(深度卷積神經(jīng)網(wǎng)絡(luò))等性能優(yōu)異的語(yǔ)音模型。
創(chuàng)新實(shí)體也在不斷的對(duì)語(yǔ)音模型進(jìn)行改進(jìn),以進(jìn)一步優(yōu)化性能。
語(yǔ)音建模技術(shù)的積累在國(guó)內(nèi)也取得了長(zhǎng)足的進(jìn)步,專利申請(qǐng)量逐年遞增,成為了人工智能領(lǐng)域研究的熱點(diǎn)。
在研發(fā)過(guò)程中,涌現(xiàn)出了以百度,科大訊飛為代表的國(guó)內(nèi)優(yōu)秀企業(yè),技術(shù)上在全球也是處于領(lǐng)先地位。
此外,訊飛產(chǎn)品還能夠自動(dòng)生成一段語(yǔ)音精華,其中使用了語(yǔ)音摘要技術(shù)(CN 106446109A)。有了這個(gè)技術(shù),機(jī)器人不但能夠聽(tīng)懂你,而且能夠幫你歸納總結(jié)。
是不是感覺(jué)機(jī)器已經(jīng)具備思考的基礎(chǔ)了?
訊飛錄音筆實(shí)時(shí)轉(zhuǎn)文字
最炸裂的是:它還可以自己做摘要
人工智能是對(duì)人的意識(shí)、思維的信息過(guò)程的模擬,其出現(xiàn)就是為了代替人類完成某些繁重的工作。
二、它的發(fā)展代表了未來(lái)?
原來(lái)從1999年成立的科大訊飛,早就陪伴在你身邊。
“對(duì)不起,您撥打的電話正在通話中,請(qǐng)稍后再撥!sorry, the telephone you dialed is busy now, please redial later. ”這句經(jīng)?;厥幵诙叺脑?,竟然出自訊飛之手。
你撥打各大運(yùn)營(yíng)商、銀行等電話時(shí)的自助語(yǔ)音客服,背后是來(lái)自科大訊飛的技術(shù)。
每天使用的微信、高德地圖(例如林志玲和郭德綱的合成音)、滴滴出行、攜程、大眾點(diǎn)評(píng)、新浪微博等在內(nèi)的20余萬(wàn)+合作伙伴使用的語(yǔ)音技術(shù)來(lái)自訊飛。訊飛通過(guò)這些終端覆蓋超過(guò)9億的用戶,每天在線服務(wù)量達(dá)20億次。
教育方面,每年的國(guó)家普通話評(píng)測(cè)、中高考的口語(yǔ)評(píng)測(cè),機(jī)器評(píng)測(cè)技術(shù)都是來(lái)自科大訊飛。2015年科大訊飛機(jī)器智能閱卷技術(shù)便已在安慶、合肥等地成功試點(diǎn)應(yīng)用。
經(jīng)過(guò)對(duì)人機(jī)評(píng)分結(jié)果的分析,指標(biāo)方面都已達(dá)到或超過(guò)人工評(píng)分水平。這意味著,讓機(jī)器評(píng)閱主觀題已不再是空想。其中最讓人眼前一亮的,是哈工大訊飛聯(lián)合實(shí)驗(yàn)室研發(fā)的語(yǔ)文作文評(píng)分技術(shù)。
機(jī)器人方面,讓機(jī)器人參加高考,并考上重點(diǎn)大學(xué),這是“訊飛超腦”計(jì)劃的目標(biāo)之一。
“高考機(jī)器人項(xiàng)目”始于2015年7月,起源于科大訊飛(002230)牽頭承辦了國(guó)家“十二五”863計(jì)劃信息技術(shù)領(lǐng)域“基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)”項(xiàng)目。
只有能夠跟人交流,懂人類語(yǔ)言的機(jī)器人,才是最NB的機(jī)器人。據(jù)悉,訊飛正在探索讓機(jī)器自動(dòng)學(xué)習(xí),能夠讓機(jī)器理解自然語(yǔ)言,同時(shí)將自然語(yǔ)言與我們?nèi)祟惖母拍钸B接在一起。
習(xí)大大在2016年4月參觀訊飛的機(jī)器人“曉曼”,并進(jìn)行了親切的交談。
在汽車(chē)領(lǐng)域,訊飛開(kāi)發(fā)了“飛魚(yú)助理”,它承擔(dān)了一個(gè)車(chē)載秘書(shū)的功能。使用的越多,它對(duì)用戶的個(gè)人喜好越了解,對(duì)答的時(shí)候便能提供更準(zhǔn)確的服務(wù)。
專業(yè)領(lǐng)域和個(gè)性化方面
科大訊飛與北京協(xié)和醫(yī)學(xué)院簽署全面戰(zhàn)略合作框架協(xié)議,推出智慧醫(yī)療系統(tǒng),智能語(yǔ)音是其中一項(xiàng)重要技術(shù)。通過(guò)采集醫(yī)生的語(yǔ)音信息并實(shí)時(shí)轉(zhuǎn)換成文字來(lái)記錄病例和布置醫(yī)囑,節(jié)省了醫(yī)生手寫(xiě)病例的時(shí)間,提高了醫(yī)生的工作效率。
科大訊飛還與最高人民法院信息技術(shù)服務(wù)中心簽訂戰(zhàn)略合作協(xié)議,將智能語(yǔ)音識(shí)別系統(tǒng)應(yīng)用于庭審文字記錄的生成中,共同致力于打造“智慧法院”。
還有娛樂(lè)方面,訊飛還將語(yǔ)音合成產(chǎn)品進(jìn)行了個(gè)性化應(yīng)用。如通過(guò)語(yǔ)音合成模擬奧巴馬等名人的音色,可以模仿奧巴馬發(fā)出聲音,讓你分分鐘變身名人。
不清楚各行各業(yè)的人工智能化是否會(huì)讓人失業(yè),但也許這就是未來(lái),讓人類從重復(fù)勞動(dòng)中抽身去發(fā)揮創(chuàng)意特長(zhǎng)。
有了這樣的智能語(yǔ)音技術(shù),或許在以后的現(xiàn)實(shí)生活中,我們也能夠與擎天柱做朋友,有大白溫馨的陪伴,體驗(yàn)人工智能伴隨我們的人類世界。
來(lái)源:IPRdaily中文網(wǎng)(IPRdaily.cn)
作者:連立杰 審協(xié)北京中心通信部 IP創(chuàng)新贏
編輯:IPRdaily.cn 趙珍
校對(duì):IPRdaily.cn 縱橫君
推薦閱讀
點(diǎn)擊下方圖片即可閱讀
「智戰(zhàn)2017」首屆知識(shí)產(chǎn)權(quán)競(jìng)爭(zhēng)策略挑戰(zhàn)賽,等你來(lái)戰(zhàn)!要你好看!
首席知識(shí)產(chǎn)權(quán)官:一個(gè)即將崛起的知識(shí)產(chǎn)權(quán)職業(yè)群體!
十七種知識(shí)產(chǎn)權(quán)商業(yè)模式!
「關(guān)于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識(shí)產(chǎn)權(quán)媒體+產(chǎn)業(yè)服務(wù)平臺(tái),致力于連接全球知識(shí)產(chǎn)權(quán)人,用戶匯聚了中國(guó)、美國(guó)、德國(guó)、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司、成長(zhǎng)型科技企業(yè)IP高管、研發(fā)人員、法務(wù)、政府機(jī)構(gòu)、律所、事務(wù)所、科研院校等全球近50多萬(wàn)產(chǎn)業(yè)用戶(國(guó)內(nèi)25萬(wàn)+海外30萬(wàn));同時(shí)擁有近百萬(wàn)條高質(zhì)量的技術(shù)資源+專利資源,通過(guò)媒體構(gòu)建全球知識(shí)產(chǎn)權(quán)資產(chǎn)信息第一入口。2016年獲啟賦資本領(lǐng)投和天使匯跟投的Pre-A輪融資。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來(lái)自IPRdaily.cn 中文網(wǎng)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://islanderfriend.com/”
完善證據(jù)制度 實(shí)現(xiàn)商標(biāo)價(jià)值—北京知產(chǎn)法院關(guān)于“撤三”案件的調(diào)研報(bào)告
技術(shù)入股專利出資法律實(shí)務(wù)(15000字)
文章不錯(cuò),犒勞下辛苦的作者吧