谷歌黑科技：用人工智能，把搜索變成對話

小知2021-06-17

谷歌黑科技：用人工智能，把搜索變成對話

#本文僅代表作者觀點(diǎn)，不代表IPRdaily立場#

原標(biāo)題：谷歌黑科技：用人工智能，把搜索變成對話

6月16日舉辦的的I/O大會上，谷歌展示了LaMDA，一款“可以就任何話題展開對話”的人工智能。谷歌CEO Sundar Pichai表示，LaMDA 的自然對話功能有可能徹底改變信息和計(jì)算，讓它們變得更易于訪問和使用。未來的搜索也許就會像跟專家對話一樣，通過一段段的對話，慢慢把你想要的答案呈現(xiàn)出來。

重點(diǎn)：

谷歌最近推出了LaMDA，一款 “可以就任何話題展開對話”的人工智能

谷歌對搜索未來的將以人工智能為中心

這種AI可以推斷人類語言的含義，參與對話，并像專家一樣回答由多環(huán)節(jié)構(gòu)成的問題

谷歌還推出了另一款人工智能工具，也就是所謂的多任務(wù)統(tǒng)一模型（MUM），讓用戶結(jié)合文字和圖像進(jìn)行查詢

使用大型語言模型的搜索引擎可提出建議、檢索文檔、回答問題并完成廣泛的任務(wù)，但依然存在偏見的風(fēng)險(xiǎn)

谷歌經(jīng)常會利用自己一年一度舉辦的開發(fā)者大會 I/O 來展示其令人驚嘆的人工智能。2016 年，它推出了帶內(nèi)置Google Assistant 的 Google Home 智能音箱。2018 年，為企業(yè)接聽電話和安排約會的Duplex 首次亮相。按照這一傳統(tǒng)，上個(gè)月，首席執(zhí)行官Sundar Pichai宣布推出了LaMDA ，一款 “可以就任何話題展開對話”的人工智能。

在臺上的演示中，Pichai展示了跟紙飛機(jī)以及天體冥王星交流是什么感覺。對于每一個(gè)查詢，LaMDA 都會用三到四個(gè)句子來予以回應(yīng)，就好像兩個(gè)人之間進(jìn)行的自然對話一樣。Pichai說，慢慢地，LAMDA將會融入到谷歌的其他產(chǎn)品之中，比如Assistant和Workspace，以及最關(guān)鍵的搜索。

Pichai說：“我們相信LaMDA 的自然對話功能有可能徹底改變信息和計(jì)算，讓它們變得更易于訪問和使用。”

這次LAMDA的演示為我們提供一個(gè)窗口，讓我們得以一窺谷歌對搜索的愿景，這個(gè)愿景已經(jīng)超越了鏈接列表，并可能改變數(shù)十億人對web的搜索方式。這個(gè)愿景將以人工智能為中心，它可以推斷人類語言的含義，參與對話，并像專家一樣回答由多環(huán)節(jié)構(gòu)成的問題。

同樣也是在6月16日舉辦的I/O 大會上，谷歌還推出了另一款人工智能工具，也就是所謂的多任務(wù)統(tǒng)一模型（Multitask Unified Model ，MUM），它可以在搜索的時(shí)候把文本和圖像考慮在內(nèi)。谷歌副總裁Prabhakar Raghavan說，有朝一日用戶可以拍下一雙鞋的照片，然后到搜索引擎詢問這雙鞋是否適合攀登富士山的時(shí)候穿。

MUM 可以生成 75 種語言的結(jié)果，谷歌聲稱這可以讓它對世界的了解更加全面。臺上的演示展示了 MUM 是怎么響應(yīng)搜索查詢的，當(dāng)用戶輸入“我已經(jīng)爬過亞當(dāng)斯山了，現(xiàn)在我想明年秋天爬富士山，我該怎么做？” 這個(gè)搜索查詢跟我們今天在谷歌上進(jìn)行的搜索在表述上有所不同，因?yàn)?MUM的目標(biāo)是減少查找到答案所需的搜索次數(shù)。MUM 既可以對文本進(jìn)行概括也可以生成文本；它會知道拿亞當(dāng)斯山與富士山進(jìn)行比較，并且知道為遠(yuǎn)足做準(zhǔn)備可能需要有關(guān)健身訓(xùn)練、遠(yuǎn)足裝備推薦以及天氣預(yù)報(bào)方面的搜索結(jié)果。

在上個(gè)月發(fā)表的一篇題為“重新思考搜索：從業(yè)余愛好者變成專家”的論文中，谷歌研究院的四位工程師把搜索設(shè)想成跟人類專家的對話。論文提到了一個(gè)例子，搜索“紅葡萄酒的健康益處和風(fēng)險(xiǎn)是什么？”目前，谷歌會回復(fù)一個(gè)要點(diǎn)列表。而這篇論文表明，未來搜索引擎的回應(yīng)可能看起來更像是一段話，里面會說紅酒可促進(jìn)心血管健康，但可能會弄臟你的牙齒，并且會補(bǔ)充相關(guān)的信息來源與鏈接。論文顯示，回復(fù)是文本形式，但你很容易會想到口頭回復(fù)的可能性，就像今天我們使用 Google Assistant 的體驗(yàn)一樣。

不過更多地依賴人工智能來破譯文本也存在風(fēng)險(xiǎn)，因?yàn)橛?jì)算機(jī)依然難以理解語言的各種微妙復(fù)雜之處。用來完成生成文本或回答問題等任務(wù)的最先進(jìn)的人工智能，也就是所謂的大型語言模型，已經(jīng)顯示出存在放大偏見，以及生成不可預(yù)測或有害文本的傾向。其中有一個(gè)模型，也就是OpenAI 的GPT-3，已被用于為動(dòng)畫角色創(chuàng)建互動(dòng)故事，但在一個(gè)在線游戲里面它也生成過牽涉到兒童性愛場景的文字。

作為去年發(fā)表并進(jìn)行展示的一篇論文的一部分，來自麻省理工學(xué)院、英特爾和以及Facebook 的研究人員發(fā)現(xiàn)，大型語言模型表現(xiàn)出基于對種族、性別、宗教和職業(yè)所存在的刻板印象的偏見。

擁有自然語言處理倫理學(xué)博士學(xué)位的語言學(xué)家Rachael Tatman表示，隨著這些模型生成的文本變得越來越有說服力，它可以讓大家相信自己正在跟能夠理解自己所表達(dá)單詞含義的人工智能交談。但生成——其實(shí)對世界并沒有常識性的理解。當(dāng)它生成對殘疾人或穆斯林有害的文本或者告訴大家去自殺時(shí)，這可能就會造成問題。Tatman回憶起一位圖書管理員曾經(jīng)教過自己怎么去判斷 Google 的搜索結(jié)果是否有效。她說，如果谷歌把大型語言模型跟搜索結(jié)合起來的話，用戶就得被迫學(xué)會怎么評估跟專家 AI 的對話。

Google 是一家建立在 PageRank 之上的公司。PageRank 是公司聯(lián)合創(chuàng)始人 Larry Page 和 Sergey Brin在 1990 年代后期研究式創(chuàng)建出來的一種算法。這種算法要依賴于索引——這是一個(gè)利用算法對網(wǎng)站進(jìn)行排序和評估的過程。后來慢慢地，谷歌又把知識圖譜，一個(gè)龐大的事實(shí)庫，納入到搜索結(jié)果里面。

最近，谷歌開始把語言模型納入到搜索響應(yīng)里面。2019 年，該公司把一種叫做 BERT 的模型植入到搜索里面，以便回答對話式搜索查詢、建議搜索，并對出現(xiàn)在搜索結(jié)果下方的文本進(jìn)行摘要。當(dāng)時(shí)，谷歌副總裁Pandu Nayak稱這是五年來搜索領(lǐng)域取得的最大進(jìn)步，也是“搜索史上最大的飛躍之一”。微軟的 Bing在提供搜索結(jié)果時(shí)也用到了BERT。

BERT 在 2018 年的引入在科技巨頭之間開啟了一場競賽，大家都在競相創(chuàng)建出規(guī)模更大的語言模型，力爭在語言理解或回答問題等任務(wù)上在 GLUE 等流行的性能排行榜上能取得更高的排名。不久之后，百度推出了Ernie，Nvidia推出了Megatron，微軟推出了 T-NLG，OpenAI 推出了 GPT-3。工程師通常會通過參數(shù)的數(shù)量，也就是深度學(xué)習(xí)系統(tǒng)中人工神經(jīng)元之間連接的度量來評估這些模型。BERT 包含了數(shù)億個(gè)參數(shù)，GPT-3 的參數(shù)則高達(dá)1750 億個(gè)。今年1 月，谷歌發(fā)布了一個(gè)帶有 1 萬億參數(shù)的語言模型。在 Google 今年的 I/O 活動(dòng)上，Raghavan稱在參數(shù)的數(shù)量上 MUM 比 BERT 強(qiáng)大 1000 倍。

在《重新思考搜索》那篇論文中，谷歌研究人員稱索引是現(xiàn)代搜索的馱馬。但是他們設(shè)想今后通過利用能理解更多查詢的，更龐大的語言模型來消除索引。

比方說，知識圖譜可以針對對事實(shí)問題提供答案，但那只針對web的一小部分進(jìn)行了訓(xùn)練。使用基于更廣泛的web構(gòu)建的語言模型，將可以讓搜索引擎提出建議、檢索文檔、回答問題并完成廣泛的任務(wù)?！吨匦滤伎妓阉鳌纺瞧撐牡淖髡弑硎?，這種方法有可能帶來“思維的變革性轉(zhuǎn)變”。

這樣的模型并不存在。事實(shí)上，作者說這可能需要?jiǎng)?chuàng)建出通用人工智能，或在信息檢索和機(jī)器學(xué)習(xí)等領(lǐng)域取得進(jìn)步。此外，他們希望這種新方法能夠從多個(gè)角度提供權(quán)威答案，清晰地披露來源，并且不帶偏見。

谷歌發(fā)言人把LaMDA和 MUM說成是谷歌下一代語言模型研究的一部分，并且表示， MUM 目前正在內(nèi)部開展試點(diǎn)，來幫助大家查詢數(shù)十億個(gè)主題。在被問及《重新思考搜索》那篇論文跟LaMDA和 MUM 的關(guān)系時(shí)，這位發(fā)言人表示，Google Research并沒有給谷歌產(chǎn)品設(shè)定方向，進(jìn)入谷歌產(chǎn)品（如搜索）的機(jī)器學(xué)習(xí)通常是作為補(bǔ)充而不是取代現(xiàn)有產(chǎn)品。

他們的野心比展示廣告領(lǐng)域要大多了。

Michael Blumenthal，搜索顧問

不可避免地，谷歌搜索算法的任何變化都會影響到核心的廣告業(yè)務(wù)。這一該業(yè)務(wù)去年為谷歌創(chuàng)造了 1470 億美元的收入。搜索顧問Michael Blumenthal表示，關(guān)于登山靴的 MUM 演示表明，谷歌希望在連接企業(yè)與消費(fèi)者之間發(fā)揮更大的作用。上個(gè)月的另一個(gè)變化是，谷歌引入了跟Shopify的集成，將 170 萬商家的商品帶到搜索結(jié)果里面。2019年，外賣公司DoorDash和Postmates已經(jīng)進(jìn)入到搜索結(jié)果里面。

20 年來一直為企業(yè)提供搜索策略咨詢服務(wù)的 Blumenthal 指出，谷歌搜索結(jié)果已經(jīng)從由 PageRank 提供的鏈接列表，演變?yōu)榘褟V告、知識面板、地圖、視頻和增強(qiáng)現(xiàn)實(shí)納入在內(nèi)。

這種轉(zhuǎn)變導(dǎo)致了部分人所謂的零點(diǎn)擊搜索（zero-click）的興起。零點(diǎn)擊搜索，是指大家將不再靠點(diǎn)擊進(jìn)入網(wǎng)站來完成一次web搜索。這讓 Google 能夠在不需要用戶離開谷歌渠道別的地方的情況下獲得廣告收入。數(shù)字?jǐn)?shù)據(jù)公司Similarweb估計(jì)，去年在近三分之二的谷歌搜索當(dāng)中用戶都沒有點(diǎn)擊進(jìn)入到另一個(gè)頁面；在移動(dòng)設(shè)備上，點(diǎn)擊率（click-through rates）尤其低。

Blumenthal在談到谷歌正在考慮進(jìn)行的搜索變革時(shí)說：“在我看來，他們的野心要比展示廣告領(lǐng)域大多了。他們喜歡將各方連接起來進(jìn)行交易，所以我把這看作是極大地增強(qiáng)了這一點(diǎn)?！?br/>

強(qiáng)調(diào)用自然語言或圖像進(jìn)行搜索的變化可能會讓用戶不再把注意力放在關(guān)鍵字上，而且還會破壞價(jià)值數(shù)十億美元的搜索引擎優(yōu)化業(yè)務(wù)——目前企業(yè)仍爭相靠這一業(yè)務(wù)讓自己靠近搜索結(jié)果的頂部。

部分搜索引擎優(yōu)化公司一直在為自然語言的未來做著準(zhǔn)備。Copysmith.ai 是一家總部位于美國阿拉巴馬州伯明翰的初創(chuàng)企業(yè)，它利用了 GPT-3來為網(wǎng)站生成 SEO元標(biāo)簽等。公司的首席執(zhí)行官Shegun Otulana表示，該公司不認(rèn)為谷歌最近的舉動(dòng)“是一種威脅，而是整個(gè)人工智能領(lǐng)域往前又邁進(jìn)了一步。這證實(shí)了我們正在朝著正確的方向前進(jìn)?！?/p>

Blumenthal則表示，I/O上面發(fā)布的引人注目的公告可能需要數(shù)年的時(shí)間才能兌現(xiàn)承諾，但他同時(shí)表示，有一點(diǎn)越來越清楚，谷歌想要的不僅僅是事實(shí)和鏈接的集合，而是希望自己更像一位能夠回答復(fù)雜問題的專家?！拔ㄒ坏膯栴}是他們什么時(shí)候能到達(dá)那里，”他說。

谷歌把大型語言模型作為商業(yè)戰(zhàn)略和研究重點(diǎn)的做法在公司內(nèi)部造成了沖突。最值得注意的一點(diǎn)是，谷歌 Ethical AI 團(tuán)隊(duì)的兩位前領(lǐng)導(dǎo)，Timnit Gebru和 Margaret Mitchell，他們在共同撰寫了一篇強(qiáng)調(diào)對此類模型的擔(dān)憂的論文之后就被迫離職了。除此之外，這篇論文引用的研究表明，大型語言模型會延續(xù)人類的偏見和刻板印象，并可能導(dǎo)致氣候變化。該論文稱，隨著語言模型變得越來越龐大，糟糕的數(shù)據(jù)標(biāo)記和管理實(shí)踐會變成更大的問題。至關(guān)重要的是，論文還指出，大型語言模型對社會造成的危險(xiǎn)最有可能落在被邊緣化的社區(qū)身上。

今年 1 月，近期另一篇批評大型語言模型的人工智能研究論文的作者，說谷歌法律和政策團(tuán)隊(duì)的干預(yù)“非常陰險(xiǎn)”。今年 3 月，來自谷歌DeepMind 的研究人員發(fā)現(xiàn)，大型語言模型可以通過傳播刻板印象、失業(yè)和虛假信息，在創(chuàng)作者沒有任何惡意的情況下給社會造成危害。

來源：36氪

編輯：IPRdaily王穎校對：IPRdaily縱橫君

青年有為！尋找2021年“40位40歲以下企業(yè)知識產(chǎn)權(quán)精英”活動(dòng)正式啟動(dòng)

報(bào)名！2021年「廣東省知識產(chǎn)權(quán)代理人才培訓(xùn)班」來啦！

谷歌黑科技：用人工智能，把搜索變成對話

「關(guān)于IPRdaily」

IPRdaily是具有全球影響力的知識產(chǎn)權(quán)媒體，致力于連接全球知識產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個(gè)國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識產(chǎn)權(quán)負(fù)責(zé)人，還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬用戶（國內(nèi)70余萬+海外近30萬），2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。

（英文官網(wǎng)：iprdaily.com 中文官網(wǎng)：iprdaily.cn）

本文來自36氪并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意，并附上出處與作者信息。文章不代表IPRdaily.cn立場，如若轉(zhuǎn)載，請注明出處：“http://www.islanderfriend.com/

谷歌黑科技：用人工智能，把搜索變成對話

谷歌黑科技：用人工智能，把搜索變成對話