#本文僅代表作者觀點,不代表IPRdaily立場#
原標題:谷歌黑科技:用人工智能,把搜索變成對話
6月16日舉辦的的I/O大會上,谷歌展示了LaMDA,一款“可以就任何話題展開對話”的人工智能。谷歌CEO Sundar Pichai表示,LaMDA 的自然對話功能有可能徹底改變信息和計算,讓它們變得更易于訪問和使用。未來的搜索也許就會像跟專家對話一樣,通過一段段的對話,慢慢把你想要的答案呈現(xiàn)出來。
重點:
谷歌最近推出了LaMDA,一款 “可以就任何話題展開對話”的人工智能
谷歌對搜索未來的將以人工智能為中心
這種AI可以推斷人類語言的含義,參與對話,并像專家一樣回答由多環(huán)節(jié)構(gòu)成的問題
谷歌還推出了另一款人工智能工具,也就是所謂的多任務(wù)統(tǒng)一模型(MUM),讓用戶結(jié)合文字和圖像進行查詢
使用大型語言模型的搜索引擎可提出建議、檢索文檔、回答問題并完成廣泛的任務(wù),但依然存在偏見的風險
谷歌經(jīng)常會利用自己一年一度舉辦的開發(fā)者大會 I/O 來展示其令人驚嘆的人工智能。2016 年,它推出了帶內(nèi)置Google Assistant 的 Google Home 智能音箱。2018 年,為企業(yè)接聽電話和安排約會的Duplex 首次亮相。按照這一傳統(tǒng),上個月,首席執(zhí)行官Sundar Pichai宣布推出了LaMDA ,一款 “可以就任何話題展開對話”的人工智能。
在臺上的演示中,Pichai展示了跟紙飛機以及天體冥王星交流是什么感覺。對于每一個查詢,LaMDA 都會用三到四個句子來予以回應(yīng),就好像兩個人之間進行的自然對話一樣。Pichai說,慢慢地,LAMDA將會融入到谷歌的其他產(chǎn)品之中,比如Assistant和Workspace,以及最關(guān)鍵的搜索。
Pichai說:“我們相信LaMDA 的自然對話功能有可能徹底改變信息和計算,讓它們變得更易于訪問和使用。”
這次LAMDA的演示為我們提供一個窗口,讓我們得以一窺谷歌對搜索的愿景,這個愿景已經(jīng)超越了鏈接列表,并可能改變數(shù)十億人對web的搜索方式。這個愿景將以人工智能為中心,它可以推斷人類語言的含義,參與對話,并像專家一樣回答由多環(huán)節(jié)構(gòu)成的問題。
同樣也是在6月16日舉辦的I/O 大會上,谷歌還推出了另一款人工智能工具,也就是所謂的多任務(wù)統(tǒng)一模型 (Multitask Unified Model ,MUM),它可以在搜索的時候把文本和圖像考慮在內(nèi)。谷歌副總裁Prabhakar Raghavan說,有朝一日用戶可以拍下一雙鞋的照片,然后到搜索引擎詢問這雙鞋是否適合攀登富士山的時候穿。
MUM 可以生成 75 種語言的結(jié)果,谷歌聲稱這可以讓它對世界的了解更加全面。臺上的演示展示了 MUM 是怎么響應(yīng)搜索查詢的,當用戶輸入“我已經(jīng)爬過亞當斯山了,現(xiàn)在我想明年秋天爬富士山,我該怎么做?” 這個搜索查詢跟我們今天在谷歌上進行的搜索在表述上有所不同,因為 MUM的目標是減少查找到答案所需的搜索次數(shù)。MUM 既可以對文本進行概括也可以生成文本;它會知道拿亞當斯山與富士山進行比較,并且知道為遠足做準備可能需要有關(guān)健身訓練、遠足裝備推薦以及天氣預(yù)報方面的搜索結(jié)果。
在上個月發(fā)表的一篇題為“重新思考搜索:從業(yè)余愛好者變成專家”的論文中,谷歌研究院的四位工程師把搜索設(shè)想成跟人類專家的對話。論文提到了一個例子,搜索“紅葡萄酒的健康益處和風險是什么?”目前,谷歌會回復(fù)一個要點列表。而這篇論文表明,未來搜索引擎的回應(yīng)可能看起來更像是一段話,里面會說紅酒可促進心血管健康,但可能會弄臟你的牙齒,并且會補充相關(guān)的信息來源與鏈接。論文顯示,回復(fù)是文本形式,但你很容易會想到口頭回復(fù)的可能性,就像今天我們使用 Google Assistant 的體驗一樣。
不過更多地依賴人工智能來破譯文本也存在風險,因為計算機依然難以理解語言的各種微妙復(fù)雜之處。用來完成生成文本或回答問題等任務(wù)的最先進的人工智能,也就是所謂的大型語言模型,已經(jīng)顯示出存在放大偏見,以及生成不可預(yù)測或有害文本的傾向。其中有一個模型,也就是OpenAI 的GPT-3,已被用于為動畫角色創(chuàng)建互動故事,但在一個在線游戲里面它也生成過牽涉到兒童性愛場景的文字。
作為去年發(fā)表并進行展示的一篇論文的一部分,來自麻省理工學院、英特爾和以及Facebook 的研究人員發(fā)現(xiàn),大型語言模型表現(xiàn)出基于對種族、性別、宗教和職業(yè)所存在的刻板印象的偏見。
擁有自然語言處理倫理學博士學位的語言學家Rachael Tatman表示,隨著這些模型生成的文本變得越來越有說服力,它可以讓大家相信自己正在跟能夠理解自己所表達單詞含義的人工智能交談。但生成——其實對世界并沒有常識性的理解。當它生成對殘疾人或穆斯林有害的文本或者告訴大家去自殺時,這可能就會造成問題。Tatman回憶起一位圖書管理員曾經(jīng)教過自己怎么去判斷 Google 的搜索結(jié)果是否有效。她說,如果谷歌把大型語言模型跟搜索結(jié)合起來的話,用戶就得被迫學會怎么評估跟專家 AI 的對話。
Google 是一家建立在 PageRank 之上的公司。PageRank 是公司聯(lián)合創(chuàng)始人 Larry Page 和 Sergey Brin在 1990 年代后期研究式創(chuàng)建出來的一種算法。這種算法要依賴于索引——這是一個利用算法對網(wǎng)站進行排序和評估的過程。后來慢慢地,谷歌又把知識圖譜,一個龐大的事實庫,納入到搜索結(jié)果里面。
最近,谷歌開始把語言模型納入到搜索響應(yīng)里面。2019 年,該公司把一種叫做 BERT 的模型植入到搜索里面,以便回答對話式搜索查詢、建議搜索,并對出現(xiàn)在搜索結(jié)果下方的文本進行摘要。當時,谷歌副總裁Pandu Nayak稱這是五年來搜索領(lǐng)域取得的最大進步,也是“搜索史上最大的飛躍之一”。微軟的 Bing在提供搜索結(jié)果時也用到了BERT。
BERT 在 2018 年的引入在科技巨頭之間開啟了一場競賽,大家都在競相創(chuàng)建出規(guī)模更大的語言模型,力爭在語言理解或回答問題等任務(wù)上在 GLUE 等流行的性能排行榜上能取得更高的排名。不久之后,百度推出了Ernie,Nvidia推出了Megatron,微軟推出了 T-NLG,OpenAI 推出了 GPT-3。工程師通常會通過參數(shù)的數(shù)量,也就是深度學習系統(tǒng)中人工神經(jīng)元之間連接的度量來評估這些模型。BERT 包含了數(shù)億個參數(shù),GPT-3 的參數(shù)則高達1750 億個。今年1 月,谷歌發(fā)布了一個帶有 1 萬億參數(shù)的語言模型。在 Google 今年的 I/O 活動上,Raghavan稱在參數(shù)的數(shù)量上 MUM 比 BERT 強大 1000 倍。
在《重新思考搜索》那篇論文中,谷歌研究人員稱索引是現(xiàn)代搜索的馱馬。但是他們設(shè)想今后通過利用能理解更多查詢的,更龐大的語言模型來消除索引。
比方說,知識圖譜可以針對對事實問題提供答案,但那只針對web的一小部分進行了訓練。使用基于更廣泛的web構(gòu)建的語言模型,將可以讓搜索引擎提出建議、檢索文檔、回答問題并完成廣泛的任務(wù)。《重新思考搜索》那篇論文的作者表示,這種方法有可能帶來“思維的變革性轉(zhuǎn)變”。
這樣的模型并不存在。事實上,作者說這可能需要創(chuàng)建出通用人工智能,或在信息檢索和機器學習等領(lǐng)域取得進步。此外,他們希望這種新方法能夠從多個角度提供權(quán)威答案,清晰地披露來源,并且不帶偏見。
谷歌發(fā)言人把LaMDA和 MUM說成是谷歌下一代語言模型研究的一部分,并且表示, MUM 目前正在內(nèi)部開展試點,來幫助大家查詢數(shù)十億個主題。在被問及《重新思考搜索》那篇論文跟LaMDA和 MUM 的關(guān)系時,這位發(fā)言人表示,Google Research并沒有給谷歌產(chǎn)品設(shè)定方向,進入谷歌產(chǎn)品(如搜索)的機器學習通常是作為補充而不是取代現(xiàn)有產(chǎn)品。
他們的野心比展示廣告領(lǐng)域要大多了。
Michael Blumenthal,搜索顧問
不可避免地,谷歌搜索算法的任何變化都會影響到核心的廣告業(yè)務(wù)。這一該業(yè)務(wù)去年為谷歌創(chuàng)造了 1470 億美元的收入。搜索顧問Michael Blumenthal表示,關(guān)于登山靴的 MUM 演示表明,谷歌希望在連接企業(yè)與消費者之間發(fā)揮更大的作用。上個月的另一個變化是,谷歌引入了跟Shopify的集成,將 170 萬商家的商品帶到搜索結(jié)果里面。2019年,外賣公司DoorDash和Postmates已經(jīng)進入到搜索結(jié)果里面。
20 年來一直為企業(yè)提供搜索策略咨詢服務(wù)的 Blumenthal 指出,谷歌搜索結(jié)果已經(jīng)從由 PageRank 提供的鏈接列表,演變?yōu)榘褟V告、知識面板、地圖、視頻和增強現(xiàn)實納入在內(nèi)。
這種轉(zhuǎn)變導致了部分人所謂的零點擊搜索(zero-click)的興起。零點擊搜索,是指大家將不再靠點擊進入網(wǎng)站來完成一次web搜索。這讓 Google 能夠在不需要用戶離開谷歌渠道別的地方的情況下獲得廣告收入。數(shù)字數(shù)據(jù)公司Similarweb估計,去年在近三分之二的谷歌搜索當中用戶都沒有點擊進入到另一個頁面;在移動設(shè)備上,點擊率(click-through rates)尤其低。
Blumenthal在談到谷歌正在考慮進行的搜索變革時說:“在我看來,他們的野心要比展示廣告領(lǐng)域大多了。他們喜歡將各方連接起來進行交易,所以我把這看作是極大地增強了這一點?!?br/>
強調(diào)用自然語言或圖像進行搜索的變化可能會讓用戶不再把注意力放在關(guān)鍵字上,而且還會破壞價值數(shù)十億美元的搜索引擎優(yōu)化業(yè)務(wù)——目前企業(yè)仍爭相靠這一業(yè)務(wù)讓自己靠近搜索結(jié)果的頂部。
部分搜索引擎優(yōu)化公司一直在為自然語言的未來做著準備。Copysmith.ai 是一家總部位于美國阿拉巴馬州伯明翰的初創(chuàng)企業(yè),它利用了 GPT-3來為網(wǎng)站生成 SEO元標簽等。公司的首席執(zhí)行官Shegun Otulana表示,該公司不認為谷歌最近的舉動“是一種威脅,而是整個人工智能領(lǐng)域往前又邁進了一步。這證實了我們正在朝著正確的方向前進。”
Blumenthal則表示,I/O上面發(fā)布的引人注目的公告可能需要數(shù)年的時間才能兌現(xiàn)承諾,但他同時表示,有一點越來越清楚,谷歌想要的不僅僅是事實和鏈接的集合,而是希望自己更像一位能夠回答復(fù)雜問題的專家?!拔ㄒ坏膯栴}是他們什么時候能到達那里,”他說。
谷歌把大型語言模型作為商業(yè)戰(zhàn)略和研究重點的做法在公司內(nèi)部造成了沖突。最值得注意的一點是,谷歌 Ethical AI 團隊的兩位前領(lǐng)導,Timnit Gebru和 Margaret Mitchell,他們在共同撰寫了一篇強調(diào)對此類模型的擔憂的論文之后就被迫離職了。除此之外,這篇論文引用的研究表明,大型語言模型會延續(xù)人類的偏見和刻板印象,并可能導致氣候變化。該論文稱,隨著語言模型變得越來越龐大,糟糕的數(shù)據(jù)標記和管理實踐會變成更大的問題。至關(guān)重要的是,論文還指出,大型語言模型對社會造成的危險最有可能落在被邊緣化的社區(qū)身上。
今年 1 月,近期另一篇批評大型語言模型的人工智能研究論文的作者,說谷歌法律和政策團隊的干預(yù)“非常陰險”。今年 3 月,來自谷歌DeepMind 的研究人員發(fā)現(xiàn),大型語言模型可以通過傳播刻板印象、失業(yè)和虛假信息,在創(chuàng)作者沒有任何惡意的情況下給社會造成危害。
來源:36氪
編輯:IPRdaily王穎 校對:IPRdaily縱橫君
青年有為!尋找2021年“40位40歲以下企業(yè)知識產(chǎn)權(quán)精英”活動正式啟動
報名!2021年「廣東省知識產(chǎn)權(quán)代理人才培訓班」來啦!
「關(guān)于IPRdaily」
IPRdaily是具有全球影響力的知識產(chǎn)權(quán)媒體,致力于連接全球知識產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識產(chǎn)權(quán)負責人,還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機構(gòu)的全球近100萬用戶(國內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自36氪并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請注明出處:“http://islanderfriend.com/
文章不錯,犒勞下辛苦的作者吧