返回
頂部
我們已發(fā)送驗(yàn)證鏈接到您的郵箱,請(qǐng)查收并驗(yàn)證
沒收到驗(yàn)證郵件?請(qǐng)確認(rèn)郵箱是否正確或 重新發(fā)送郵件
確定
產(chǎn)業(yè)行業(yè)政策訴訟TOP100招聘灣區(qū)IP動(dòng)態(tài)職場(chǎng)人物國際視野許可交易深度專題活動(dòng)商標(biāo)版權(quán)Oversea晨報(bào)董圖產(chǎn)品公司審查員說法官說首席知識(shí)產(chǎn)權(quán)官G40領(lǐng)袖機(jī)構(gòu)企業(yè)專利大洋洲律所

是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

深度
灣區(qū)知識(shí)產(chǎn)權(quán)4年前
是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

#本文僅代表作者觀點(diǎn),不代表IPRdaily立場(chǎng),未經(jīng)作者許可,禁止轉(zhuǎn)載#


來源:IPRdaily中文網(wǎng)(iprdaily.cn)

作者:北京專獵前沿技術(shù)有限公司

原標(biāo)題:是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述


從上世紀(jì)60年代算起,計(jì)算機(jī)視覺的歷史也不過半個(gè)多世紀(jì),跟整個(gè)人類歷史相比,眨眼之瞬而已。然而,即使在這半個(gè)多世紀(jì)的時(shí)間里,計(jì)算機(jī)視覺已經(jīng)從最開始簡(jiǎn)單地處理數(shù)字圖像發(fā)展到現(xiàn)在可以在多種情景下準(zhǔn)確地進(jìn)行人臉識(shí)別,目標(biāo)跟蹤等。隨著算法的更迭、算力的提升、數(shù)據(jù)的爆發(fā)以及未來5G帶來的高速網(wǎng)絡(luò),計(jì)算機(jī)視覺的發(fā)展和應(yīng)用更有著充滿想象的巨大空間。


何為計(jì)算機(jī)視覺


從2016年AlphaGo以4:1戰(zhàn)勝世界圍棋冠軍李世石到2017年人工智能被正式寫入國家“十三五”規(guī)劃綱要,再到2021年“十四五”規(guī)劃將人工智能列為前沿科技領(lǐng)域的“最高優(yōu)先級(jí)”,人工智能已在風(fēng)口迎風(fēng)飛翔多年,成為當(dāng)下最熱門的科學(xué)技術(shù)。作為人工智能的三大核心技術(shù)之一(另外兩項(xiàng)為自然語言處理和語音識(shí)別),計(jì)算機(jī)視覺更是迎來了蓬勃發(fā)展。


日常生活中,我們經(jīng)常使用的人臉解鎖、刷臉支付、人臉身份驗(yàn)證、智能美顏、拍攝背景虛化等,其背后都是計(jì)算機(jī)視覺技術(shù)在支撐。除此之外,公共安防、無人駕駛、醫(yī)療診斷、文化旅行、教育、農(nóng)業(yè)等領(lǐng)域,都有計(jì)算機(jī)視覺的身影,可以說計(jì)算機(jī)視覺在商業(yè)化應(yīng)用上已百花齊放,滲透到生活的方方面面。根據(jù)Tractica預(yù)測(cè),到2025年,全球計(jì)算機(jī)視覺市場(chǎng)規(guī)模(包括軟件、硬件和服務(wù)收入)將從2016年的11億美元增長到262億美元。


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 1 2016-2025年計(jì)算機(jī)視覺市場(chǎng)規(guī)模_Tractica預(yù)測(cè)數(shù)據(jù)

數(shù)據(jù)來源:Tractica


何為計(jì)算機(jī)視覺?計(jì)算機(jī)視覺是以圖像(視頻)為輸入,以對(duì)環(huán)境的表達(dá)(representation)和理解為目標(biāo),研究圖像信息組織、物體和場(chǎng)景識(shí)別、進(jìn)而對(duì)事件給予解釋的學(xué)科。計(jì)算機(jī)視覺的研究內(nèi)容,大體可以分為物體視覺(object vision)和空間視覺(spatial vision)兩大部分。物體視覺在于對(duì)物體進(jìn)行精細(xì)分類和鑒別,而空間視覺在于確定物體的位置和形狀,為“動(dòng)作(action)”服務(wù)。從本質(zhì)上講,計(jì)算機(jī)視覺就是研究視覺感知問題,“賦予機(jī)器自然視覺能力”。


透過專利看計(jì)算機(jī)視覺的發(fā)展史


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 2 全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)趨勢(shì)


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 3 全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)主要受理局分布


注:由于發(fā)明專利申請(qǐng)的公開相對(duì)于申請(qǐng)日而言有滯后期,一般為18個(gè)月,因而2019、2020年的專利申請(qǐng)尚有部分未公開,與實(shí)際情況相比,其數(shù)據(jù)有一定程度的偏低。


同其他科學(xué)技術(shù)一樣,計(jì)算機(jī)視覺的發(fā)展也是由最初的萌芽期一路走到了如今的井噴發(fā)展期(圖2)。


技術(shù)萌芽期


20世紀(jì)60年代,尤其是1965年以后,是計(jì)算機(jī)視覺的技術(shù)萌芽期。1966年,人工智能學(xué)家Minsky在給學(xué)生布置的作業(yè)中,要求學(xué)生通過編寫一個(gè)程序讓計(jì)算機(jī)告訴我們它通過攝像頭看到了什么,這被認(rèn)為是計(jì)算機(jī)視覺最早的任務(wù)描述[1]。從此,計(jì)算機(jī)視覺的研究序幕拉開,并將迎來屬于它自己的跌宕起伏波瀾壯闊的歷史篇章。


1965年-1968年,全球計(jì)算機(jī)視覺相關(guān)專利申請(qǐng)總數(shù)在2000篇以下,并以每年百篇左右的數(shù)量遞增著。這一時(shí)期的研究集中在美歐兩地(圖3),美國的IBM一枝獨(dú)秀,是最主要的研究企業(yè);其次為德國的西門子(圖4)。


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 4 1965-1968年全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)Top15


慢速增長期


20世紀(jì)60年代末至90年代,隨著現(xiàn)代電子計(jì)算機(jī)的出現(xiàn)以及對(duì)計(jì)算機(jī)視覺研究的深入,人們開始嘗試不同的算法。計(jì)算機(jī)視覺研究進(jìn)入了相對(duì)慢速但“百家爭(zhēng)鳴”般的增長期,全球?qū)@暾?qǐng)數(shù)量以年均10%左右的速度增長。


雖然在七十年代中期美國的MIT人工智能實(shí)驗(yàn)室正式開設(shè)計(jì)算機(jī)視覺課程,在1982年英國的David Marr發(fā)表了《視覺》一書,標(biāo)志著計(jì)算機(jī)視覺成為一門獨(dú)立學(xué)科,但是計(jì)算機(jī)視覺的研究已經(jīng)西風(fēng)東漸,日本成為全球最主要、最大的研究地。從1970到1990年左右,全球50%以上的專利申請(qǐng)都出自日本,而同時(shí)期美國的專利申請(qǐng)數(shù)量占全球?qū)@暾?qǐng)總數(shù)的10%不到,而且無論是專利申請(qǐng)數(shù)量還是專利申請(qǐng)?jiān)鲩L速度,日本都遠(yuǎn)超歐美(圖3)。即使1990年以后,美國的研究開始發(fā)力,歷年專利申請(qǐng)數(shù)量呈線性增加,歐洲和韓國地區(qū)的專利申請(qǐng)數(shù)量也在逐年遞增,但是日本的專利申請(qǐng)數(shù)量依然占有絕對(duì)優(yōu)勢(shì)。這一時(shí)期,在全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)排名前15的企業(yè)中,除美國的IBM(第7)和荷蘭的皇家飛利浦(第14)外,其余全是日本企業(yè)(圖5),佳能、東芝、日立、富士通、日本電氣等響當(dāng)當(dāng)?shù)钠髽I(yè)高居榜單前5。


另外,現(xiàn)代CNN網(wǎng)絡(luò)中卷積層+池化層的最初范例及靈驗(yàn)來源,世界上第一個(gè)神經(jīng)網(wǎng)絡(luò)——Neocognitron[2],也是由日本計(jì)算科學(xué)家Kunihiko Fukushima在1980年提出的??梢哉f,這是屬于日本的高光時(shí)刻。


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 5 1969-1999全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)top15


平穩(wěn)過渡期


21世紀(jì)前10年,得益于計(jì)算機(jī)算力的飛躍式提升,以及互聯(lián)網(wǎng)和社交媒體的發(fā)展,全球數(shù)據(jù)達(dá)到ZB級(jí)別,計(jì)算機(jī)視覺的算法研究從“百家爭(zhēng)鳴”逐漸聚焦到機(jī)器學(xué)習(xí)。計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)經(jīng)過世紀(jì)初的猛增后,進(jìn)入一個(gè)平穩(wěn)過渡期,歷年的專利申請(qǐng)數(shù)量基本沒有增加,徘徊在35000件左右。雖然這一時(shí)期全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)排名前15中,日本企業(yè)依然占有11席(圖6),但日本專利申請(qǐng)的歷年數(shù)量呈下降趨勢(shì),計(jì)算機(jī)視覺的研發(fā)由集中在日本漸漸地轉(zhuǎn)向以美歐日韓為主的多地發(fā)展(圖3)。荷蘭的皇家飛利浦在醫(yī)療健康領(lǐng)域的重點(diǎn)突破,美國的微軟在中國設(shè)立微軟亞洲研究院專門研究計(jì)算機(jī)視覺,以及韓國的三星經(jīng)過20世紀(jì)90年代的研究積累,使得他們躋身進(jìn)2000-2009年全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)排名前10(圖6)。


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 6 2000-2009年全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)Top15


同一時(shí)期,大洋彼岸的中國,雖然專利申請(qǐng)數(shù)量在逐年增加,但其專利申請(qǐng)基本來自諸如索尼、皇家飛利浦、三星、微軟等海外巨頭在中國的布局,中國計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)前15中,還沒有中國企業(yè)的名字(圖7)。中國企業(yè)的計(jì)算機(jī)視覺研究還處于萌芽狀態(tài)。


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 7 2000-2009年中國計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)top15


這段時(shí)間,具有標(biāo)志性的事件為:


2006年,Geoffrey Hinton教授提出了深度學(xué)習(xí)的概念,并通過逐層訓(xùn)練的方法解決了深度神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練的問題[2]。


2009年,李飛飛教授等在CVPR2009上發(fā)表了一篇名為《ImageNet: A Large-Scale Hierarchical Image Database》的論文,發(fā)布了ImageNet數(shù)據(jù)集,這是為了檢測(cè)計(jì)算機(jī)視覺能否識(shí)別自然萬物,回歸機(jī)器學(xué)習(xí),克服過擬合問題,經(jīng)過三年多籌劃組建完成的一個(gè)大的數(shù)據(jù)集。ImageNet是計(jì)算機(jī)視覺發(fā)展的重要推動(dòng)者,和深度學(xué)習(xí)熱潮的關(guān)鍵推動(dòng)者,將目標(biāo)檢測(cè)算法推向了新的高度[3]。


快速增長期


2010-2015年,計(jì)算機(jī)的算力遵循著“摩爾定律”穩(wěn)步提升,互聯(lián)網(wǎng)及社交媒體的進(jìn)一步普及帶來爆發(fā)式增長的大數(shù)據(jù),深度學(xué)習(xí)算法開始流行,成為計(jì)算機(jī)視覺領(lǐng)域最主要的算法。計(jì)算機(jī)視覺也進(jìn)入了一個(gè)快速發(fā)展期,全球?qū)@暾?qǐng)數(shù)量以年均17%左右的速度增長。其中,美國專利申請(qǐng)數(shù)量的年均增長率約為23%,美國正式取代日本,成為計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)量最大的國家。在2010-2015年全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)前10名中,美國企業(yè)占5席,分別為微軟(第2),谷歌(第5),高通(第6),IBM(第7)和Intel(第9)。中國專利申請(qǐng)數(shù)量更是以年均33%左右的速度增長,中國企業(yè)的計(jì)算機(jī)視覺研究也從小芽長成了一棵小苗。2010-2015年全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)前15名榜單中,也首次出現(xiàn)了中國企業(yè)的身影:聯(lián)想,第15(圖8)。此外,韓國的三星依靠其龐大的家電和手機(jī)產(chǎn)品整合計(jì)算機(jī)視覺技術(shù),高居榜首位置;日本的索尼、佳能、富士通、日本電氣、理光等5家企業(yè)也榜上有名。


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 8 2010-2015年全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)Top15


這一時(shí)期,具有里程碑式的標(biāo)志事件為[3]:


2012年,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 創(chuàng)造了一個(gè)“大型的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)”,也即現(xiàn)在眾所周知的AlexNet,將圖像識(shí)別錯(cuò)誤率降低了10%,贏得了當(dāng)年的 ILSVRC競(jìng)賽(是機(jī)器視覺領(lǐng)域最受追捧也是最具權(quán)威的學(xué)術(shù)競(jìng)賽之一,代表了圖像領(lǐng)域的最高水平)這是史上第一次有模型在 ImageNet 數(shù)據(jù)集表現(xiàn)如此出色。自那時(shí)起,CNN成了家喻戶曉的名字。


2014年,蒙特利爾大學(xué)提出生成對(duì)抗網(wǎng)絡(luò)(GAN):擁有兩個(gè)相互競(jìng)爭(zhēng)的神經(jīng)網(wǎng)絡(luò)可以使機(jī)器學(xué)習(xí)得更快。一個(gè)網(wǎng)絡(luò)嘗試模仿真實(shí)數(shù)據(jù)生成假的數(shù)據(jù),而另一個(gè)網(wǎng)絡(luò)則試圖將假數(shù)據(jù)區(qū)分出來。


井噴發(fā)展期


2016年及以后,計(jì)算機(jī)視覺技術(shù)逐漸賦能各行業(yè),應(yīng)用場(chǎng)景紛紛落地。廣闊的商業(yè)化應(yīng)用為計(jì)算機(jī)視覺的發(fā)展注入強(qiáng)勁動(dòng)力,至此,計(jì)算機(jī)視覺領(lǐng)域的研究進(jìn)入井噴狀態(tài),如春風(fēng)拂地萬物在不經(jīng)意間復(fù)蘇一般,全球的研發(fā)格局也在悄然地發(fā)生變化。


2016-2018年間,全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)年均增長率超過20%(2019及2020年的因?qū)@暾?qǐng)到公開的時(shí)間遲滯原因,在此未統(tǒng)計(jì)),中美日韓歐成為主要的研發(fā)陣地。其中,中國專利申請(qǐng)的年均增長率超過40%,貢獻(xiàn)了全球最主要的專利申請(qǐng)?jiān)鲩L,同時(shí),中國也超越美國,成為新一屆的專利申請(qǐng)最大的國家。2016-2020年全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)前15名中,美國企業(yè)5家、日本企業(yè)3家、韓國企業(yè)1家,而中國企業(yè)有6家,開始占據(jù)明顯地位。這6家中國企業(yè)分別是騰訊(第2),OPPO(第5),平安科技(第11),華為(第12),阿里巴巴(第14)和商湯科技(第15)。騰訊和OPPO更是超過微軟、佳能、索尼等老牌企業(yè),躋身進(jìn)前5(圖9)。


作為國內(nèi)的傳統(tǒng)互聯(lián)網(wǎng)巨頭,一直以推動(dòng)科技創(chuàng)新為愿景的騰訊充分集成利用自身的數(shù)據(jù)資源、人才資源和軟硬件技術(shù)基礎(chǔ),打造出風(fēng)靡全國的人工智能系統(tǒng)和平臺(tái)。旗下的騰訊優(yōu)圖實(shí)驗(yàn)室從2012年開始專注計(jì)算機(jī)視覺技術(shù)研發(fā),其在2017年研發(fā)出的“優(yōu)圖祖母模型”以及“目標(biāo)關(guān)聯(lián)算法”在多個(gè)比賽中排名第一甚至刷新世界紀(jì)錄;在2020年輸出超過50篇優(yōu)秀論文,入選多個(gè)行業(yè)頂級(jí)學(xué)術(shù)會(huì)議,內(nèi)容涵蓋目標(biāo)跟蹤、行人重識(shí)別、視頻識(shí)別等多個(gè)熱門及前沿領(lǐng)域。


以拍照手機(jī)出名的OPPO已在圖像處理上深耕多年,2012年OPPO首次在手機(jī)自拍上實(shí)現(xiàn)了美顏拍攝功能,開創(chuàng)了“手機(jī)自拍美顏”時(shí)代;2018年,OPPO研究院在深圳成立,計(jì)算機(jī)視覺是其重要的研究方向之一;2020年的全球計(jì)算機(jī)視覺頂級(jí)會(huì)議CVPR (Conference on Computer Vision and Pattern Recognition) 上,OPPO共獲兩項(xiàng)第一,兩項(xiàng)第三。


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 9 2016-2020年全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)Top15


總體來說,這一時(shí)期的美國引領(lǐng)著主流技術(shù)發(fā)展方向;日本的高光時(shí)刻已經(jīng)一去不復(fù)返,韓國靠著三星撐起半邊天,而中國的計(jì)算機(jī)視覺研究從小苗開始生長出更多的枝丫。


最新的計(jì)算機(jī)視覺研發(fā)格局


分析2020年公開的計(jì)算機(jī)視覺領(lǐng)域的專利申請(qǐng)情況,得以管中窺豹,了解最新的計(jì)算機(jī)視覺研發(fā)格局。


國際格局


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 10 2020年公開的全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)Top15


2020年公開的全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)中,中美日韓的企業(yè)占據(jù)著專利申請(qǐng)數(shù)量的前15(圖10),其中美國企業(yè)5家,日本企業(yè)2家,韓國企業(yè)2家,中國企業(yè)6家。得益于國內(nèi)新基建的建設(shè)以及豐富的計(jì)算機(jī)視覺應(yīng)用場(chǎng)景,中國在企業(yè)數(shù)量和專利申請(qǐng)數(shù)量上大有后來追上之勢(shì)。


前10名的申請(qǐng)人中:


韓國的三星因其廣泛的產(chǎn)品線使得計(jì)算機(jī)視覺擁有廣闊的落地場(chǎng)景,其專利申請(qǐng)數(shù)量穩(wěn)列第一位。美國的IBM、微軟、谷歌、蘋果分別位于第3、4、5和第9位。IBM一直注重人工智能方面的基礎(chǔ)性研究,從20世紀(jì)60年代開始就已經(jīng)是計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)前15榜單中的??停晃④浐凸雀枋悄壳叭斯ぶ悄芗夹g(shù)的領(lǐng)軍企業(yè),他們掌握和引領(lǐng)著主流技術(shù)方向,目前全球的人工智能開發(fā)方案中有相當(dāng)大的比例是基于微軟、谷歌等發(fā)布的基礎(chǔ)框架型構(gòu)架而進(jìn)行的;蘋果在2010年以后收購了十幾家人工智能公司,將人工智能服務(wù)于自身的系列產(chǎn)品,提高現(xiàn)有產(chǎn)品體驗(yàn)。日本的索尼與佳能分別位于第6和第7位。他們是傳統(tǒng)的光學(xué)產(chǎn)品大廠,計(jì)算機(jī)圖像處理方面有深厚的研發(fā)底蘊(yùn),其研發(fā)實(shí)力在上世紀(jì)七八十年代已經(jīng)顯現(xiàn)。


中國的企業(yè)除前面提到的騰訊、OPPO分別位列第2和第8外,成立于2014年的商湯科技以迅雷之勢(shì)超過美國的Intel、日本的富士通和國內(nèi)的華為、平安科技,進(jìn)入前10名,在一眾國內(nèi)外聲名顯赫的科技巨頭企業(yè)中格外顯眼。而商湯科技的成績不止于此:2018年,商湯科技被中國科技部指定為首個(gè)“智能視覺”國家新一代人工智能開放創(chuàng)新平臺(tái);2019年的ICCV (the International Conference on Computer Vision) 上,商湯科技及其聯(lián)合實(shí)驗(yàn)室以入選57篇論文的成績備受矚目;2020年的CVPR上,商湯科技的入選論文數(shù)超過微軟、Facebook等科技巨頭,并拿下了CVPR2020 ActivityNet 時(shí)空動(dòng)作定位賽道、動(dòng)作分類賽道,以及 CVPR 2020 NTIRE 競(jìng)賽等3項(xiàng)世界冠軍。自成立以來,商湯科技已在各種重要賽事中,斬獲了60多個(gè)世界第一。


國內(nèi)格局


圖10中上榜的6家中國企業(yè),在一定程度上體現(xiàn)出了我國計(jì)算機(jī)視覺的研究格局:這6家企業(yè)中,有擁有數(shù)據(jù)資源、人才資源和軟硬件技術(shù)基礎(chǔ)優(yōu)勢(shì)的互聯(lián)網(wǎng)巨頭BAT(百度,阿里巴巴,騰訊),有擁有龐大智能應(yīng)用終端承載計(jì)算機(jī)視覺技術(shù)的OPPO、華為(根據(jù)國際知名市場(chǎng)分析機(jī)構(gòu)Counterpoint的數(shù)據(jù)顯示:2021年1月OPPO、華為為國內(nèi)前二智能手機(jī)品牌,分別占據(jù)國內(nèi)智能手機(jī)份額的21%和20%),以及有專注于計(jì)算機(jī)視覺基礎(chǔ)研究與應(yīng)用的商湯科技。這些企業(yè),代表了國內(nèi)計(jì)算機(jī)視覺的最新、最強(qiáng)的研究實(shí)力。


另一方面,企業(yè)的海外專利申請(qǐng)是為其業(yè)務(wù)拓展保駕護(hù)航,海外布局策略和其業(yè)務(wù)拓展策略是一致的。2020年公開的專利申請(qǐng)中,中國企業(yè)在中國大陸之外的專利申請(qǐng)量排名前5名分別為騰訊、華為、阿里巴巴、OPPO、商湯科技(圖11)。騰訊和阿里巴巴在中國大陸之外的布局策略比較一致,中國香港為其主要布局地,其次為專利五局中的美日韓歐。華為在中國大陸之外布局策略主要在專利五局中的美日韓歐,美歐為主場(chǎng)。OPPO與商湯科技在中國大陸之外布局策略類似,除了美日韓歐外,在中國香港、中國臺(tái)灣等地也有較多的布局,但相較起來,商湯科技在中國大陸之外布局更加均衡,在一些未來新興市場(chǎng),比如新加坡、印度,商湯科技也提前進(jìn)行了布局,擁有較多的專利申請(qǐng)。


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 11 2020年公開的中國企業(yè)在中國大陸之外計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)排名Top10


基礎(chǔ)算法研究格局


計(jì)算機(jī)視覺的發(fā)展有四大要素:算法、算力、數(shù)據(jù)和場(chǎng)景。萬丈高樓平地起,地基是基礎(chǔ)。而基礎(chǔ)算法就是計(jì)算機(jī)視覺這座高樓的地基。IPC分類號(hào)中,G06N對(duì)應(yīng)的分類號(hào)包括了目前主流的計(jì)算機(jī)視覺算法——深度學(xué)習(xí)所涉及的主要技術(shù),即:G06N3/02(采用神經(jīng)網(wǎng)絡(luò)模型),G06N3/04(體系結(jié)構(gòu),例如,互連拓?fù)洌?,G06N3/08(學(xué)習(xí)方法),G06N20/00(機(jī)器學(xué)習(xí))。2020年公開的全球計(jì)算機(jī)視覺領(lǐng)域?qū)@暾?qǐng)中,篩選出G06N下的專利申請(qǐng),得到全球?qū)@暾?qǐng)數(shù)量排名前10的企業(yè)(圖12):除IBM、三星、谷歌、微軟、Intel5家老牌企業(yè)外,其余5家均為中國企業(yè),騰訊(第2)、百度網(wǎng)訊(第5)、平安科技(第7)、商湯科技(第8)、支付寶(第9)赫然在列,彰顯了中國計(jì)算機(jī)視覺算法研究的實(shí)力。與其他業(yè)務(wù)方向廣泛的企業(yè)不同,成立只有6年歷史的商湯科技專注于計(jì)算機(jī)視覺領(lǐng)域的基礎(chǔ)研究和市場(chǎng)應(yīng)用,在計(jì)算機(jī)視覺算法研究方面持續(xù)取得不菲成績,其于2014年發(fā)表的DeepID系列人臉識(shí)別算法,在誕生之初就超過了Facebook同期發(fā)表的Deepface算法, 將人臉識(shí)別準(zhǔn)確度提高到98.52%,在全球首次超過人眼識(shí)別率,突破工業(yè)化應(yīng)用的紅線。其最新的DeepID-3算法已達(dá)到了99.53%的人臉識(shí)別準(zhǔn)確率。在國際計(jì)算機(jī)視覺領(lǐng)域研究的激烈競(jìng)爭(zhēng)中,商湯科技可以與谷歌、微軟等國際大企業(yè)比肩,為中國企業(yè)豎起一面旗幟。


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

圖 12 2020年公開的全球深度學(xué)習(xí)算法專利申請(qǐng)排名Top10


總結(jié)


從上世紀(jì)60年代算起,計(jì)算機(jī)視覺的歷史也不過半個(gè)多世紀(jì),跟整個(gè)人類歷史相比,眨眼之瞬而已。然而,即使在這半個(gè)多世紀(jì)的時(shí)間里,計(jì)算機(jī)視覺已經(jīng)從最開始簡(jiǎn)單地處理數(shù)字圖像發(fā)展到現(xiàn)在可以在多種情景下準(zhǔn)確地進(jìn)行人臉識(shí)別,目標(biāo)跟蹤等。


這個(gè)過程中,隨著時(shí)間的推移,IBM,西門子,東芝,索尼,佳能,微軟,谷歌,騰訊,OPPO, 商湯科技等企業(yè)的身影依次出現(xiàn)在我們眼前,是他們讓機(jī)器“睜開眼睛看見世界”,逐漸地賦予機(jī)器自然視覺的能力。


2017年,國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中明確指出新一代人工智能發(fā)展分三步走的戰(zhàn)略目標(biāo),到2030年使中國人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心。隨著算法的更迭、算力的提升、數(shù)據(jù)的爆發(fā)以及未來5G帶來的高速網(wǎng)絡(luò),計(jì)算機(jī)視覺的發(fā)展和應(yīng)用更是有充滿想象的巨大空間。我們期待在賦予機(jī)器自然視覺能力的這條路上有更多中國企業(yè)的身影。


注1:除圖1外,以上各圖的數(shù)據(jù)均來自智慧芽。

注2:本文關(guān)注的是計(jì)算機(jī)視覺領(lǐng)域企業(yè)的研究情況,各圖的排名中未考慮高校。


參考資料
[1] 十分鐘讀完人工智能的三生三世

https://baijiahao.baidu.com/s?id=1601076075337670392&wfr=spider&for=pc 

[2] 計(jì)算機(jī)視覺發(fā)展史 https://zhuanlan.zhihu.com/p/142927311

[3] 計(jì)算機(jī)視覺簡(jiǎn)述

https://blog.csdn.net/lanmengyiyu/article/details/109648345


來源:IPRdaily中文網(wǎng)(iprdaily.cn)

作者:北京專獵前沿技術(shù)有限公司

編輯:IPRdaily王穎          校對(duì):IPRdaily縱橫君



注:原文鏈接:是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述(點(diǎn)擊標(biāo)題查看原文)


如有想看文章主題內(nèi)容,歡迎留言評(píng)論~


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述


是誰在賦予機(jī)器自然視覺的能力?——計(jì)算機(jī)視覺領(lǐng)域?qū)@窬旨爸匾蒲谐晒C述

「關(guān)于IPRdaily」


IPRdaily是具有全球影響力的知識(shí)產(chǎn)權(quán)媒體,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個(gè)國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬用戶(國內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。


(英文官網(wǎng):iprdaily.com  中文官網(wǎng):iprdaily.cn) 


本文來IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://www.islanderfriend.com/

灣區(qū)知識(shí)產(chǎn)權(quán)投稿作者
共發(fā)表文章4350
最近文章
關(guān)鍵詞
首席知識(shí)產(chǎn)權(quán)官 世界知識(shí)產(chǎn)權(quán)日 美國專利訴訟管理策略 大數(shù)據(jù) 軟件著作權(quán)登記 專利商標(biāo) 商標(biāo)注冊(cè)人 人工智能 版權(quán)登記代理 如何快速獲得美國專利授權(quán)? 材料科學(xué) 申請(qǐng)注冊(cè)商標(biāo) 軟件著作權(quán) 虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí) 專利侵權(quán)糾紛行政處理 專利預(yù)警 知識(shí)產(chǎn)權(quán) 全球視野 中國商標(biāo) 版權(quán)保護(hù)中心 智能硬件 新材料 新一代信息技術(shù)產(chǎn)業(yè) 躲過商標(biāo)轉(zhuǎn)讓的陷阱 航空航天裝備 樂天 產(chǎn)業(yè) 海洋工程裝備及高技術(shù)船舶 著作權(quán) 電子版權(quán) 醫(yī)藥及高性能醫(yī)療器械 中國專利年報(bào) 游戲動(dòng)漫 條例 國際專利 商標(biāo) 實(shí)用新型專利 專利費(fèi)用 專利管理 出版管理?xiàng)l例 版權(quán)商標(biāo) 知識(shí)產(chǎn)權(quán)侵權(quán) 商標(biāo)審查協(xié)作中心 法律和政策 企業(yè)商標(biāo)布局 新商標(biāo)審查「不規(guī)范漢字」審理標(biāo)準(zhǔn) 專利機(jī)構(gòu)排名 商標(biāo)分類 專利檢索 申請(qǐng)商標(biāo)注冊(cè) 法規(guī) 行業(yè) 法律常識(shí) 設(shè)計(jì)專利 2016知識(shí)產(chǎn)權(quán)行業(yè)分析 發(fā)明專利申請(qǐng) 國家商標(biāo)總局 電影版權(quán) 專利申請(qǐng) 香港知識(shí)產(chǎn)權(quán) 國防知識(shí)產(chǎn)權(quán) 國際版權(quán)交易 十件 版權(quán) 顧問 版權(quán)登記 發(fā)明專利 亞洲知識(shí)產(chǎn)權(quán) 版權(quán)歸屬 商標(biāo)辦理 商標(biāo)申請(qǐng) 美國專利局 ip 共享單車 一帶一路商標(biāo) 融資 馳名商標(biāo)保護(hù) 知識(shí)產(chǎn)權(quán)工程師 授權(quán) 音樂的版權(quán) 專利 商標(biāo)數(shù)據(jù) 知識(shí)產(chǎn)權(quán)局 知識(shí)產(chǎn)權(quán)法 專利小白 商標(biāo)是什么 商標(biāo)注冊(cè) 知識(shí)產(chǎn)權(quán)網(wǎng) 中超 商標(biāo)審查 維權(quán) 律所 專利代理人 知識(shí)產(chǎn)權(quán)案例 專利運(yùn)營 現(xiàn)代產(chǎn)業(yè)
本文來自于iprdaily,永久保存地址為http://www.islanderfriend.com/article_27344.html,發(fā)布時(shí)間為2021-03-22 10:06:06

文章不錯(cuò),犒勞下辛苦的作者吧

    我也說兩句
    還可以輸入140個(gè)字
    我要評(píng)論
    回復(fù)
    還可以輸入 70 個(gè)字
    請(qǐng)選擇打賞金額