是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

#本文僅代表作者觀點(diǎn)，不代表IPRdaily立場(chǎng)，未經(jīng)作者許可，禁止轉(zhuǎn)載#

來源：IPRdaily中文網(wǎng)（iprdaily.cn）

作者：北京專獵前沿技術(shù)有限公司

原標(biāo)題：是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

從上世紀(jì)60年代算起，計(jì)算機(jī)視覺的歷史也不過半個(gè)多世紀(jì)，跟整個(gè)人類歷史相比，眨眼之瞬而已。然而，即使在這半個(gè)多世紀(jì)的時(shí)間里，計(jì)算機(jī)視覺已經(jīng)從最開始簡(jiǎn)單地處理數(shù)字圖像發(fā)展到現(xiàn)在可以在多種情景下準(zhǔn)確地進(jìn)行人臉識(shí)別，目標(biāo)跟蹤等。隨著算法的更迭、算力的提升、數(shù)據(jù)的爆發(fā)以及未來5G帶來的高速網(wǎng)絡(luò)，計(jì)算機(jī)視覺的發(fā)展和應(yīng)用更有著充滿想象的巨大空間。

何為計(jì)算機(jī)視覺

從2016年AlphaGo以4：1戰(zhàn)勝世界圍棋冠軍李世石到2017年人工智能被正式寫入國(guó)家“十三五”規(guī)劃綱要，再到2021年“十四五”規(guī)劃將人工智能列為前沿科技領(lǐng)域的“最高優(yōu)先級(jí)”，人工智能已在風(fēng)口迎風(fēng)飛翔多年，成為當(dāng)下最熱門的科學(xué)技術(shù)。作為人工智能的三大核心技術(shù)之一（另外兩項(xiàng)為自然語(yǔ)言處理和語(yǔ)音識(shí)別），計(jì)算機(jī)視覺更是迎來了蓬勃發(fā)展。

日常生活中，我們經(jīng)常使用的人臉解鎖、刷臉支付、人臉身份驗(yàn)證、智能美顏、拍攝背景虛化等，其背后都是計(jì)算機(jī)視覺技術(shù)在支撐。除此之外，公共安防、無人駕駛、醫(yī)療診斷、文化旅行、教育、農(nóng)業(yè)等領(lǐng)域，都有計(jì)算機(jī)視覺的身影，可以說計(jì)算機(jī)視覺在商業(yè)化應(yīng)用上已百花齊放，滲透到生活的方方面面。根據(jù)Tractica預(yù)測(cè)，到2025年，全球計(jì)算機(jī)視覺市場(chǎng)規(guī)模（包括軟件、硬件和服務(wù)收入）將從2016年的11億美元增長(zhǎng)到262億美元。

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 1 2016-2025年計(jì)算機(jī)視覺市場(chǎng)規(guī)模_Tractica預(yù)測(cè)數(shù)據(jù)

數(shù)據(jù)來源：Tractica

何為計(jì)算機(jī)視覺？計(jì)算機(jī)視覺是以圖像（視頻）為輸入，以對(duì)環(huán)境的表達(dá)（representation）和理解為目標(biāo)，研究圖像信息組織、物體和場(chǎng)景識(shí)別、進(jìn)而對(duì)事件給予解釋的學(xué)科。計(jì)算機(jī)視覺的研究?jī)?nèi)容，大體可以分為物體視覺（object vision）和空間視覺（spatial vision）兩大部分。物體視覺在于對(duì)物體進(jìn)行精細(xì)分類和鑒別，而空間視覺在于確定物體的位置和形狀，為“動(dòng)作（action）”服務(wù)。從本質(zhì)上講，計(jì)算機(jī)視覺就是研究視覺感知問題，“賦予機(jī)器自然視覺能力”。

透過專利看計(jì)算機(jī)視覺的發(fā)展史

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 2 全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)趨勢(shì)

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 3 全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)主要受理局分布

注：由于發(fā)明專利申請(qǐng)的公開相對(duì)于申請(qǐng)日而言有滯后期，一般為18個(gè)月，因而2019、2020年的專利申請(qǐng)尚有部分未公開，與實(shí)際情況相比，其數(shù)據(jù)有一定程度的偏低。

同其他科學(xué)技術(shù)一樣，計(jì)算機(jī)視覺的發(fā)展也是由最初的萌芽期一路走到了如今的井噴發(fā)展期（圖2）。

技術(shù)萌芽期

20世紀(jì)60年代，尤其是1965年以后，是計(jì)算機(jī)視覺的技術(shù)萌芽期。1966年，人工智能學(xué)家Minsky在給學(xué)生布置的作業(yè)中，要求學(xué)生通過編寫一個(gè)程序讓計(jì)算機(jī)告訴我們它通過攝像頭看到了什么，這被認(rèn)為是計(jì)算機(jī)視覺最早的任務(wù)描述[1]。從此，計(jì)算機(jī)視覺的研究序幕拉開，并將迎來屬于它自己的跌宕起伏波瀾壯闊的歷史篇章。

1965年-1968年，全球計(jì)算機(jī)視覺相關(guān)專利申請(qǐng)總數(shù)在2000篇以下，并以每年百篇左右的數(shù)量遞增著。這一時(shí)期的研究集中在美歐兩地（圖3），美國(guó)的IBM一枝獨(dú)秀，是最主要的研究企業(yè)；其次為德國(guó)的西門子（圖4）。

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 4 1965-1968年全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)Top15

慢速增長(zhǎng)期

20世紀(jì)60年代末至90年代，隨著現(xiàn)代電子計(jì)算機(jī)的出現(xiàn)以及對(duì)計(jì)算機(jī)視覺研究的深入，人們開始嘗試不同的算法。計(jì)算機(jī)視覺研究進(jìn)入了相對(duì)慢速但“百家爭(zhēng)鳴”般的增長(zhǎng)期，全球?qū)＠暾?qǐng)數(shù)量以年均10%左右的速度增長(zhǎng)。

雖然在七十年代中期美國(guó)的MIT人工智能實(shí)驗(yàn)室正式開設(shè)計(jì)算機(jī)視覺課程，在1982年英國(guó)的David Marr發(fā)表了《視覺》一書，標(biāo)志著計(jì)算機(jī)視覺成為一門獨(dú)立學(xué)科，但是計(jì)算機(jī)視覺的研究已經(jīng)西風(fēng)東漸，日本成為全球最主要、最大的研究地。從1970到1990年左右，全球50%以上的專利申請(qǐng)都出自日本，而同時(shí)期美國(guó)的專利申請(qǐng)數(shù)量占全球?qū)＠暾?qǐng)總數(shù)的10%不到，而且無論是專利申請(qǐng)數(shù)量還是專利申請(qǐng)?jiān)鲩L(zhǎng)速度，日本都遠(yuǎn)超歐美（圖3）。即使1990年以后，美國(guó)的研究開始發(fā)力，歷年專利申請(qǐng)數(shù)量呈線性增加，歐洲和韓國(guó)地區(qū)的專利申請(qǐng)數(shù)量也在逐年遞增，但是日本的專利申請(qǐng)數(shù)量依然占有絕對(duì)優(yōu)勢(shì)。這一時(shí)期，在全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)排名前15的企業(yè)中，除美國(guó)的IBM（第7）和荷蘭的皇家飛利浦（第14）外，其余全是日本企業(yè)（圖5），佳能、東芝、日立、富士通、日本電氣等響當(dāng)當(dāng)?shù)钠髽I(yè)高居榜單前5。

另外，現(xiàn)代CNN網(wǎng)絡(luò)中卷積層+池化層的最初范例及靈驗(yàn)來源，世界上第一個(gè)神經(jīng)網(wǎng)絡(luò)——Neocognitron[2]，也是由日本計(jì)算科學(xué)家Kunihiko Fukushima在1980年提出的。可以說，這是屬于日本的高光時(shí)刻。

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 5 1969-1999全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)top15

平穩(wěn)過渡期

21世紀(jì)前10年，得益于計(jì)算機(jī)算力的飛躍式提升，以及互聯(lián)網(wǎng)和社交媒體的發(fā)展，全球數(shù)據(jù)達(dá)到ZB級(jí)別，計(jì)算機(jī)視覺的算法研究從“百家爭(zhēng)鳴”逐漸聚焦到機(jī)器學(xué)習(xí)。計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)經(jīng)過世紀(jì)初的猛增后，進(jìn)入一個(gè)平穩(wěn)過渡期，歷年的專利申請(qǐng)數(shù)量基本沒有增加，徘徊在35000件左右。雖然這一時(shí)期全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)排名前15中，日本企業(yè)依然占有11席（圖6），但日本專利申請(qǐng)的歷年數(shù)量呈下降趨勢(shì)，計(jì)算機(jī)視覺的研發(fā)由集中在日本漸漸地轉(zhuǎn)向以美歐日韓為主的多地發(fā)展（圖3）。荷蘭的皇家飛利浦在醫(yī)療健康領(lǐng)域的重點(diǎn)突破，美國(guó)的微軟在中國(guó)設(shè)立微軟亞洲研究院專門研究計(jì)算機(jī)視覺，以及韓國(guó)的三星經(jīng)過20世紀(jì)90年代的研究積累，使得他們躋身進(jìn)2000-2009年全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)排名前10（圖6）。

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 6 2000-2009年全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)Top15

同一時(shí)期，大洋彼岸的中國(guó)，雖然專利申請(qǐng)數(shù)量在逐年增加，但其專利申請(qǐng)基本來自諸如索尼、皇家飛利浦、三星、微軟等海外巨頭在中國(guó)的布局，中國(guó)計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)前15中，還沒有中國(guó)企業(yè)的名字（圖7）。中國(guó)企業(yè)的計(jì)算機(jī)視覺研究還處于萌芽狀態(tài)。

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 7 2000-2009年中國(guó)計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)top15

這段時(shí)間，具有標(biāo)志性的事件為：

2006年，Geoffrey Hinton教授提出了深度學(xué)習(xí)的概念，并通過逐層訓(xùn)練的方法解決了深度神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練的問題[2]。

2009年，李飛飛教授等在CVPR2009上發(fā)表了一篇名為《ImageNet: A Large-Scale Hierarchical Image Database》的論文，發(fā)布了ImageNet數(shù)據(jù)集，這是為了檢測(cè)計(jì)算機(jī)視覺能否識(shí)別自然萬物，回歸機(jī)器學(xué)習(xí)，克服過擬合問題，經(jīng)過三年多籌劃組建完成的一個(gè)大的數(shù)據(jù)集。ImageNet是計(jì)算機(jī)視覺發(fā)展的重要推動(dòng)者，和深度學(xué)習(xí)熱潮的關(guān)鍵推動(dòng)者，將目標(biāo)檢測(cè)算法推向了新的高度[3]。

快速增長(zhǎng)期

2010-2015年，計(jì)算機(jī)的算力遵循著“摩爾定律”穩(wěn)步提升，互聯(lián)網(wǎng)及社交媒體的進(jìn)一步普及帶來爆發(fā)式增長(zhǎng)的大數(shù)據(jù)，深度學(xué)習(xí)算法開始流行，成為計(jì)算機(jī)視覺領(lǐng)域最主要的算法。計(jì)算機(jī)視覺也進(jìn)入了一個(gè)快速發(fā)展期，全球?qū)＠暾?qǐng)數(shù)量以年均17%左右的速度增長(zhǎng)。其中，美國(guó)專利申請(qǐng)數(shù)量的年均增長(zhǎng)率約為23%，美國(guó)正式取代日本，成為計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)量最大的國(guó)家。在2010-2015年全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)前10名中，美國(guó)企業(yè)占5席，分別為微軟（第2），谷歌（第5），高通（第6），IBM（第7）和Intel（第9）。中國(guó)專利申請(qǐng)數(shù)量更是以年均33%左右的速度增長(zhǎng)，中國(guó)企業(yè)的計(jì)算機(jī)視覺研究也從小芽長(zhǎng)成了一棵小苗。2010-2015年全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)前15名榜單中，也首次出現(xiàn)了中國(guó)企業(yè)的身影：聯(lián)想，第15（圖8）。此外，韓國(guó)的三星依靠其龐大的家電和手機(jī)產(chǎn)品整合計(jì)算機(jī)視覺技術(shù)，高居榜首位置；日本的索尼、佳能、富士通、日本電氣、理光等5家企業(yè)也榜上有名。

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 8 2010-2015年全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)Top15

這一時(shí)期，具有里程碑式的標(biāo)志事件為[3]：

2012年，Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 創(chuàng)造了一個(gè)“大型的深度卷積神經(jīng)網(wǎng)絡(luò)（CNN）”，也即現(xiàn)在眾所周知的AlexNet，將圖像識(shí)別錯(cuò)誤率降低了10%，贏得了當(dāng)年的 ILSVRC競(jìng)賽（是機(jī)器視覺領(lǐng)域最受追捧也是最具權(quán)威的學(xué)術(shù)競(jìng)賽之一，代表了圖像領(lǐng)域的最高水平）這是史上第一次有模型在 ImageNet 數(shù)據(jù)集表現(xiàn)如此出色。自那時(shí)起，CNN成了家喻戶曉的名字。

2014年，蒙特利爾大學(xué)提出生成對(duì)抗網(wǎng)絡(luò)（GAN）：擁有兩個(gè)相互競(jìng)爭(zhēng)的神經(jīng)網(wǎng)絡(luò)可以使機(jī)器學(xué)習(xí)得更快。一個(gè)網(wǎng)絡(luò)嘗試模仿真實(shí)數(shù)據(jù)生成假的數(shù)據(jù)，而另一個(gè)網(wǎng)絡(luò)則試圖將假數(shù)據(jù)區(qū)分出來。

井噴發(fā)展期

2016年及以后，計(jì)算機(jī)視覺技術(shù)逐漸賦能各行業(yè)，應(yīng)用場(chǎng)景紛紛落地。廣闊的商業(yè)化應(yīng)用為計(jì)算機(jī)視覺的發(fā)展注入強(qiáng)勁動(dòng)力，至此，計(jì)算機(jī)視覺領(lǐng)域的研究進(jìn)入井噴狀態(tài)，如春風(fēng)拂地萬物在不經(jīng)意間復(fù)蘇一般，全球的研發(fā)格局也在悄然地發(fā)生變化。

2016-2018年間，全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)年均增長(zhǎng)率超過20%（2019及2020年的因?qū)＠暾?qǐng)到公開的時(shí)間遲滯原因，在此未統(tǒng)計(jì)），中美日韓歐成為主要的研發(fā)陣地。其中，中國(guó)專利申請(qǐng)的年均增長(zhǎng)率超過40%，貢獻(xiàn)了全球最主要的專利申請(qǐng)?jiān)鲩L(zhǎng)，同時(shí)，中國(guó)也超越美國(guó)，成為新一屆的專利申請(qǐng)最大的國(guó)家。2016-2020年全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)前15名中，美國(guó)企業(yè)5家、日本企業(yè)3家、韓國(guó)企業(yè)1家，而中國(guó)企業(yè)有6家，開始占據(jù)明顯地位。這6家中國(guó)企業(yè)分別是騰訊（第2），OPPO（第5），平安科技（第11），華為（第12），阿里巴巴（第14）和商湯科技（第15）。騰訊和OPPO更是超過微軟、佳能、索尼等老牌企業(yè)，躋身進(jìn)前5（圖9）。

作為國(guó)內(nèi)的傳統(tǒng)互聯(lián)網(wǎng)巨頭，一直以推動(dòng)科技創(chuàng)新為愿景的騰訊充分集成利用自身的數(shù)據(jù)資源、人才資源和軟硬件技術(shù)基礎(chǔ)，打造出風(fēng)靡全國(guó)的人工智能系統(tǒng)和平臺(tái)。旗下的騰訊優(yōu)圖實(shí)驗(yàn)室從2012年開始專注計(jì)算機(jī)視覺技術(shù)研發(fā)，其在2017年研發(fā)出的“優(yōu)圖祖母模型”以及“目標(biāo)關(guān)聯(lián)算法”在多個(gè)比賽中排名第一甚至刷新世界紀(jì)錄；在2020年輸出超過50篇優(yōu)秀論文，入選多個(gè)行業(yè)頂級(jí)學(xué)術(shù)會(huì)議，內(nèi)容涵蓋目標(biāo)跟蹤、行人重識(shí)別、視頻識(shí)別等多個(gè)熱門及前沿領(lǐng)域。

以拍照手機(jī)出名的OPPO已在圖像處理上深耕多年，2012年OPPO首次在手機(jī)自拍上實(shí)現(xiàn)了美顏拍攝功能，開創(chuàng)了“手機(jī)自拍美顏”時(shí)代；2018年，OPPO研究院在深圳成立，計(jì)算機(jī)視覺是其重要的研究方向之一；2020年的全球計(jì)算機(jī)視覺頂級(jí)會(huì)議CVPR (Conference on Computer Vision and Pattern Recognition) 上，OPPO共獲兩項(xiàng)第一，兩項(xiàng)第三。

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 9 2016-2020年全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)Top15

總體來說，這一時(shí)期的美國(guó)引領(lǐng)著主流技術(shù)發(fā)展方向；日本的高光時(shí)刻已經(jīng)一去不復(fù)返，韓國(guó)靠著三星撐起半邊天，而中國(guó)的計(jì)算機(jī)視覺研究從小苗開始生長(zhǎng)出更多的枝丫。

最新的計(jì)算機(jī)視覺研發(fā)格局

分析2020年公開的計(jì)算機(jī)視覺領(lǐng)域的專利申請(qǐng)情況，得以管中窺豹，了解最新的計(jì)算機(jī)視覺研發(fā)格局。

國(guó)際格局

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 10 2020年公開的全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)Top15

2020年公開的全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)中，中美日韓的企業(yè)占據(jù)著專利申請(qǐng)數(shù)量的前15（圖10），其中美國(guó)企業(yè)5家，日本企業(yè)2家，韓國(guó)企業(yè)2家，中國(guó)企業(yè)6家。得益于國(guó)內(nèi)新基建的建設(shè)以及豐富的計(jì)算機(jī)視覺應(yīng)用場(chǎng)景，中國(guó)在企業(yè)數(shù)量和專利申請(qǐng)數(shù)量上大有后來追上之勢(shì)。

前10名的申請(qǐng)人中：

韓國(guó)的三星因其廣泛的產(chǎn)品線使得計(jì)算機(jī)視覺擁有廣闊的落地場(chǎng)景，其專利申請(qǐng)數(shù)量穩(wěn)列第一位。美國(guó)的IBM、微軟、谷歌、蘋果分別位于第3、4、5和第9位。IBM一直注重人工智能方面的基礎(chǔ)性研究，從20世紀(jì)60年代開始就已經(jīng)是計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)前15榜單中的?？?；微軟和谷歌是目前人工智能技術(shù)的領(lǐng)軍企業(yè)，他們掌握和引領(lǐng)著主流技術(shù)方向，目前全球的人工智能開發(fā)方案中有相當(dāng)大的比例是基于微軟、谷歌等發(fā)布的基礎(chǔ)框架型構(gòu)架而進(jìn)行的；蘋果在2010年以后收購(gòu)了十幾家人工智能公司，將人工智能服務(wù)于自身的系列產(chǎn)品，提高現(xiàn)有產(chǎn)品體驗(yàn)。日本的索尼與佳能分別位于第6和第7位。他們是傳統(tǒng)的光學(xué)產(chǎn)品大廠，計(jì)算機(jī)圖像處理方面有深厚的研發(fā)底蘊(yùn)，其研發(fā)實(shí)力在上世紀(jì)七八十年代已經(jīng)顯現(xiàn)。

中國(guó)的企業(yè)除前面提到的騰訊、OPPO分別位列第2和第8外，成立于2014年的商湯科技以迅雷之勢(shì)超過美國(guó)的Intel、日本的富士通和國(guó)內(nèi)的華為、平安科技，進(jìn)入前10名，在一眾國(guó)內(nèi)外聲名顯赫的科技巨頭企業(yè)中格外顯眼。而商湯科技的成績(jī)不止于此：2018年，商湯科技被中國(guó)科技部指定為首個(gè)“智能視覺”國(guó)家新一代人工智能開放創(chuàng)新平臺(tái)；2019年的ICCV (the International Conference on Computer Vision) 上，商湯科技及其聯(lián)合實(shí)驗(yàn)室以入選57篇論文的成績(jī)備受矚目；2020年的CVPR上，商湯科技的入選論文數(shù)超過微軟、Facebook等科技巨頭，并拿下了CVPR2020 ActivityNet 時(shí)空動(dòng)作定位賽道、動(dòng)作分類賽道，以及 CVPR 2020 NTIRE 競(jìng)賽等3項(xiàng)世界冠軍。自成立以來，商湯科技已在各種重要賽事中，斬獲了60多個(gè)世界第一。

國(guó)內(nèi)格局

圖10中上榜的6家中國(guó)企業(yè)，在一定程度上體現(xiàn)出了我國(guó)計(jì)算機(jī)視覺的研究格局：這6家企業(yè)中，有擁有數(shù)據(jù)資源、人才資源和軟硬件技術(shù)基礎(chǔ)優(yōu)勢(shì)的互聯(lián)網(wǎng)巨頭BAT（百度，阿里巴巴，騰訊），有擁有龐大智能應(yīng)用終端承載計(jì)算機(jī)視覺技術(shù)的OPPO、華為（根據(jù)國(guó)際知名市場(chǎng)分析機(jī)構(gòu)Counterpoint的數(shù)據(jù)顯示：2021年1月OPPO、華為為國(guó)內(nèi)前二智能手機(jī)品牌，分別占據(jù)國(guó)內(nèi)智能手機(jī)份額的21%和20%），以及有專注于計(jì)算機(jī)視覺基礎(chǔ)研究與應(yīng)用的商湯科技。這些企業(yè)，代表了國(guó)內(nèi)計(jì)算機(jī)視覺的最新、最強(qiáng)的研究實(shí)力。

另一方面，企業(yè)的海外專利申請(qǐng)是為其業(yè)務(wù)拓展保駕護(hù)航，海外布局策略和其業(yè)務(wù)拓展策略是一致的。2020年公開的專利申請(qǐng)中，中國(guó)企業(yè)在中國(guó)大陸之外的專利申請(qǐng)量排名前5名分別為騰訊、華為、阿里巴巴、OPPO、商湯科技（圖11）。騰訊和阿里巴巴在中國(guó)大陸之外的布局策略比較一致，中國(guó)香港為其主要布局地，其次為專利五局中的美日韓歐。華為在中國(guó)大陸之外布局策略主要在專利五局中的美日韓歐，美歐為主場(chǎng)。OPPO與商湯科技在中國(guó)大陸之外布局策略類似，除了美日韓歐外，在中國(guó)香港、中國(guó)臺(tái)灣等地也有較多的布局，但相較起來，商湯科技在中國(guó)大陸之外布局更加均衡，在一些未來新興市場(chǎng)，比如新加坡、印度，商湯科技也提前進(jìn)行了布局，擁有較多的專利申請(qǐng)。

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 11 2020年公開的中國(guó)企業(yè)在中國(guó)大陸之外計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)排名Top10

基礎(chǔ)算法研究格局

計(jì)算機(jī)視覺的發(fā)展有四大要素：算法、算力、數(shù)據(jù)和場(chǎng)景。萬丈高樓平地起，地基是基礎(chǔ)。而基礎(chǔ)算法就是計(jì)算機(jī)視覺這座高樓的地基。IPC分類號(hào)中，G06N對(duì)應(yīng)的分類號(hào)包括了目前主流的計(jì)算機(jī)視覺算法——深度學(xué)習(xí)所涉及的主要技術(shù)，即：G06N3/02（采用神經(jīng)網(wǎng)絡(luò)模型），G06N3/04（體系結(jié)構(gòu)，例如，互連拓?fù)洌?，G06N3/08（學(xué)習(xí)方法），G06N20/00（機(jī)器學(xué)習(xí)）。2020年公開的全球計(jì)算機(jī)視覺領(lǐng)域?qū)＠暾?qǐng)中，篩選出G06N下的專利申請(qǐng)，得到全球?qū)＠暾?qǐng)數(shù)量排名前10的企業(yè)（圖12）：除IBM、三星、谷歌、微軟、Intel5家老牌企業(yè)外，其余5家均為中國(guó)企業(yè)，騰訊（第2）、百度網(wǎng)訊（第5）、平安科技（第7）、商湯科技（第8）、支付寶（第9）赫然在列，彰顯了中國(guó)計(jì)算機(jī)視覺算法研究的實(shí)力。與其他業(yè)務(wù)方向廣泛的企業(yè)不同，成立只有6年歷史的商湯科技專注于計(jì)算機(jī)視覺領(lǐng)域的基礎(chǔ)研究和市場(chǎng)應(yīng)用，在計(jì)算機(jī)視覺算法研究方面持續(xù)取得不菲成績(jī)，其于2014年發(fā)表的DeepID系列人臉識(shí)別算法，在誕生之初就超過了Facebook同期發(fā)表的Deepface算法, 將人臉識(shí)別準(zhǔn)確度提高到98.52%，在全球首次超過人眼識(shí)別率，突破工業(yè)化應(yīng)用的紅線。其最新的DeepID-3算法已達(dá)到了99.53%的人臉識(shí)別準(zhǔn)確率。在國(guó)際計(jì)算機(jī)視覺領(lǐng)域研究的激烈競(jìng)爭(zhēng)中，商湯科技可以與谷歌、微軟等國(guó)際大企業(yè)比肩，為中國(guó)企業(yè)豎起一面旗幟。

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

圖 12 2020年公開的全球深度學(xué)習(xí)算法專利申請(qǐng)排名Top10

總結(jié)

這個(gè)過程中，隨著時(shí)間的推移，IBM，西門子，東芝，索尼，佳能，微軟，谷歌，騰訊，OPPO, 商湯科技等企業(yè)的身影依次出現(xiàn)在我們眼前，是他們讓機(jī)器“睜開眼睛看見世界”，逐漸地賦予機(jī)器自然視覺的能力。

2017年，國(guó)務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中明確指出新一代人工智能發(fā)展分三步走的戰(zhàn)略目標(biāo)，到2030年使中國(guó)人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平，成為世界主要人工智能創(chuàng)新中心。隨著算法的更迭、算力的提升、數(shù)據(jù)的爆發(fā)以及未來5G帶來的高速網(wǎng)絡(luò)，計(jì)算機(jī)視覺的發(fā)展和應(yīng)用更是有充滿想象的巨大空間。我們期待在賦予機(jī)器自然視覺能力的這條路上有更多中國(guó)企業(yè)的身影。

注1：除圖1外，以上各圖的數(shù)據(jù)均來自智慧芽。

注2：本文關(guān)注的是計(jì)算機(jī)視覺領(lǐng)域企業(yè)的研究情況，各圖的排名中未考慮高校。

參考資料
[1] 十分鐘讀完人工智能的三生三世

https://baijiahao.baidu.com/s?id=1601076075337670392&wfr=spider&for=pc

[2] 計(jì)算機(jī)視覺發(fā)展史 https://zhuanlan.zhihu.com/p/142927311

[3] 計(jì)算機(jī)視覺簡(jiǎn)述

https://blog.csdn.net/lanmengyiyu/article/details/109648345

來源：IPRdaily中文網(wǎng)（iprdaily.cn）

作者：北京專獵前沿技術(shù)有限公司

編輯：IPRdaily王穎校對(duì)：IPRdaily縱橫君

注：原文鏈接：是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述（點(diǎn)擊標(biāo)題查看原文）

如有想看文章主題內(nèi)容，歡迎留言評(píng)論~

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

「關(guān)于IPRdaily」

IPRdaily是具有全球影響力的知識(shí)產(chǎn)權(quán)媒體，致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國(guó)、美國(guó)、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司及成長(zhǎng)型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人，還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬用戶（國(guó)內(nèi)70余萬+海外近30萬），2019年全年全網(wǎng)頁(yè)面瀏覽量已經(jīng)突破過億次傳播。

（英文官網(wǎng)：iprdaily.com 中文官網(wǎng)：iprdaily.cn）

本文來自IPRdaily中文網(wǎng)（iprdaily.cn）并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意，并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng)，如若轉(zhuǎn)載，請(qǐng)注明出處：“http://www.islanderfriend.com/

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述

是誰(shuí)在賦予機(jī)器自然視覺的能力？——計(jì)算機(jī)視覺領(lǐng)域?qū)＠窬旨爸匾蒲谐晒C述