文獻(xiàn)文獻(xiàn)文獻(xiàn)文獻(xiàn)文獻(xiàn)新科技科技科技科技知識(shí)產(chǎn)權(quán)
#文章僅代表作者觀(guān)點(diǎn),不代表IPRdaily立場(chǎng)#
來(lái)源:IPRdaily NnTech 新科技評(píng)測(cè)團(tuán)隊(duì)
原標(biāo)題:挑戰(zhàn)日本最強(qiáng)AI翻譯引擎!出版社這次拿出了硬科技
機(jī)器翻譯一直是阻礙專(zhuān)利領(lǐng)域技術(shù)全球跨語(yǔ)言信息化應(yīng)用的一個(gè)核心技術(shù)難題。
而由于近年來(lái)人工智能技術(shù)的飛速發(fā)展,機(jī)器翻譯公司如雨后春筍般迅速發(fā)展,國(guó)外的Google、微軟已經(jīng)在各領(lǐng)域應(yīng)用機(jī)器翻譯技術(shù)。
筆者了解到,近日,日本一款DeepL在線(xiàn)機(jī)器翻譯軟件,號(hào)稱(chēng)在實(shí)例評(píng)測(cè)中碾壓了谷歌翻譯,更是引起了機(jī)器翻譯領(lǐng)域的轟動(dòng)!
盡管如此,專(zhuān)利領(lǐng)域的機(jī)器翻譯由于科技詞語(yǔ)的晦澀,同時(shí)要求具有很?chē)?yán)謹(jǐn)?shù)姆梢?guī)范性,增加了人工智能技術(shù)在專(zhuān)利機(jī)器翻譯中應(yīng)用的難度。
而隨著技術(shù)的不斷更新迭代,這種情況正在逐步發(fā)生變化!
筆者發(fā)現(xiàn),作為專(zhuān)利翻譯國(guó)家隊(duì)的知識(shí)產(chǎn)權(quán)出版社也推出了應(yīng)用于科技與專(zhuān)利文獻(xiàn)翻譯的機(jī)器翻譯引擎——科專(zhuān)笑飛,或許這將極大推進(jìn)機(jī)器翻譯技術(shù)在專(zhuān)利領(lǐng)域的應(yīng)用!
今天NnTech 新科技評(píng)測(cè)團(tuán)隊(duì),將對(duì)最近很火爆的DeepL與科專(zhuān)笑飛做一個(gè)專(zhuān)業(yè)評(píng)測(cè),看看在科技文本機(jī)器翻譯領(lǐng)域,究竟誰(shuí)能更勝一籌!
一、漢日雙向評(píng)測(cè)
評(píng)測(cè)樣本:
樣本隨機(jī)取自2020年最新的專(zhuān)利申請(qǐng)文獻(xiàn),共計(jì)50句
評(píng)測(cè)時(shí)間:
評(píng)測(cè)時(shí)間為2020年4月2日
評(píng)測(cè)對(duì)象:
評(píng)測(cè)對(duì)象為科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)和DeepL機(jī)器翻譯系統(tǒng)的當(dāng)前最新翻譯結(jié)果結(jié)果取自?xún)上到y(tǒng)官方網(wǎng)站翻譯界面:
科專(zhuān)笑飛:www.iptranslation.net
DeepL:https://www.deepl.com/translator
評(píng)測(cè)方式:
評(píng)測(cè)采取人工評(píng)測(cè)的方式
說(shuō)明:人工評(píng)測(cè),以國(guó)家語(yǔ)言文字工作委員會(huì)發(fā)布的機(jī)器翻譯譯文的人工評(píng)測(cè)標(biāo)準(zhǔn)為標(biāo)準(zhǔn),若干名評(píng)測(cè)人員按照標(biāo)準(zhǔn)分別為兩種翻譯結(jié)果進(jìn)行打分,分制為100分制。人工評(píng)測(cè)采用隨機(jī)評(píng)測(cè),事先未告知評(píng)測(cè)人員所評(píng)系統(tǒng)相關(guān)具體細(xì)節(jié)及所閱讀的譯文是哪個(gè)系統(tǒng)的譯文,打分過(guò)程中評(píng)測(cè)人員無(wú)溝通,以此來(lái)盡可能地避免人工評(píng)測(cè)的主觀(guān)性。
漢-日方向評(píng)測(cè)結(jié)果:
漢-日方向評(píng)測(cè)結(jié)果如下表及柱狀圖:
日-漢方向評(píng)測(cè)結(jié)果:
日-漢方向評(píng)測(cè)結(jié)果如下表及柱狀圖:
評(píng)測(cè)結(jié)論:
從得分上來(lái)看,科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)漢-日、日-漢雙向翻譯效果明顯優(yōu)于DeepL翻譯效果。
漢-日方向,科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)的平均分比DeepL機(jī)器翻譯系統(tǒng)的得分高出了13.5分;日-漢方向,科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)的平均分比DeepL機(jī)器翻譯系統(tǒng)的得分高出了9.5分;從雙向來(lái)說(shuō),兩者分差都比較大,這證明了科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)漢-日、日-漢雙向翻譯要明顯優(yōu)于DeepL機(jī)器翻譯系統(tǒng)。
二、漢英雙向評(píng)測(cè)
評(píng)測(cè)樣本:
樣本隨機(jī)取自2020年最新的專(zhuān)利申請(qǐng)文獻(xiàn),共計(jì)40段(約120句)
評(píng)測(cè)時(shí)間:
評(píng)測(cè)時(shí)間為2020年4月2日
評(píng)測(cè)對(duì)象:
評(píng)測(cè)對(duì)象為科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)和DeepL機(jī)器翻譯系統(tǒng)的當(dāng)前最新翻譯結(jié)果。結(jié)果取自?xún)上到y(tǒng)官方網(wǎng)站翻譯界面:
科專(zhuān)笑飛:www.iptranslation.net
DeepL:https://www.deepl.com/translator
評(píng)測(cè)方式:
評(píng)測(cè)采取人工評(píng)測(cè)的方式
漢-英方向評(píng)測(cè)結(jié)果:
漢-英方向評(píng)測(cè)結(jié)果如下表及柱狀圖:
英-漢方向評(píng)測(cè)結(jié)果:
英-漢方向評(píng)測(cè)結(jié)果如下表及柱狀圖:
評(píng)測(cè)結(jié)論:
科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)漢-英、英-漢雙向翻譯效果明顯優(yōu)于DeepL翻譯效果。
漢-英方向,科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)的平均分比DeepL機(jī)器翻譯系統(tǒng)的得分高出了9.115分;英-漢方向,科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)的平均分比DeepL機(jī)器翻譯系統(tǒng)的得分高出了5.34分;從雙向來(lái)說(shuō),兩者分差都比較大,這證明了科專(zhuān)笑飛機(jī)器翻譯系統(tǒng)漢-英、英-漢雙向翻譯要明顯優(yōu)于DeepL機(jī)器翻譯系統(tǒng)。
三、評(píng)測(cè)實(shí)例
評(píng)測(cè)團(tuán)隊(duì)隨機(jī)抽取了評(píng)測(cè)實(shí)例,示例如下:
實(shí)例一:
結(jié)論:
科專(zhuān)笑飛的譯文在專(zhuān)利術(shù)語(yǔ)的選擇上更加地道,DEEPL的譯文在選詞翻譯方面按照原文進(jìn)行直譯,雖然翻譯正確,但相對(duì)來(lái)說(shuō),表達(dá)不夠?qū)I(yè)地道。
實(shí)例二:
結(jié)論:
科專(zhuān)笑飛引擎對(duì)長(zhǎng)句、長(zhǎng)段落進(jìn)行了綜合性的學(xué)習(xí)和處理,能夠保證整體的結(jié)構(gòu)完整。而DeepL的引擎在長(zhǎng)段落整體翻譯時(shí),會(huì)出現(xiàn)漏譯、句子信息缺失、翻譯不完整的情況。比如此例中,該引擎并沒(méi)有將句子完全翻譯完,丟失了句子后半部分的信息。
四、評(píng)測(cè)總結(jié)
從測(cè)試結(jié)果可以看出來(lái),對(duì)于專(zhuān)利翻譯或科技文獻(xiàn)的翻譯,科專(zhuān)笑飛已經(jīng)做了專(zhuān)門(mén)的訓(xùn)練。以此同時(shí)對(duì)專(zhuān)利文本翻譯中的一些表達(dá)方式及格式處理也進(jìn)行了優(yōu)化處理,更適合科技領(lǐng)域的文本翻譯。
知識(shí)產(chǎn)權(quán)出版社“秘密”進(jìn)行的機(jī)器翻譯引擎研制項(xiàng)目究竟是什么來(lái)頭?
測(cè)試團(tuán)隊(duì)從科專(zhuān)笑飛的官網(wǎng)了解到:
科專(zhuān)笑飛是由知識(shí)產(chǎn)權(quán)出版社自主研發(fā)的新一代人工智能多語(yǔ)種專(zhuān)利文獻(xiàn)機(jī)器翻譯系統(tǒng),實(shí)現(xiàn)了英、日、德等多語(yǔ)種與中文之間雙向的全自動(dòng)機(jī)器翻譯和人機(jī)交互計(jì)算機(jī)輔助翻譯。
系統(tǒng)基于全球多語(yǔ)種專(zhuān)利文獻(xiàn)數(shù)據(jù),采用國(guó)際前沿的多策略神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯核心技術(shù),融合模板、統(tǒng)計(jì)、規(guī)則、實(shí)例等多種機(jī)器翻譯方法,針對(duì)專(zhuān)利文獻(xiàn)特定域信息的用詞習(xí)慣、句法結(jié)構(gòu)以及語(yǔ)義選擇等特點(diǎn),對(duì)翻譯知識(shí)庫(kù)進(jìn)行優(yōu)化配置和構(gòu)建,使譯文達(dá)到了90%的準(zhǔn)確率和商用推廣性,是幫助用戶(hù)實(shí)現(xiàn)知識(shí)產(chǎn)權(quán)領(lǐng)域多語(yǔ)言信息獲取和翻譯的有力工具。
其技術(shù)優(yōu)勢(shì)在于:
采用國(guó)際前沿的多策略神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯核心技術(shù),融合模板、統(tǒng)計(jì)、規(guī)則、實(shí)例等多種機(jī)器翻譯方法,針對(duì)專(zhuān)利文獻(xiàn)特定域信息的用詞習(xí)慣、句法結(jié)構(gòu)以及語(yǔ)義選擇等特點(diǎn),對(duì)翻譯知識(shí)庫(kù)進(jìn)行優(yōu)化配置和構(gòu)建,使專(zhuān)利譯文達(dá)到了90%以上的準(zhǔn)確率。
科技創(chuàng)新目前已經(jīng)成為全球未來(lái)競(jìng)爭(zhēng)的核心,而科技文獻(xiàn)利用將成為未來(lái)科技創(chuàng)新技術(shù)情報(bào)的重要信息途徑,而機(jī)器翻譯正是解決全球跨語(yǔ)言技術(shù)應(yīng)用的加速器。
評(píng)測(cè)團(tuán)隊(duì)驚嘆國(guó)內(nèi)AI技術(shù)在專(zhuān)利領(lǐng)域落地技術(shù)研發(fā)實(shí)力和技術(shù)先進(jìn)性,類(lèi)似科專(zhuān)笑飛這樣的最新產(chǎn)品也代表了目前全球技術(shù)機(jī)器翻譯引擎的最高水準(zhǔn)。
相信未來(lái),科專(zhuān)笑飛會(huì)給我們帶來(lái)更多的改變與驚喜!
來(lái)源:IPRdaily NnTech 新科技評(píng)測(cè)團(tuán)隊(duì)
編輯:IPRdaily王穎 校對(duì):IPRdaily縱橫君
點(diǎn)擊圖片,查看專(zhuān)題詳情!
「關(guān)于IPRdaily」
IPRdaily是具有全球影響力的知識(shí)產(chǎn)權(quán)媒體,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來(lái)自于中國(guó)、美國(guó)、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司及成長(zhǎng)型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來(lái)自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬(wàn)用戶(hù)(國(guó)內(nèi)70余萬(wàn)+海外近30萬(wàn)),2019年全年全網(wǎng)頁(yè)面瀏覽量已經(jīng)突破過(guò)億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來(lái)源IPRdaily NnTech 新科技評(píng)測(cè)團(tuán)隊(duì)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://islanderfriend.com/
知識(shí)產(chǎn)權(quán)職稱(chēng)考試教材計(jì)劃6月下旬正式出版發(fā)行
擅自開(kāi)展專(zhuān)利代理業(yè)務(wù)!深圳一機(jī)構(gòu)被罰1.643萬(wàn)元
文章不錯(cuò),犒勞下辛苦的作者吧