見(jiàn)圳客戶(hù)端·深圳新聞網(wǎng)2020年6月18日訊 一年一度的全球計算機視覺(jué)頂級會(huì )議CVPR(Conference on Computer Vision and Pattern Recognition國際計算機視覺(jué)與模式識別會(huì )議)落下帷幕,該會(huì )議是由IEEE(國際計算機視覺(jué)與模式識別會(huì )議)舉辦的計算機視覺(jué)和模式識別領(lǐng)域的頂級會(huì )議。每年匯聚全球頂尖的相關(guān)專(zhuān)家、學(xué)者和研究者,共同關(guān)注和探討計算機視覺(jué)技術(shù)的發(fā)展方向與趨勢。
在這屆會(huì )議上,OPPO取得了非常優(yōu)異的成績(jì):獲得兩項第一名、兩項第三名,展現了OPPO在人工智能領(lǐng)域的科技領(lǐng)導力,以及新成立的智能感知與交互研究部門(mén)強大的研發(fā)實(shí)力。
OPPO多項AI核心技術(shù)斬獲大獎
在本次大會(huì )上OPPO獲得第一名的技術(shù)成果為將模糊圖片”算“清晰的“極端超級分辨率感知”技術(shù);此外,通過(guò)照片計算拍照方位的"手持設備視覺(jué)定位"技術(shù)則獲得第三名和分項第一;通過(guò)讀取錄像智能識別其中人類(lèi)行為的“長(cháng)視頻行為識別”技術(shù),同時(shí)獲得第三名。
OPPO智能感知首席科學(xué)家郭彥東表示:“非常高興能在今年的CVPR競賽中取得優(yōu)秀成績(jì),這是OPPO研究院智能感知與交互研究部成立以來(lái)首次公開(kāi)展示研發(fā)成果,分別對應環(huán)境感知、以人為本的計算、以及數字生成三個(gè)核心研究方向,充分反映了OPPO在人工智能領(lǐng)域的深厚積淀與實(shí)力?!?/p>
“圖形界面和鼠標的使用造就了個(gè)人電腦,觸屏成就了智能手機,每一次智能感知技術(shù)的突破、人機交互模式的提升,都在推進(jìn)著(zhù)全新的科技潮流。我們致力于讓智能硬件更聰明,更理解用戶(hù),從而開(kāi)發(fā)全新的人機交互方式,引領(lǐng)下一代科技潮流,”郭彥東更進(jìn)一步說(shuō)明,OPPO對于智能感知與交互領(lǐng)域的前沿探索,將在未來(lái)全面賦能OPPO的技術(shù)與產(chǎn)品,也將孕育更新的硬件產(chǎn)品,為用戶(hù)提供更具創(chuàng )新性的交互方式與服務(wù)體驗。
除OPPO研究院智能感知與交互研究部之外,OPPO美國研究所也在CVPR上展露風(fēng)采,取得“真實(shí)世界超分辨率圖像處理技術(shù)”(Real-World Super-Resolution Challenge:Track1: Image Processing artifacts)第六名的成績(jì),OPPO美研所時(shí)空實(shí)驗室主管孟子博在CVPR做了暗光影像技術(shù)演講“穿透黑暗:從圖像到視頻”(Looking into the dark: from image to video),美研所AI計算機視覺(jué)高級技術(shù)總監全書(shū)學(xué)做了“從零開(kāi)始構建可在智能手機和AR眼鏡上運行的統一SLAM系統”演講(Building a unified SLAM system running on both smartphone and AR glass from scratch),與全球學(xué)界分享OPPO在影像方面的最新成就。
OPPO超分技術(shù)成果,憑空將模糊圖片算清晰
“極端超分辨率感知”( Perceptual Extreme Super-Resolution)是CVPR難度最高的賽項之一,要求從模糊的低分辨率圖片中,獲得細節更清晰、更接近真實(shí)情況的高清圖像。這是計算機視覺(jué)技術(shù)中難度最大的領(lǐng)域之一,需要盡可能地平衡圖像的畫(huà)質(zhì)與真實(shí)性。針對這項挑戰,OPPO提出了獨創(chuàng )的神經(jīng)網(wǎng)絡(luò )架構RFB-ESRGAN,通過(guò)更智能的方式提取原圖特征,用分布式算法提高計算效率,以更多元的采樣與計算模型配合,通過(guò)計算把模糊的圖片清晰放大了16倍,從全球280多個(gè)頂尖參賽團隊中脫穎而出,獲得了第一名,其他參賽者,不乏來(lái)自臉書(shū)、百度、微軟、亞馬遜、中科院、UIUC等國際頂尖科技公司與院校的團隊。
這項技術(shù)將在未來(lái)為諸多應用場(chǎng)景提供幫助,例如將用戶(hù)手機拍攝到的模糊影像處理成細節豐富的高清效果,修復圖像受到損壞的老照片、老電影,或者對衛星、航天圖像進(jìn)行細節分析等工作。
人工智能程序對圖片從多維度進(jìn)行分析
在“手持設備視覺(jué)定位”挑戰中,OPPO獲得了面向室外場(chǎng)景的數據集第一名,與面向室內場(chǎng)景的數據集第三名?!耙曈X(jué)定位”是通過(guò)搜集和分析圖像中的海量信息,對自身拍攝方位作出精確判斷。OPPO團隊自主設計的全新分析流程,可以智能分析圖像信息的分類(lèi)標簽及圖像深淺信息,大量排除錯誤結果,從而顯著(zhù)提升分析準確程度。這一技術(shù)對未來(lái)的AR眼鏡,智能機器人,精準導航等應用都能起到重要作用。例如,當智能機器人助手安裝了攝像頭之后,就可以利用視覺(jué)定位技術(shù)對拍攝到的圖像作運算分析,獲得準確定位,從而精準的移動(dòng)。
此外,OPPO還在“長(cháng)視頻行為識別”(Activity detection in extended videos)賽項中獲得了第三名?!耙曨l行為識別”是指在某段視頻中分析并判斷人或物體對象的行為動(dòng)作。OPPO的智能程序可高效識別并重組每一幀畫(huà)面中的人物,辨別復雜動(dòng)態(tài)視頻中的人類(lèi)行為。在一段數十人出鏡的長(cháng)視頻中,它準確識別了視頻中每個(gè)人走動(dòng)或是聊天等的數十種動(dòng)作。這項技術(shù)在未來(lái)能廣泛應用在人機交互、運動(dòng)分析等領(lǐng)域,例如未來(lái)的手機產(chǎn)品便可以自動(dòng)識別正在運動(dòng)的拍攝對象,并自動(dòng)調節快門(mén)對焦。
智能感知與交互研究部成立,賦能OPPO前沿技術(shù)探索
2020年初,OPPO研究院正式成立智能感知與交互研究部,邀請行業(yè)領(lǐng)軍人物郭彥東博士加盟并擔任OPPO智能感知首席科學(xué)家,領(lǐng)導快速組建并逐步完善專(zhuān)業(yè)科研團隊。
目前,智能感知與交互研究部已初具規模,并引進(jìn)了諸多頂尖科技公司與科研院校人才。此次OPPO參加CVPR2020的多項獲獎成果均來(lái)自該團隊。
一直以來(lái),OPPO都認為,人工智能與通信技術(shù)是相輔相成,既可以斷地互相賦能與提升,也可以共同為萬(wàn)物互融打下堅實(shí)的技術(shù)基礎,設備、服務(wù)與網(wǎng)絡(luò )的智能化都將是未來(lái)的必然趨勢。智能感知與交互研究部的成立,標志著(zhù)OPPO對人工智能前沿科技探索的進(jìn)一步深化,并將大力推動(dòng)OPPO在智能感知及交互這兩項核心領(lǐng)域的研發(fā)工作。
重視人工智能研發(fā),OPPO夯實(shí)技術(shù)領(lǐng)先地位
自2015年起,OPPO就開(kāi)始在人工智能領(lǐng)域投入研究,并成立了相關(guān)研發(fā)團隊,主要關(guān)注語(yǔ)音語(yǔ)義、計算機視覺(jué)等領(lǐng)域,也屢次獲得國內外權威競賽的獎項肯定。同時(shí),OPPO一直積極進(jìn)行相關(guān)專(zhuān)利布局,截至2020年3月,OPPO在人工智能領(lǐng)域的全球專(zhuān)利申請已超過(guò)1,900件。
OPPO創(chuàng )始人兼首席執行官陳明永曾在2019年OPPO未來(lái)科技大會(huì )上表示,未來(lái)三年將投入500億人民幣研發(fā)預算,推進(jìn)5G、人工智能、AR、大數據等核心技術(shù)的研究,并構建底層硬件核心技術(shù)以及軟件工程和系統能力。面向萬(wàn)物互融的未來(lái),人工智能領(lǐng)域將是OPPO一如既往關(guān)注的研發(fā)重點(diǎn),而基于這些前沿科技領(lǐng)域不斷的研發(fā)投入,OPPO也將持續展開(kāi)多智能終端生態(tài)的全方位布局。(張俊達)