每個(gè)人都用一雙眼睛觀看世界。如果閉上一只眼睛,你的左手食指和右手食指同時(shí)相對(duì)伸出,都難以“相遇”。如果睜開雙眼,這個(gè)任務(wù)就變得非常簡單。這是百度三維視覺首席科學(xué)家楊睿剛在百度大腦論壇上給大家分享的小實(shí)驗(yàn)?!皩?shí)際上,這是人類通過一雙眼睛以三維視覺對(duì)周圍的環(huán)境進(jìn)行精確的定位,今天我想跟大家分享的就是如何讓機(jī)器也能夠擁有像人類一樣觀察世界的能力?!彼硎尽?/p>

DuMix AR開放業(yè)內(nèi)首個(gè)AR視頻特效解決方案

無論是人還是機(jī)器,三維視覺都是他們了解世界的重要途徑?,F(xiàn)場,楊睿剛介紹了百度視覺技術(shù)的開放進(jìn)展,并詳細(xì)解讀了三維視覺解決方案及其應(yīng)用案例。他表示,百度視覺技術(shù)繼從看清到看懂后再次實(shí)現(xiàn)了新突破——看透?;诎俣热S視覺技術(shù),機(jī)器可以像人一樣看透世界,從而更好地在AR、新零售、工程機(jī)械等領(lǐng)域施展才能。

距今年7月百度大腦3.0版本發(fā)布,開放視覺語義化僅4個(gè)月,百度視覺語義化技術(shù)平臺(tái)開放再次重磅升級(jí)。

楊睿剛介紹,在底層依賴上,百度研發(fā)了適用于三維視覺的立體視覺AI傳感器。硬件層面,立體視覺AI傳感器采用了三維AI視覺模組,成本大大降低。而且傳感器通過端上運(yùn)算縮減了99%云端傳輸量,效率也進(jìn)一步提升。軟件層面,百度針對(duì)立體視覺開發(fā)了從實(shí)時(shí)端上運(yùn)算到大規(guī)模云端分布式計(jì)算等多種算法,其中一些算法在國際公開數(shù)據(jù)集排行榜KITTI-Stereo上包攬了第一、二名。

在圖片分析上,百度將三維視覺應(yīng)用在人臉識(shí)別上,從而使活體識(shí)別正確率從95.26%提升至99.55%。此外,百度三維視覺技術(shù)還通過整合場景分類、圖像分割、SLAM等核心能力創(chuàng)新打造了智能化場景的感知能力。而且百度三維視覺將這些能力集成到了移動(dòng)端上,為手機(jī)端的AR特效提供了技術(shù)保障。

在視頻分析上,通過引入多角度視頻的標(biāo)定,三維視覺技術(shù)促使人體檢測和跟蹤準(zhǔn)確率達(dá)到了95%以上。

基于在底層依賴、圖片分析和視頻分析等技術(shù)上的突破,百度升級(jí)了可視化展現(xiàn)、機(jī)器人SDK、新零售和工程機(jī)械的解決方案。

AR是當(dāng)前最熱門的交互方式。百度推出的可視化展示產(chǎn)品方案DuMix AR 3.0結(jié)合了人臉特效、美化特效、環(huán)境特效和人體特效等20多項(xiàng)AR能力,為用戶和開發(fā)者提供了豐富的交互體驗(yàn)。不僅如此,借助這些開放基礎(chǔ)能力和相互疊加的組合玩法還能形成一套完整的AR視頻解決方案。

AR視頻解決方案涵蓋四大技術(shù)應(yīng)用方向的全面能力矩陣、整合百度AI+AR多重能力、更加易用的平臺(tái)工具和完善的服務(wù)體系,為開發(fā)者與行業(yè)合作伙伴提供了高效、低成本的內(nèi)容制作服務(wù);同時(shí)結(jié)合百度強(qiáng)大分發(fā)優(yōu)勢,助力合作伙伴實(shí)現(xiàn)業(yè)務(wù)創(chuàng)新、創(chuàng)造巨大的用戶價(jià)值。目前,百度AR視頻特效解決方案已經(jīng)陸續(xù)與全民小視頻、百度貼吧、好看視頻等多個(gè)垂直內(nèi)容合作伙伴開展探索合作,將持續(xù)推動(dòng)AR視頻制作成為AR技術(shù)應(yīng)用的又一常態(tài)化新場景,吸引越來越多的優(yōu)質(zhì)內(nèi)容生產(chǎn)者加入百度AR生態(tài)。

除了聽和看的能力,機(jī)器人最重要的還有行走能力。當(dāng)前機(jī)器人動(dòng)作能力非常有限,大部分機(jī)器人都是固定不動(dòng),一些機(jī)器人能在靜態(tài)環(huán)境中運(yùn)動(dòng),而在復(fù)雜環(huán)境中機(jī)器人行動(dòng)就會(huì)非常緩慢。針對(duì)這些情況,百度動(dòng)態(tài)復(fù)雜環(huán)境下新導(dǎo)航算法可以創(chuàng)建仿真環(huán)境,并讓機(jī)器人在這個(gè)仿真的環(huán)境中做各種各樣行走的嘗試,并從中找到一個(gè)最優(yōu)的路徑。即使在人流密集的商場里,基于該算法的機(jī)器人也能輕松行走,這背后的算法與Alpha Go是一樣的。

在日常應(yīng)用中,百度融合視覺語義化與AR等能力打造出全新的AI零售解決方案。這套方案通過人流抓拍會(huì)員管理、客流計(jì)數(shù)、人流動(dòng)線與熱力圖統(tǒng)計(jì),能夠提高客戶轉(zhuǎn)化率,提升整體收益,實(shí)現(xiàn)更便捷地管理,同時(shí)還能通過分析獲取數(shù)據(jù)結(jié)構(gòu),為商家提供策略指導(dǎo)。據(jù)悉,百度與海信合作打造的AI零售體驗(yàn)店隨后將會(huì)面向公眾開放,為用戶提供即拿即走的便捷購物體驗(yàn)。

除零售外,三維視覺也為工程機(jī)械帶來了煥然一新的智能化體驗(yàn)。以往常說“挖掘機(jī)技術(shù)哪家強(qiáng),中國山東找藍(lán)翔”,不過注入AI的百度無人挖掘機(jī)技術(shù)可不遜于藍(lán)翔。百度開發(fā)的無人挖掘技術(shù)方案,是世界上首套基于視覺技術(shù)開發(fā)的低成本、可量產(chǎn)、適用工程挖掘裝備的人工智能解決方案。在工程項(xiàng)目中,無人挖掘機(jī)與無人機(jī)、自動(dòng)駕駛工程運(yùn)載車默契配合,從制作作業(yè)方案、精準(zhǔn)施工、轉(zhuǎn)運(yùn)、卸載全流程自主完成,從而可以達(dá)到作業(yè)與管理的少人化/無人化,降低安全風(fēng)險(xiǎn),實(shí)現(xiàn)設(shè)備全天候智能施工,不僅大幅提升了施工效率,而且顯著降低人力成本,將助力企業(yè)實(shí)現(xiàn)收益倍增。

楊睿剛表示,“百度視覺從最初的單張圖片分析開始,進(jìn)入視頻,進(jìn)入三維,不斷地向更高緯度的發(fā)展。這都是為了更好地讓機(jī)器看清、看懂、看透我們的世界,從而更好地為我們服務(wù)?!卑俣纫曈X還將持續(xù)創(chuàng)新,不斷突破,為開發(fā)者和合作伙伴提供更多的AI技術(shù)和解決方案的支持。隨著百度AI生態(tài)的勢能不斷增加,越來越多的行業(yè)將進(jìn)入AI變革,也正在給我們帶來更智能更便捷的生活。