微軟(亞洲)互聯(lián)網(wǎng)工程院宣布率先推出新一代的語(yǔ)音交互技術(shù):全雙工語(yǔ)音交互感官(Full-duplex Voice Sense),并已完成產(chǎn)品化落地。與既有的單輪或多輪連續(xù)語(yǔ)音識(shí)別不同,這項(xiàng)新技術(shù)可實(shí)時(shí)預(yù)測(cè)人類(lèi)即將說(shuō)出的內(nèi)容,實(shí)時(shí)生成回應(yīng)并控制對(duì)話節(jié)奏,從而使長(zhǎng)程語(yǔ)音交互成為可能。此外,采用該技術(shù)的智能硬件設(shè)備,將不再需要用戶在每輪交互時(shí)都說(shuō)出喚醒詞,僅需一次喚醒,就可以輕松實(shí)現(xiàn)連續(xù)對(duì)話,將語(yǔ)音交互的自然度推進(jìn)到一個(gè)新的層次。

微軟正式推出新一代全雙工語(yǔ)音交互技術(shù)

目前,該技術(shù)已首先在微軟小冰全球產(chǎn)品線中落地。其中在中國(guó)市場(chǎng),除落戶中國(guó)科技館的小冰電話亭外,微軟還與小米公司緊密合作,米家生態(tài)鏈Yeelight語(yǔ)音助手的市售硬件產(chǎn)品已開(kāi)始進(jìn)入千家萬(wàn)戶。這是全球首個(gè)搭載全雙工語(yǔ)音交互感官的智能設(shè)備,也是內(nèi)置微軟小冰的首個(gè)“雙AI”智能設(shè)備。在日本市場(chǎng),小冰凜菜(りんな)已通過(guò)該技術(shù)實(shí)現(xiàn)在直播平臺(tái)中的落地,首個(gè)車(chē)載智能項(xiàng)目也已開(kāi)始路試。微軟計(jì)劃于未來(lái)六個(gè)月內(nèi),完成該技術(shù)在更多產(chǎn)品線中的覆蓋。

語(yǔ)音交互是對(duì)話式人工智能及智能硬件設(shè)備的基礎(chǔ)之一。全雙工語(yǔ)音交互技術(shù)的應(yīng)用,有望實(shí)現(xiàn)用戶體驗(yàn)的下一次飛躍,并成為人工智能語(yǔ)音交互的新“標(biāo)準(zhǔn)配置”。微軟小冰全球研發(fā)負(fù)責(zé)人周力博士表示:“從已落地的產(chǎn)品數(shù)據(jù)和用戶反饋中,我們觀察到一個(gè)普遍現(xiàn)象:用戶一旦使用過(guò)微軟小冰的全雙工語(yǔ)音交互感官之后,再與其他語(yǔ)音助手交互時(shí),他們普遍會(huì)開(kāi)始感到不習(xí)慣,甚至?xí)l繁忘記要對(duì)其他語(yǔ)音助手說(shuō)喚醒詞——新技術(shù)促進(jìn)擬人自然度的顯著提升,使人們對(duì)過(guò)去單輪或多輪連續(xù)語(yǔ)音交互體驗(yàn)的滿意度迅速下降。這種新老交替的現(xiàn)象,符合我們的研發(fā)預(yù)期?!?/p>

微軟全球資深副總裁、微軟(亞洲)互聯(lián)網(wǎng)工程院院長(zhǎng)王永東博士表示:“我們預(yù)測(cè),未來(lái)一年中,人工智能應(yīng)用將越來(lái)越多地從某些單一技術(shù)領(lǐng)域,進(jìn)入到發(fā)揮綜合能力的階段。微軟已在這方面深入布局。此次全雙工語(yǔ)音交互技術(shù)的推出,不僅涉及到計(jì)算機(jī)語(yǔ)音技術(shù),還包括自然語(yǔ)言處理、人工智能內(nèi)容創(chuàng)造等多個(gè)領(lǐng)域。這正是微軟在這些領(lǐng)域長(zhǎng)期儲(chǔ)備、綜合運(yùn)用的成果之一。”