(相關(guān)資料圖)
11月20日消息,微軟近日在WIPO知識(shí)產(chǎn)權(quán)門(mén)戶(hù)網(wǎng)站上提交了一項(xiàng)專(zhuān)利,專(zhuān)利題為“用于合成音頻的人工智能模型”。
專(zhuān)利說(shuō)明微軟正在發(fā)明一種智能音頻合成技術(shù),用于為各種媒體如電影、電視節(jié)目、游戲,甚至現(xiàn)場(chǎng)錄音創(chuàng)造聲音、音樂(lè)和其它音頻元素。該專(zhuān)利提到了游戲中的動(dòng)態(tài)時(shí)刻,表明它可以創(chuàng)造出配合玩家行動(dòng)的樂(lè)譜。該專(zhuān)利的摘要指出,可以使用視覺(jué)、音頻和文本特征及提示(統(tǒng)稱(chēng)為“數(shù)據(jù)集”)來(lái)設(shè)置參數(shù),以指導(dǎo)眾多的人工智能模型構(gòu)建音頻樂(lè)譜。
了解到,人工智能在視頻游戲中發(fā)揮著不可或缺的作用。從敵人的行為和戰(zhàn)斗遭遇到程序性關(guān)卡的生成以及與NPC和環(huán)境的互動(dòng),人工智能在游戲開(kāi)發(fā)的各個(gè)層面都是不可或缺的。在聲音設(shè)計(jì)方面,自適應(yīng)/動(dòng)態(tài)配樂(lè)在許多視頻游戲中都有體現(xiàn),如現(xiàn)代《毀滅戰(zhàn)士》游戲、《合金裝備崛起》、《鬼泣5》等。
微軟的新專(zhuān)利描述詳細(xì)介紹了眾多的人工智能引擎,這些引擎的任務(wù)是根據(jù)提供的數(shù)據(jù)集進(jìn)行音頻播放。他們可以分析人類(lèi)的表情和情緒,收集位置數(shù)據(jù),分析形勢(shì)的基調(diào)等等。人工智能可以學(xué)習(xí)圖片、視頻、電影、現(xiàn)場(chǎng)活動(dòng),并產(chǎn)生一組音頻文件,可以用適當(dāng)?shù)穆曇粜Ч鸵魳?lè)為視覺(jué)效果分層。這種高科技的人工智能可以為媒體創(chuàng)作開(kāi)辟許多令人興奮的道路,人們可以用一個(gè)巨大的、不斷增長(zhǎng)的音頻樂(lè)譜庫(kù)來(lái)制作電影、游戲等,例如為英雄的出場(chǎng)設(shè)計(jì)一首史詩(shī)般的管弦樂(lè)曲,為寵物的離去譜寫(xiě)一首憂(yōu)郁的曲子,為槍聲和爆炸開(kāi)發(fā)音效,所有這些都可以委托給人工智能的算法。
了解到,該技術(shù)將由云計(jì)算驅(qū)動(dòng)。該系統(tǒng)何時(shí)能真正投入使用還有待觀察,但音頻設(shè)計(jì)的未來(lái)看起來(lái)很有希望,微軟可能會(huì)在這方面掌舵一場(chǎng)革命。
熱門(mén)