(資料圖)
隨著科學(xué)技術(shù)的進(jìn)步,人們正試圖將語(yǔ)音、視覺(jué)、文本和其他信息,即多模態(tài)信息結(jié)合起來(lái),以促進(jìn)人機(jī)交互的升級(jí)。多模式交互技術(shù)包括語(yǔ)音和視覺(jué)識(shí)別等,計(jì)算機(jī)視覺(jué)的可視化有助于提高檢測(cè)目標(biāo)對(duì)象的準(zhǔn)確性,以實(shí)現(xiàn)更好的人機(jī)交互。
而虛擬現(xiàn)實(shí)技術(shù)的快速發(fā)展也為人機(jī)交互提供了新的發(fā)展方向,現(xiàn)代社會(huì)人們對(duì)人機(jī)交互的實(shí)時(shí)性、沉浸感、流暢性的要求越來(lái)越高,目前三維人機(jī)交互已經(jīng)成為人機(jī)交互發(fā)展的最新趨勢(shì),是人機(jī)交互領(lǐng)域的研究熱點(diǎn)。
據(jù)悉,微美全息(NASDAQ:WIMI)將計(jì)算機(jī)視覺(jué)技術(shù)與虛擬現(xiàn)實(shí)技術(shù)相結(jié)合,開(kāi)發(fā)了基于計(jì)算機(jī)視覺(jué)的三維人機(jī)交互系統(tǒng)。在人機(jī)之間構(gòu)建自然直觀(guān)的三維交互環(huán)境,并構(gòu)造三維用戶(hù)界面,實(shí)現(xiàn)和諧的、“以人為中心”的人機(jī)交互界面,提高人機(jī)交互的自然性和高效性。
在三維人機(jī)交互系統(tǒng)中,微美全息采用視覺(jué)作為有效的輸入模態(tài)。計(jì)算機(jī)視覺(jué)是一種引導(dǎo)系統(tǒng)并與視覺(jué)世界交互的人工智能技術(shù),其從獲取的輸入中識(shí)別對(duì)象并提供最終結(jié)果。計(jì)算機(jī)視覺(jué)中包含了獲取、轉(zhuǎn)換和分析數(shù)字圖像等任務(wù),可協(xié)助人類(lèi)完成識(shí)別任務(wù)、啟用交互等,并基于訓(xùn)練數(shù)據(jù)集進(jìn)行評(píng)估。使人機(jī)通訊信息交換量更大、形式更豐富,發(fā)揮人機(jī)彼此不同的認(rèn)知潛力。
資料顯示,微美全息基于計(jì)算機(jī)視覺(jué)的三維人機(jī)交互系統(tǒng)的基本功能包括:人體輪廓提取、人體行為檢測(cè)及虛擬現(xiàn)實(shí)環(huán)境的三維人機(jī)交互。其中,人體輪廓提取是人體行為識(shí)別的第一步,能否精確的提取人體輪廓直接影響人體識(shí)別的效率。而人體行為檢測(cè)是進(jìn)行人機(jī)交互的關(guān)鍵,計(jì)算機(jī)能否準(zhǔn)確的理解人體行為關(guān)系到系統(tǒng)能否正常運(yùn)行。虛擬現(xiàn)實(shí)環(huán)境的三維人機(jī)交互采用靜態(tài)人體動(dòng)作與虛擬現(xiàn)實(shí)系統(tǒng)進(jìn)行交互。通過(guò)采集圖像,圖像預(yù)處理、運(yùn)動(dòng)目標(biāo)識(shí)別、交互行為檢測(cè)等處理,將確定的交互信息發(fā)送給虛擬現(xiàn)實(shí)系統(tǒng),虛擬現(xiàn)實(shí)系統(tǒng)為用戶(hù)提供可操作的三維環(huán)境,使用戶(hù)能夠感覺(jué)到自己在使用動(dòng)作來(lái)操作虛擬現(xiàn)實(shí)系統(tǒng),用人體行為來(lái)進(jìn)行人機(jī)交互也是最直接、最方便的一種交互方式。
虛擬現(xiàn)實(shí)中的人機(jī)交互已經(jīng)越來(lái)越接近人們的生活,其特有的沉浸感、真實(shí)感、交互性等特點(diǎn)使人們能沉浸其中,形成具有交互功能的計(jì)算機(jī)應(yīng)用環(huán)境。微美全息開(kāi)發(fā)基于計(jì)算機(jī)視覺(jué)的三維人機(jī)交互系統(tǒng)在安防監(jiān)控、娛樂(lè)游戲等領(lǐng)域具有廣闊的應(yīng)用前景。
標(biāo)簽:
熱門(mén)