11月2日,貝殼財經(jīng)記者獲悉,為期4天的RTE2022第八屆實時互聯(lián)網(wǎng)大會正在進行,在大會上,聲網(wǎng)創(chuàng)始人兼CEO趙斌、聲網(wǎng)CTO兼首席科學(xué)家鐘聲分別從行業(yè)和技術(shù)角度對實時互動進行了解讀。趙斌表示,比起RTC(實時音視頻),RTE(實時互動)更聚焦用戶所需要的共享時空,即“場景”。鐘聲則表示,實時互聯(lián)網(wǎng)正在日益變得智能化,對實時音視頻端到端鏈路上各個環(huán)節(jié)場景的實時感知和理解成為實時互動的重要基礎(chǔ)能力。
(相關(guān)資料圖)
在談到元宇宙話題時,趙斌表示,空間音頻對元宇宙的重要性不容忽視。“如果跟真實有差異,在元宇宙場景下的現(xiàn)場感、沉浸感和真實感就會有大大的損失?!辈槠章髮W(xué)電影學(xué)院教授Charlie Fink也表示,即使在一個3D虛擬世界,仍然需要語音和視頻的存在。在圓桌論壇環(huán)節(jié),聲網(wǎng)首席運營官劉斌、新希望集團首席投資官余峰、微醫(yī)集團副總裁李磊、水滴保研發(fā)負(fù)責(zé)人盧林等嘉賓,還圍繞“音視頻技術(shù)對未來企業(yè)數(shù)字化轉(zhuǎn)型賦能的新趨勢”話題展開探討。
本次大會以“聚享萬象”為主題,覆蓋實時互聯(lián)網(wǎng)技術(shù)、行業(yè)、創(chuàng)業(yè)、生態(tài)、企業(yè)責(zé)任等話題。今年是實時互聯(lián)網(wǎng)大會的第8年,自2015年首次舉辦以來,實時互聯(lián)網(wǎng)大會成長為全球規(guī)模最大的音視頻行業(yè)峰會,吸引了全球RTE開發(fā)者、創(chuàng)業(yè)者及行業(yè)人士參與,累計影響開發(fā)者超過200萬。
RTE邊界逐步清晰化,元宇宙玩法仍待突破
隨著行業(yè)的發(fā)展,RTE概念與邊界已逐步清晰化。趙斌表示,“RTC(實時音視頻)更多是在強調(diào)對語義信息進行高質(zhì)量和高效率的傳遞。而RTE(實時互動)更聚焦用戶所需要的共享時空,即俗話所說的場景?!?/p>
最近一年,AI算法在音頻領(lǐng)域產(chǎn)生了巨大進化。AI降噪、AI回聲消除、空間音頻等音頻的新技術(shù)能力給各種場景帶來了更加純凈和沉浸的聽覺體驗??臻g音頻對元宇宙的重要性不容忽視。趙斌認(rèn)為,“人的耳朵是一個超級敏感的器官,對任何聲音的變化都是有感知和分辨能力的,如果跟真實有差異,在元宇宙場景下的現(xiàn)場感、沉浸感和真實感就會有大大的損失?!?/p>
過去一年,元宇宙的熱度仍然在持續(xù)飆升,但宣傳效果距離現(xiàn)實仍然尚遠。“BeReal應(yīng)用(一款主打照片分享的社交平臺)的爆火讓我們看到,真人形象遠比虛擬形象更能夠在陌生人社交中滿足需求?!壁w斌表示,在非陌生人社交領(lǐng)域,虛擬形象也是偏小眾的弱需求。無論是虛擬形象還是其他玩法,元宇宙如果想在社交領(lǐng)域有大的發(fā)揮,玩法上還有更多需要突破的空間。趙斌表示,聲網(wǎng)把自己元宇宙方面的能力和API的進化聚焦在了基礎(chǔ)能力模塊上,以組合的方式來提供。
當(dāng)元宇宙的熱度逐漸飆升,由此衍生的各種新潮玩法為社交娛樂提供了全新的想象空間。查普曼大學(xué)電影學(xué)院教授、福布斯周刊《本周XR速報》專欄作者Charlie Fink認(rèn)為,“互聯(lián)網(wǎng)并沒有擺脫電視,它使電視變得更好,我相信這就是將在元宇宙發(fā)生的事情,即使你在一個3D虛擬世界,它仍然需要語音和視頻的存在?!?/p>
實時互聯(lián)網(wǎng)正在日益變得智能化,對實時音視頻端到端鏈路上各個環(huán)節(jié)場景的實時感知和理解成為實時互動的重要基礎(chǔ)能力,聲網(wǎng)CTO兼首席科學(xué)家鐘聲認(rèn)為“僅僅作為一個信息傳輸?shù)墓艿?,承載不了現(xiàn)在通訊的需求,還要整個實時音視頻端到端鏈路上有提取知識、識別情感、做出決策的能力,成為實時互動不可少的一個要素?!?/p>
“實時感知和理解能力,在實時互動多個層面都起到了重要作用,或者說帶來價值,包括用戶體驗感知質(zhì)量的估計、關(guān)于整個傳輸網(wǎng)絡(luò)上質(zhì)量的監(jiān)測,以及關(guān)于場景,尤其是人體、物體的重建,以及用來做人機交互等等。在未來的實時互動場景里,也會有越來越多的需求?!辩娐暠硎尽?/p>
虛擬現(xiàn)實的結(jié)合趨勢明顯,更多傳統(tǒng)企業(yè)接受云服務(wù)化
音視頻技術(shù)對未來企業(yè)數(shù)字化轉(zhuǎn)型賦能方面還會有哪些新的趨勢?聲網(wǎng)首席運營官劉斌、新希望集團首席投資官余峰、微醫(yī)集團副總裁李磊、水滴保研發(fā)負(fù)責(zé)人盧林等嘉賓,分別發(fā)表了各自的觀點。
互聯(lián)網(wǎng)保險正逐漸向保險的深水區(qū)方向發(fā)展,即線下經(jīng)紀(jì)人業(yè)務(wù)。盧林表示,“這個過程中,音視頻技術(shù)非常有價值,未來通過與用戶遠程視頻聊天,進一步跟保險業(yè)務(wù)系統(tǒng)打通,可以提供更多元的展示工具和互動,從而提供更加深度、長期的保險服務(wù),這是下一個階段應(yīng)用場景下的發(fā)展趨勢?!?/p>
音視頻技術(shù)也是醫(yī)療服務(wù)中較核心的手段,李磊表示,“無論是醫(yī)生之間、醫(yī)患之間,還是其他場景的服務(wù),音視頻使用都非常廣泛。我們希望不單一把音視頻作為服務(wù)方式,而是能夠成為服務(wù)的觸角或入口,更好地服務(wù)用戶?!?/p>
余峰認(rèn)為,“未來5年或10年豬語音庫會很豐富,甚至能識別出更多豬想表達的情緒、語言。同時,目前影像技術(shù)可以精準(zhǔn)地通過手持估重儀或類似遠程監(jiān)控的方式對豬進行相關(guān)估重。所以,我們看到音視頻從人與人交流互動,真正到生物資產(chǎn)端,通過豬語音識別、豬形象估重,實現(xiàn)人跟生物、動物之間的交流?!?/p>
從云服務(wù)商的角度劉斌提出了4點對行業(yè)未來趨勢的觀察,他認(rèn)為,“第一,云服務(wù)化被越來越多傳統(tǒng)企業(yè)接受,并逐步接受混合云模式;第二,對AI技術(shù)的運用越來越多,比如我們有語音AI降噪、空間音頻方位識別等等,包括視頻人臉識別以及未來的脊柱識別;第三,虛擬現(xiàn)實的結(jié)合趨勢很明顯;第四,在某些有積累的垂直行業(yè)會更容易先把低代碼做起來,而不是簡單地通用低代碼?!?/p>
熱門