2022 年以來AIGC 應用多點開花,繼AI繪畫之后又一款應用爆火出圈。
11 月30 日,OpenAI 上線了全新聊天機器人模型ChatGPT,因其高質量的回答、高效獲取信息的方式、以及上癮式的交互體驗,迅速引起了社交媒體的廣泛傳播與關注,上線不到一周用戶突破100萬,火爆全網。從玩梗、寫詩、寫劇本,到給程序找bug,幫人設計網頁,甚至幫你生成AIGC的提示詞,ChatGPT一副無所不能的樣子。埃隆馬斯克(Elon Musk)也在感嘆:“很多人瘋狂地陷入了ChatGPT循環(huán)中,我們離強大到危險的人工智能不遠了?!?/p>
隨著深度學習模型不斷完善、開源模式的推動、大模型探索商業(yè)化的可能,AIGC 有望加速發(fā)展,成為多產業(yè)智能發(fā)展新引擎。業(yè)內人士表示,ChatGPT 模型的出現(xiàn)對于文字模態(tài)的AIGC 應用具有重要意義,相關受益應用來看,包括但不限于代碼機器人、小說衍生器、對話類搜索引擎、語伴、語音工作助手、對話虛擬人等。
(相關資料圖)
日前,天娛數科(002354)接續(xù)雙11穿越式虛擬主播天團,推出真人復刻AI虛擬人。正是此前與李秒珍、包包善、特離譜一起完成虛實直播互動的美妝達人“大宣”,擁有50W粉絲的她,這一次迎來了自己的數字分身?!按笮睂⒆陨淼牡讓用缞y數據系統(tǒng)與AI圖像生成技術相結合,通過視頻+直播的方式與用戶進行互動,不僅為大家?guī)戆疽棺o膚、高顏值彩妝、運動不脫妝等系列美妝小課堂與優(yōu)質產品推薦,同時借助AI虛擬人實7*24小時在線,補充進行美妝知識、熱點話題等趣味分享播報。
AIGC、美妝、虛擬人三大元素結合,不僅創(chuàng)造了美妝直播領域新體驗。同時,標志著天娛數科在虛擬人+AIGC標準技術解決方案突破落地,自此完成身份型虛擬人與服務型虛擬人兩大市場全面布局。根據《量子位虛擬數字人深度產業(yè)報告》,在2030年我國虛擬數字人整體市場規(guī)模將達到2700億,其中身份型虛擬數字人約1750億,服務型虛擬數字人總規(guī)模超過950億。
從2014年起,伴隨著生成對抗網絡(GAN)這一AI算法的不斷進化,以及NLP(Natural Language Processing,自然語言處理)技術的發(fā)展,人工智能生成文本、圖片、視頻以及三者跨模態(tài)相互轉化方面的技術不斷突破。對人工智能而言,要更為精準和綜合的觀察并認知現(xiàn)實世界,就需要盡可能向人類的多模態(tài)能力靠攏,業(yè)內將這種能力稱為多模態(tài)學習MML(Multi-modal Learning),比如,跨模態(tài)理解:通過結合街景和汽車的聲音判斷交通潛在危險;跨模態(tài)生成:在參考其他圖畫的基礎上命題作畫;觸景生情并創(chuàng)作詩歌等。其中,虛擬人正是多模態(tài)生成技術的聚合表現(xiàn)。
天娛數科基于Meta-Surfing元享SaaS平臺4大引擎,生產引擎、驅動引擎、技能引擎、數據引擎,利用人臉建模、形象驅動、語音合成、語音識別、語義理解、圖像處理等多項人工智能技術,優(yōu)化解決虛擬數字人表情&聲音自然度、問答理解溝通力、實時交互能力等行業(yè)難點問題,從而實現(xiàn)了數字人的“可看、可聽、可互動”。天娛數科獨創(chuàng)的實時AI虛擬人,具備擬真度高、實時互動、支持低成本低門檻應用等優(yōu)勢,將廣泛應用于短視頻生產與電商直播領域。
Meta-Surfing元享平臺內容制作界面
(1)2分鐘視頻采集,實現(xiàn)1:1真人復刻
基于創(chuàng)新性模型結構和訓練方法,以及應用場景等方面考慮,天娛數科選擇獨家自研復刻真人技術路線。僅需對被采集人員進行面部、肢體動作、聲音三個維度的2分鐘數據拍攝采集,即可實現(xiàn)1:1高精度還原的虛擬數字形象生成,不僅臉型和五官形狀非常貼合,而且具有毛孔、唇紋、毛發(fā)級別的細節(jié)。與普通的形象還原生成不同的是,利用自研AI技術可對人物的面部、聲色、聲音、動作進行1:1的還原與復刻,可達到以假亂真的效果。助力短視頻創(chuàng)作者、品牌商家24小時低成本低門檻開播。
(2)聲音、表情、動作多維度提升虛擬數字人擬真度
在AI虛擬人應用場景中,短視頻生產、電商直播、AI陪伴等等領域,虛擬人的擬真度決定了商業(yè)化應用成熟度。因此,天娛數科AI圍繞語音合成逼真度、表情自然度、動作自然度,多維度提升擬數字人擬真度。
① 聲音克?。夯贏I深度神經網絡模型,智能提取真人聲音的音色特征、口音特點和韻律節(jié)奏,并通過快速學習,復刻合成AI人聲。合成的語音流暢、自然、清晰,沒有機械感。
② 表情精雕:天娛數科利用3D虛擬人生成技術與數據積累優(yōu)勢,通過全球領先的MagicBall 動態(tài)光場掃描建模設備以及400㎡自建動捕棚,完成百萬條面部、表情、肢體、動作、聲音等大量高精度、高質量數據,精細度可達到說話時的唇動、表情、面部肌肉變化細節(jié)等,以此賦能2D AI虛擬人實現(xiàn)3D化。從此,讓AI虛擬人擺脫“面癱臉”。
③ 動作豐富:基于上述數據庫,天娛數科支持正常播報和交互動作,并在動作庫里為各個應用場景添加了場景特性動作,使虛擬人生動自然。使2D數字人做到可跳、可轉身。
(3)AI虛擬人內容實時智能合成
最后,通過Meta-surfing元享SaaS平臺內置的內容創(chuàng)作模塊。支持用戶上傳文本,一鍵實時驅動數字虛擬分身生成內容播報與多類型動態(tài)視頻。根據文本語義,虛擬形象可實時匹配對應的肢體動作,滿足用戶對內容標準化、個性化、批量化的視覺內容生產需求,適用于不同平臺視頻發(fā)布需求,大大提高了內容生產效率。
此外,應用于7x24小時互動直播,用戶僅需上傳直播腳本即可使用戶代替主播完成7x24小時的無人值守直播,虛擬數字形象可通過對直播中粉絲所提出的問題與互動內容,實時與粉絲進行應答互動與才藝表演等多類型的內容輸出,解決了企業(yè)日常直播中因主播流失、直播狀態(tài)差、人力成本高等多元化因素所帶來的困擾。
天娛數科副總經理賀晗表示,AIGC提高了數據要素的生產力,并且隨著產品的應用以及用戶數據的增長,將會反過來促進模型的優(yōu)化。未來,不論是做元宇宙還是虛擬數字人,最缺少的就是數據,特別是高精度、高質量數據,數據決定著產品質量。
同時,任何新技術的核心價值都是場景下的創(chuàng)新應用,虛擬人+AIGC也不例外。
天娛數科AI虛擬人,主要應用在虛擬客服、虛擬老師、虛擬主播、虛擬醫(yī)生、虛擬導游、虛擬政務等領域。特別在短視頻生產、虛擬直播帶貨、直播間客服等具體場景,天娛數科擁有天然的數據流量優(yōu)勢與行業(yè)Know-How。
天娛數科落地了全國首家以數據流量為特色的數字經濟園區(qū)——山西數據流量生態(tài)園,吸引了包括數字物流、數字能源、數字零售等10余個數字經濟細分領域近350家企業(yè)入園;聚焦抖音、快手兩大平臺,在重慶、鄭州、太原、北京等地建立了短視頻基地,并擁有第一梯隊的直播運營服務品牌。之于AI行業(yè)來說,Know-How至關重要。依托大規(guī)模機器學習和個性化豐富素材庫,大宣數字人僅訓練1天即達到上崗要求。
目前,天娛數科已實現(xiàn)消費級個人虛擬主播解決方案、專業(yè)影視動畫級動捕解決方案、AI虛擬人直播解決方案,從行業(yè)企業(yè)、專業(yè)媒體機構,到MCN機構、個人主播,都有相應的產品可以適配,實現(xiàn)快速、標準化復用。從穿越式虛擬直播,引領行業(yè)從靜態(tài)圖片展示的1.0階段、以體積視頻為代表的2.0階段,加速進化至超寫實實時直播的3.0階段。到大宣的AI數字分身落地,天娛數科順應數字人的智能化趨勢,逐步豐富底層能力,釋放更多的行業(yè)價值。
元宇宙作為數字世界的終極夢想,憑借其虛實結合的魅力重塑著各行各業(yè)。天娛數科將聚焦數字經濟,持續(xù)深耕數字人領域,依托元享平臺積累的海量數據(603138),打磨跨模態(tài)智能算法,擴大元宇宙底層技術創(chuàng)新應用,探索虛擬人+AIGC 的應用模式,擴展元宇宙技術創(chuàng)新應用領域,嘗試在不同行業(yè)進行更多的突破,為人們帶來更多突破想象力的美好體驗。
標簽: 解決方案 人工智能 技術創(chuàng)新
熱門