記者郭美婷 實(shí)習(xí)生麥子浩 廣州報(bào)道
(資料圖片僅供參考)
在發(fā)布“通義千問(wèn)”不到兩個(gè)月后,阿里云基于大模型在AI音視頻賽道打出了一槍。
6月1日,阿里云宣布通義大模型進(jìn)展,聚焦音視頻內(nèi)容的AI新品“通義聽(tīng)悟”正式上線,成為國(guó)內(nèi)首個(gè)開(kāi)放公測(cè)的大模型應(yīng)用產(chǎn)品。
今年以來(lái),國(guó)產(chǎn)AI大模型賽道熱鬧非凡,各家廠商、機(jī)構(gòu)的大模型接踵而至,應(yīng)接不暇。最新數(shù)據(jù)顯示,截至目前,我國(guó)10億級(jí)參數(shù)規(guī)模以上大模型已發(fā)布79個(gè)。
相比于集體宣布搶發(fā)AI大模型,未來(lái),如何基于大模型研發(fā)針對(duì)行業(yè)細(xì)分領(lǐng)域的垂直的模型更加重要。各路人馬已有動(dòng)向?!鞍倌4髴?zhàn)”的下一個(gè)新擂臺(tái),已然搭起。
國(guó)內(nèi)首個(gè)開(kāi)放公測(cè)大模型應(yīng)用產(chǎn)品
開(kāi)會(huì)AI幫忙記錄,還能幫忙總結(jié)、提取重點(diǎn)和整理待辦事項(xiàng)?
6月1日,阿里云宣布通義大模型進(jìn)展,聚焦音視頻內(nèi)容的AI新品“通義聽(tīng)悟”正式上線,成為國(guó)內(nèi)首個(gè)開(kāi)放公測(cè)的大模型應(yīng)用產(chǎn)品。
從現(xiàn)場(chǎng)演示可以看到,通義聽(tīng)悟接入了通義千問(wèn)大模型的理解與摘要能力,能夠完成對(duì)音視頻內(nèi)容的轉(zhuǎn)寫(xiě)、檢索、摘要和整理,比如用大模型自動(dòng)做筆記、整理訪談、提取PPT等。聽(tīng)悟還與阿里云盤(pán)打通,同時(shí)支持云盤(pán)導(dǎo)入和本地上傳。
阿里云CTO周靖人介紹,聽(tīng)悟集成了阿里最先進(jìn)的語(yǔ)音和語(yǔ)言技術(shù)。其內(nèi)置阿里新一代工業(yè)級(jí)語(yǔ)音識(shí)別模型,識(shí)別準(zhǔn)確率極高;融合自研語(yǔ)音語(yǔ)義多模態(tài)說(shuō)話人算法,能對(duì)10人以上說(shuō)話場(chǎng)景進(jìn)行角色區(qū)分;接入通義千問(wèn)大模型后,能夠?qū)ι先f(wàn)字的音視頻內(nèi)容進(jìn)行摘要總結(jié),支持跨多音視頻內(nèi)容的精準(zhǔn)問(wèn)答理解。
聽(tīng)悟技術(shù)負(fù)責(zé)人鄢志杰向記者表示,通義聽(tīng)悟的前身是阿里云內(nèi)部一個(gè)名為“聽(tīng)悟”的產(chǎn)品,主要為投資部、HR等部門(mén)做項(xiàng)目會(huì)議的音頻轉(zhuǎn)寫(xiě)功能,在2022年,這款產(chǎn)品的潛力逐步被挖掘,內(nèi)部開(kāi)始思考其工具屬性是不是要發(fā)生變化。
“工具是什么呢?人還是支配他的,基本上它不會(huì)比你更聰明,也不會(huì)比你懂得更多。但是,大模型能力跟工具應(yīng)用相結(jié)合變成助手以后,它甚至能給到建議啟發(fā)你,知曉你不知道的知識(shí),留意到你之前沒(méi)有留意的細(xì)節(jié)。”鄢志杰說(shuō)。
繼此前阿里云降價(jià)之后,此次聽(tīng)悟同樣推出免費(fèi)使用體驗(yàn),聽(tīng)悟用戶可通過(guò)每日登陸等多種任務(wù)領(lǐng)取免費(fèi)轉(zhuǎn)寫(xiě)時(shí)長(zhǎng)。公測(cè)期間,阿里云官方微博、微信及各大平臺(tái)社區(qū)還會(huì)發(fā)放大量20小時(shí)轉(zhuǎn)寫(xiě)口令碼,用戶獲得的福利權(quán)益可累加,一年內(nèi)有效,免費(fèi)時(shí)長(zhǎng)可高達(dá)100小時(shí)以上。
周靖人表示,聽(tīng)悟發(fā)布公測(cè)版后,希望更多人能夠體驗(yàn)到該產(chǎn)品,真正把大模型的能力變成工作學(xué)習(xí)的AI助手。在接下來(lái)的階段,聽(tīng)悟也將陸續(xù)推出增強(qiáng)版,到時(shí)候會(huì)有一些商業(yè)化的安排。
“百?!蓖瞥鲋?/strong>
ChatGPT帶火了國(guó)內(nèi)AI大模型市場(chǎng),5月28日發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,截至目前,我國(guó)10億級(jí)參數(shù)規(guī)模以上大模型已發(fā)布79個(gè)。距離實(shí)現(xiàn)真正的“百?!保讶徊贿h(yuǎn)。
此前,中國(guó)工程院院士、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授鄭緯民接受記者采訪時(shí),ChatGPT的爆紅源于其能流暢地與人對(duì)話、寫(xiě)詩(shī),甚至作畫(huà),但未來(lái)AI大模型所帶來(lái)的貢獻(xiàn)應(yīng)不止于此,如何基于大模型研發(fā)針對(duì)行業(yè)細(xì)分領(lǐng)域的垂直的模型更加重要。
各家企業(yè)、機(jī)構(gòu)也在緊鑼密鼓地發(fā)展大模型、打磨基于大模型的應(yīng)用。
阿里云推出通義聽(tīng)悟時(shí),距離“通義千問(wèn)”的發(fā)布還不到兩個(gè)月的時(shí)間。周靖人對(duì)記者表示,目前外界對(duì)大模型要求很高,從通義千問(wèn)發(fā)布以來(lái),阿里云也陸陸續(xù)續(xù)做了大量工作,并在全國(guó)開(kāi)始部署AI的模型。同時(shí),在云的底層通過(guò)一系列模型優(yōu)化不斷降低模型使用的成本,降低模型所使用的資源,只有這樣能夠讓模型真正意義大規(guī)模去服務(wù)社會(huì)。
對(duì)比阿里云發(fā)布國(guó)內(nèi)首個(gè)開(kāi)放公測(cè)的大模型應(yīng)用產(chǎn)品,百度則帶著國(guó)內(nèi)首個(gè)大模型基金而來(lái)。
5月31日,百度正式宣布設(shè)立規(guī)模為10億元的“百度文心投資基金”,重點(diǎn)投資孵化大模型領(lǐng)域的優(yōu)質(zhì)創(chuàng)業(yè)企業(yè),為其提供包括資金、技術(shù)、人才在內(nèi)的一站式資源。另外,創(chuàng)始人李彥宏正式宣布啟動(dòng)百度“文心杯”創(chuàng)業(yè)大賽,致力于尋找大模型時(shí)代的“game-changing founder”,參賽創(chuàng)業(yè)者將有機(jī)會(huì)獲得來(lái)自百度集團(tuán)的1000萬(wàn)元投資。
在最近的財(cái)報(bào)電話會(huì)議上,騰訊方面也表示AI基礎(chǔ)模型“混元”取得良好進(jìn)展,模型構(gòu)建進(jìn)展順利。其業(yè)務(wù)部門(mén)稱(chēng),目前正積極對(duì)訓(xùn)練部門(mén)及生產(chǎn)線擴(kuò)容,相信未來(lái)人工智能將在不同領(lǐng)域有所應(yīng)用。
據(jù)悉,騰訊已成立類(lèi)ChatGPT對(duì)話式產(chǎn)品項(xiàng)目組“混元助手”。該項(xiàng)目組將聯(lián)合騰訊內(nèi)部多方團(tuán)隊(duì)構(gòu)建大參數(shù)語(yǔ)言模型,目標(biāo)是通過(guò)性能穩(wěn)定的強(qiáng)化學(xué)習(xí)算法訓(xùn)練,完善騰訊智能助手工具,打造騰訊智能大助手,并能成為國(guó)內(nèi)的業(yè)界標(biāo)桿。
標(biāo)簽:
熱門(mén)