【資料圖】
訊(記者楊月涵)在7月8日的2023世界人工智能大會(huì)“大模型時(shí)代下的數(shù)據(jù)要素流通”主題論壇上,記者獲悉,上海數(shù)交所官網(wǎng)已經(jīng)于7月7日正式上線語(yǔ)料庫(kù),累計(jì)掛牌近30個(gè)語(yǔ)料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運(yùn)輸和醫(yī)療等領(lǐng)域。
上海數(shù)交所總經(jīng)理湯奇峰表示,大模型建設(shè)中,語(yǔ)料庫(kù)是一個(gè)非常重要的方向,語(yǔ)料庫(kù)采購(gòu)已經(jīng)在不少大模型企業(yè)成本中占據(jù)重要比重,上海數(shù)交所希望以市場(chǎng)配置的方式組織數(shù)據(jù)要素推動(dòng)語(yǔ)料庫(kù)建設(shè)。上海數(shù)交所建設(shè)語(yǔ)料庫(kù)主要考慮兩個(gè)維度,一是語(yǔ)料庫(kù)的質(zhì)量,另一個(gè)是語(yǔ)料庫(kù)的開放程度。“比如有的企業(yè)具有海量高質(zhì)量數(shù)據(jù)資源,開放意愿度也很高,但需要組織大量社會(huì)第三方企業(yè)幫助組織相關(guān)的大模型訓(xùn)練,我們針對(duì)四類數(shù)據(jù)產(chǎn)品開發(fā)情況不同、實(shí)際需求不同的供方企業(yè)制定了差異化工作策略,著力打造語(yǔ)料數(shù)據(jù)生態(tài)?!?/p>
標(biāo)簽:
熱門