訊(記者王可)為促進(jìn)數(shù)據(jù)要素安全合規(guī)高效流通、賦能人工智能大模型創(chuàng)新發(fā)展,作為2023世界人工智能大會(huì)的重要組成部分,7月8日,由上海數(shù)據(jù)交易所、大數(shù)據(jù)流通與交易技術(shù)國家工程實(shí)驗(yàn)室承辦的“大模型時(shí)代下的數(shù)據(jù)要素流通”主題論壇在上海世博中心舉行。
啟動(dòng)語料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計(jì)劃
語料庫建設(shè)是一件長期性、專業(yè)性的工作,需要遵循相應(yīng)的質(zhì)量標(biāo)準(zhǔn)和規(guī)范,并保持持續(xù)更新和擴(kuò)充,以適應(yīng)大模型發(fā)展的新需求和新挑戰(zhàn)。上海數(shù)交所作為全國數(shù)據(jù)要素市場核心樞紐,在助力大模型語料庫建設(shè)上具有天然的優(yōu)勢。上海數(shù)交所官網(wǎng)已經(jīng)于7月7日正式上線語料庫,累計(jì)掛牌近30個(gè)語料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運(yùn)輸和醫(yī)療等領(lǐng)域。
(資料圖)
為更好打造高質(zhì)量語料庫、圍繞語料數(shù)據(jù)共建數(shù)商生態(tài),上海數(shù)交所牽頭發(fā)起語料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計(jì)劃,攜手首批合作伙伴上海人工智能實(shí)驗(yàn)室、商湯科技、中國知網(wǎng)、瀾舟科技、OpenKG、拓爾思(300229)、新致和蜜度正式啟動(dòng)該計(jì)劃,積極引導(dǎo)不同行業(yè)、不同領(lǐng)域、具有一定規(guī)模的高質(zhì)量語料數(shù)據(jù)產(chǎn)品掛牌交易,推動(dòng)人工智能大模型技術(shù)創(chuàng)新與應(yīng)用落地,進(jìn)一步豐富語料庫多樣性,助力數(shù)據(jù)要素市場建設(shè)。
數(shù)據(jù)要素價(jià)值不斷凸顯
數(shù)據(jù)要素在人工智能大模型的發(fā)展中具有關(guān)鍵性的作用,決定了模型的訓(xùn)練質(zhì)量、性能表現(xiàn)和應(yīng)用領(lǐng)域的廣度與深度。中國電子副總經(jīng)理陸志鵬圍繞“數(shù)據(jù)要素驅(qū)動(dòng)的大模型體系”做主旨演講,他認(rèn)為,大模型技術(shù)實(shí)現(xiàn)高質(zhì)量發(fā)展,數(shù)據(jù)有效供給是關(guān)鍵,亟需建設(shè)安全可信的數(shù)據(jù)底座。當(dāng)前數(shù)據(jù)合規(guī)確權(quán)、計(jì)量估價(jià)、協(xié)調(diào)分配、安全隱私保護(hù)等核心難題需要破解。
大數(shù)據(jù)流通與交易技術(shù)國家工程實(shí)驗(yàn)室常務(wù)副主任黃麗華表示,數(shù)據(jù)驅(qū)動(dòng)三大變革,包括經(jīng)濟(jì)結(jié)構(gòu)、創(chuàng)新范式、企業(yè)模式。面向大模型,數(shù)據(jù)要素市場大有可為,多層次數(shù)據(jù)要素市場的建設(shè)將提供重要助力。多層次數(shù)據(jù)要素市場的建設(shè)需要有明確的數(shù)據(jù)需求應(yīng)用場景,數(shù)據(jù)要素產(chǎn)權(quán)制度可以提供重要支撐,合規(guī)安全機(jī)制提供保障,基于這樣的一個(gè)市場,數(shù)據(jù)產(chǎn)品低成本、大規(guī)模可得才有可能實(shí)現(xiàn),才能更好地賦能商業(yè)高效應(yīng)用,促進(jìn)數(shù)字化轉(zhuǎn)型。未來,顛覆性創(chuàng)新一定是基于數(shù)據(jù)+人工智能+行業(yè)專業(yè)知識(shí)發(fā)生的。
中國知網(wǎng)副總經(jīng)理張宏偉表示,數(shù)據(jù)是人工智能的基石,數(shù)據(jù)的質(zhì)量和數(shù)量最終決定人工智能水平高低,影響其安全性、可信性。知網(wǎng)擁有海量高質(zhì)量文本語料數(shù)據(jù),打造可融入行業(yè)生產(chǎn)系統(tǒng)的專業(yè)知識(shí)增強(qiáng)大模型,同時(shí)基于CNKI知識(shí)增強(qiáng)大模型,將全面升級(jí)現(xiàn)有產(chǎn)品服務(wù),推出AIGC檢測等新服務(wù),賦能知識(shí)密集型行業(yè)領(lǐng)域。
共建生態(tài)共推大模型應(yīng)用落地
2022年11月,OpenAI推出對(duì)話式通用人工智能大模型ChatGPT,全球新一輪AI創(chuàng)新熱潮隨之掀起,國內(nèi)多個(gè)人工智能大模型相繼推出并快速迭代。商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為,大模型在C端、G端、B端都有大量應(yīng)用場景,賦能醫(yī)療、金融、科研、制造等各行各業(yè),將帶來全新的技術(shù)迭代和場景升級(jí),AI產(chǎn)業(yè)即將迎來一個(gè)更加繁榮的“大航海時(shí)代”,數(shù)據(jù)將成為智能化過程中最重要的要素,包括數(shù)據(jù)獲取、數(shù)據(jù)標(biāo)注與存儲(chǔ)、數(shù)據(jù)處理與清洗、數(shù)據(jù)管理等環(huán)節(jié)都將影響人工智能的水平。
科大訊飛(002230)于今年5月正式發(fā)布星火認(rèn)知大模型及應(yīng)用成果,向教育、辦公、汽車等多行業(yè)伸覆蓋。科大訊飛大數(shù)據(jù)研究院院長譚昶展現(xiàn)了星火認(rèn)知大模型所具備的開放式問答、解答邏輯和數(shù)學(xué)問題等多項(xiàng)功能,他表示,認(rèn)知大模型推動(dòng)了通用人工智能技術(shù)階躍,為更好解決數(shù)據(jù)更新、數(shù)據(jù)偏見和數(shù)據(jù)安全等問題,各方需要加強(qiáng)合作共建生態(tài),共同推動(dòng)大模型應(yīng)用落地。
拓爾思總裁創(chuàng)始人施水才認(rèn)為,高質(zhì)量數(shù)據(jù)才是大模型價(jià)值躍遷的制勝法寶,此外,基礎(chǔ)大模型沒有辦法解決行業(yè)專用問題,行業(yè)大模型是行業(yè)應(yīng)用落地重點(diǎn)。今年6月底,拓爾思正式發(fā)布“拓天大模型”,并率先面向媒體、金融、政務(wù)領(lǐng)域推出了行業(yè)大模型,未來一年還將陸續(xù)推出網(wǎng)絡(luò)輿情、公安、知識(shí)產(chǎn)權(quán)、法律、審計(jì)等行業(yè)大模型。
標(biāo)簽:
熱門