999精品,丝袜综合,大陆老熟妇性,中国老女人AV,亚洲精品国产第一区二区三区

環(huán)球速遞!國雙知識智能專家談:ChatGPT落地到工業(yè)領域還有多遠
發(fā)布時間:2023-03-28 09:16:09 文章來源:國雙Gridsum
當前位置: 主頁 > 資訊 > 國內 > 正文

隨著GPT-4的重磅發(fā)布,AI應用又一次引爆社交媒體。2022年11月,當OpenAI推出ChatGPT時估計沒有想到它后來會如此成功:上線2個月后月活用戶突破1億,成為史上用戶增長最快的消費級應用程序。在此之前最為成功的是TikTok,達到這個月活水平也用了9個月。ChatGPT的成功引爆了AI行業(yè),讓更多的普通人也開始關注。同時,也引發(fā)了眾多AI從業(yè)者的思考:ChatGPT會對自己所在行業(yè)帶來什么影響?ChatGPT是否能為我所用?如何用?

作為國雙CTO,國雙技術戰(zhàn)略制定和整體產品研發(fā)工作的負責人,劉激揚也在思考這些問題。國雙定位為大數(shù)據(jù)和人工智能領域的技術型公司,人工智能技術在產品和解決方案中得到廣泛應用,支撐地位毋庸置疑,上述問題的答案事關國雙未來技術布局。


(相關資料圖)

ChatGPT突破在哪里?

劉激揚畢業(yè)于清華大學并取得了美國匹茲堡大學計算機科學碩士學位,2014年12月加入國雙出任CTO。加入國雙前,劉激揚服務于微軟長達16年。在微軟亞洲研究院工作期間,劉激揚創(chuàng)建了微軟搜索技術中心,這也是微軟亞洲互聯(lián)網工程院的前身。他還創(chuàng)立了微軟亞洲互聯(lián)網工程院蘇州分院并主持工作。

作為一名技術專家,劉激揚一直非常關注人工智能技術,他在微軟的工作就與人工智能技術相關,后來在國雙領導了人工智能技術研究。由于這些經歷,劉激揚比一般人更懂得人工智能技術的價值和該技術當前的瓶頸所在。

在劉激揚看來,ChatGPT大火并不是因為它采用了顛覆型的技術,更多的是其在現(xiàn)有技術上取得的一種工程突破。

“從技術上來講,ChatGPT和之前基于深度學習識別貓、狗,仍然處于同一技術路線。因為現(xiàn)在語料的增加、算力的提升、訓練相關工程能力的提升,使得更大的模型訓練得以實現(xiàn),也使得表現(xiàn)更為智能。但總體而言,ChatGPT并不是創(chuàng)造了新的技術,而只是原有技術的組合和迭代。”劉激揚表示。

劉激揚介紹,從自然語言處理(NLP)技術本身來看,ChatGPT屬于文本生成領域,所用的技術和此前的文本生成一脈相承,目前看來,這樣端到端的模型對于分詞、語法相關的問題并沒有解決,也就是說尚未產生真正的理解,還是基于統(tǒng)計的可能性進行文本生成。

OpenAI公司技術專家的說法證實了劉激揚的看法。根據(jù)這些專家們的說法,ChatGPT使用的技術都不是新的,ChatGPT使用的是微調后的GPT-3.5,GPT-3.5是2020年發(fā)布的GPT-3的更新版,OpenAI 在2022年1月就發(fā)布了GPT-3.5的預覽,相關API也早就發(fā)布了。因為這些原因,當初OpenAI發(fā)布ChatGPT時并沒有太多期望,目的只是想收集公眾的反饋進行模型優(yōu)化。

不過,劉激揚認為,ChatGPT還是有突破,它比前輩們更接近人的行為模式,更符合人類的需求。它在人機交互上更為自然、智能,尤其是它能表現(xiàn)出對上下文的理解和記憶,這種體驗是此前的各種交互機器人所不具有的,這是一個驚人的進步,也是它能迅速出圈的重要原因。而這背后離不開大量的技術工作,其中的關鍵創(chuàng)新是ChatGPT采用了一種從人類反饋中強化學習的技術(RLHF),他們先訓練了一個會生成各種內容的大語言模型,然后,通過人來教它人類希望它怎么回答來調整,這也是ChatGPT成功的真正秘訣。

落地到行業(yè)還有多遠?

隨著ChatGPT的走紅,越來越多的人開始使用它,有人用它來寫代碼、招聘信息、文案、論文等。不過,目前這些應用主要還是消費領域。那么,ChatGPT能否真正進入行業(yè)?

劉激揚認為目前還有困難。ChatGPT主要是面向大眾的,這和國雙所從事的產業(yè)化落地完全不同,那需要在工業(yè)領域一個場景、一個場景地深耕。

“前者追求受眾廣泛,能夠滿足大多數(shù)人的一般需求,后者需要強化數(shù)據(jù)和知識雙輪驅動,針對業(yè)務問題進行數(shù)據(jù)治理、知識治理、智能應用構建,結合專家的經驗、數(shù)據(jù)及知識、智能決策算法,解決核心業(yè)務問題。”他說。

劉激揚認為,ChatGPT(或者類似的大模型)要落地到行業(yè)、賦能企業(yè)目前至少還面臨以下挑戰(zhàn):

首先是答案的正確性。ChatGPT采用的大模型技術,數(shù)據(jù)主要來自網絡,其本身并不存在真正的基礎數(shù)據(jù)庫、知識結構,在回答問題時它會犯錯,甚至虛構,導致它常?!耙槐菊浀暮f八道”,這對尋求專業(yè)性問題答案者會產生嚴重困擾。

其次,ChatGPT使用的大模型本質上是一種“黑盒子”,對于為什么給出這樣的答案,ChatGPT無法給出解釋。這在很多工業(yè)應用場景來說是不可接受的,很多時候我們不僅想知道答案,還希望知道為什么是這個答案。

第三是工程難度,也就是成本問題。ChatGPT采用的大語言模型,模型參數(shù)達到千億級別。訓練這種模型需要很大投入,有機構預測,GPT-3訓練一次的成本約為140萬美元,同時平時還需要不菲的運行費,顯然不是一般的企業(yè)能夠玩得起的。

另外,還有實時性的問題。目前英文版本的ChatGPT數(shù)據(jù)截至2021年,而中文版本的ChatGPT數(shù)據(jù)截至2020年,數(shù)據(jù)滯后的主要原因是由于語言類大模型的技術限制。而在很多工業(yè)場合,需要結合最新的數(shù)據(jù)做出決策,這一點也是難以接受的。

好的技術需要積累和打磨

雖然ChatGPT要真正落地行業(yè)還有一段距離,但它的成功讓人們再次看到了人工智能技術的前景,尤其是生成式AI技術,劉激揚也在評估生成式AI技術在國雙應用的前景。

劉激揚表示,國雙所從事的行業(yè)非常需要生成式AI技術,比如知識管理就是其中之一。目前國雙與某勘探開發(fā)研究院合作的知識智能管理平臺,可以向科研人員提供文章內容摘要、問答、搜索和推薦,但缺少像ChatGPT這樣的自然對話能力,接下來會重點研究這一領域。

另外,國雙所從事的工業(yè)領域對答案正確性和實時性都有嚴格要求,目前單靠ChatGPT難以滿足,但可以考慮通過其他技術的結合來彌補,比如與知識圖譜相結合,國雙也會研究生成式AI與其他AI技術的融合。

劉激揚坦言,讓AI落地行業(yè)需要與行業(yè)深度結合,這需要長期積累,需要精心打磨產品,需要時間?!癈hatGPT能有今天的成功,是幾十億、上百億的投入,是連續(xù)八年默默無聞的改進、優(yōu)化才有的,沒有這份堅守的決心也不能有今日的成功?!彼f。

對于這份堅守國雙深有感觸,國雙也是這么走過來的。國雙成立于2005年,第一個產品Web Dissector(互聯(lián)網流量和用戶行為監(jiān)測與分析系統(tǒng),以下簡稱WD)是2008年推出的,其早期的功能主要是網絡流量和用戶行為的統(tǒng)計、分析。為了滿足客戶在使用中不斷提出的新需求,國雙開始將AI技術應用于WD,并不斷優(yōu)化,因此其功能也從后臺的全域營銷監(jiān)測拓展到前端的廣告預算分配等。

國雙與蘭蔻的合作案例至今仍為老國雙人津津樂道。蘭蔻是國雙創(chuàng)業(yè)初期的天使客戶,當時想了解自己品牌在中國各地的認知度。傳統(tǒng)方法是找人在全國進行面訪和問卷調查,但這樣做周期長、成本高,準確性也無法考證。于是,蘭蔻決定運用大數(shù)據(jù)的方法進行分析,并把這件事委托給了國雙。國雙先是準備了一些關鍵字列表,然后利用WD收集通過搜索引擎查詢這些關鍵詞的流量以及訪問蘭蔻官網的流量,最后進行匯總分析,結果發(fā)現(xiàn)上海、北京、廣西位列前三。廣西的上榜讓人意外,國雙又做了進一步的深究,最后發(fā)現(xiàn)有人借助搜索引擎在作弊,騙取廣告費。最終,國雙經過與客戶溝通運用大數(shù)據(jù)技術幫客戶避免了不小的損失。

在上述案例中,國雙行業(yè)專家的經驗發(fā)揮了很重要的作用,但畢竟還是需要人工介入。于是,國雙開始研究如何把這些專家經驗融入WD,通過WD來自動識別異常流量,機器學習技術就是這樣被引入進來。在與作弊者的不斷較量中,國雙一直在不斷優(yōu)化和改進,如今,已經形成了基于機器學習的系列產品。

“國雙并非一家很大的公司,資源有限,我們不會盲目地去搞技術,更多地投入都是從客戶那里看到行業(yè)、市場和需求。我們一直強調場景化落地,也就是幫助客戶解決實際問題,過去如此,面對大熱的ChatGPT也是如此。我們不會盲目抄作業(yè),能否利用它來真正解決行業(yè)痛點是最重要的標準?!眲⒓P表示。

標簽:

最近更新