(資料圖)
OpenAI官方博客發(fā)布新的研究進(jìn)展,研究人員正在使用GPT-4來(lái)自動(dòng)解釋GPT-2的行為。
OpenAI已經(jīng)通過(guò)GPT-4對(duì)GPT-2中307200個(gè)神經(jīng)元進(jìn)行了書(shū)面解釋?zhuān)瑥慕Y(jié)果來(lái)看,絕大多數(shù)的解釋評(píng)分并不高,超過(guò)1000個(gè)神經(jīng)元的解釋得分高于0.8。
雖然目前從結(jié)果來(lái)看,OpenAI通過(guò)GPT-4解釋GPT-2的效果并不完美,但這一階段性的成果給AI可解釋性研究提供了思路,這一方法會(huì)隨著AI的發(fā)展而不斷精進(jìn)。
(文章來(lái)源:科創(chuàng)板日?qǐng)?bào))
標(biāo)簽:
熱門(mén)