日韩在线资源网_欧美电影在线观看_亚洲欧美精品一区二区_亚洲精品永久免费_亚洲福利视频久久_黄网动漫久久久_在线日韩av观看_欧美精品videos_国产精品一区免费视频_成人国内精品久久久久一区

GPT-5將死于GPT-4背刺?牛津劍橋研究警告:AI訓AI成「劇毒」,會讓模型崩潰!-微頭條

來源:創業邦時間:2023-06-17 09:43:22

最差的人類語料,也要勝過AI生成的文本。

隨著GPT-4、Stable Diffusion和Midjourney的爆火,越來越多的人開始在工作和生活中引入生成式AI技術。

甚至,有人已經開始嘗試用AI生成的數據來訓練AI了。難道,這就是傳說中的「數據永動機」?


(資料圖片)

然而,來自牛津、劍橋、帝國理工等機構研究人員發現,如果在訓練時大量使用AI內容,會引發模型崩潰(model collapse),造成不可逆的缺陷。

也就是,隨著時間推移,模型就會忘記真實基礎數據部分。即使在幾乎理想的長期學習狀態下,這個情況也無法避免。

因此研究人員呼吁,如果想要繼續保持大規模數據帶來的模型優越性,就必須認真對待人類自己寫出來的文本。

論文地址:https://arxiv.org/abs/2305.17493v2

但現在的問題在于——你以為的「人類數據」,可能并不是「人類」寫的。

洛桑聯邦理工學院(EPFL)的最新研究稱,預估33%-46%的人類數據都是由AI生成的。

訓練數據,都是「垃圾」

毫無疑問,現在的大語言模型已經進化出了相當強大的能力,比如GPT-4可以在某些場景下生成與人類別無二致的文本。

但這背后的一個重要原因是,它們的訓練數據大部分來源于過去幾十年人類在互聯網上的交流。

如果未來的語言模型仍然依賴于從網絡上爬取數據的話,就不可避免地要在訓練集中引入自己生成的文本。

對此,研究人員預測,等GPT發展到第n代的時候,模型將會出現嚴重的崩潰問題。

那么,在這種不可避免會抓取到LLM生成內容的情況下,為模型的訓練準備由人類生產的真實數據,就變得尤為重要了。

大名鼎鼎的亞馬遜數據眾包平臺Mechanical Turk(MTurk)從2005年啟動時就已經成為許多人的副業選擇。

科研人員可以發布各種瑣碎的人類智能任務,比如給圖像標注、調查等,應有盡有。

而這些任務通常是計算機和算法無法處理的,甚至,MTurk成為一些預算不夠的科研人員和公司的「最佳選擇」。

就連貝佐斯還將MTurk的眾包工人戲稱為「人工人工智能」。

除了MTurk,包括Prolific在內的眾包平臺已經成為研究人員和行業實踐者的核心,能夠提供創建、標注和總結各種數據的方法,以便進行調查和實驗。

然而,來自EPFL的研究發現,在這個人類數據的關鍵來源上,有近乎一半的數據都是標注員用AI創建的。

論文地址:https://arxiv.org/abs/2306.07899v1

模型崩潰

而最開始提到的「模型崩潰」,就是在給模型投喂了太多來自AI的數據之后,帶來的能夠影響多代的退化。

也就是,新一代模型的訓練數據會被上一代模型的生成數據所污染,從而對現實世界的感知產生錯誤的理解。

更進一步,這種崩潰還會引發比如基于性別、種族或其他敏感屬性的歧視問題,尤其是如果生成AI隨著時間的推移學會在其響應中只生成某個種族,而「忘記」其他種族的存在。

而且,除了大語言模型,模型崩潰還會出現在變分自編碼器(VAE)、高斯混合模型上。

需要注意的是,模型崩潰的過程與災難性遺忘(catastrophic forgetting)不同,模型不會忘記以前學過的數據,而是開始把模型的錯誤想法曲解為現實,并且還會強化自己對錯誤想法的信念。

舉個例子,比如模型在一個包含100張貓圖片的數據集上進行訓練,其中有10張藍毛貓,90張黃毛貓。

模型學到的結論是,黃毛貓更普遍,同時會傾向于把藍毛貓想象的比實際更偏黃,所以在被要求生成新數據時可能會返回一些類似綠毛貓的結果。

而隨著時間的推移,藍毛的原始特征在多個訓練epoch中逐漸被侵蝕,直接從藍色變成了綠色,最終再演變為黃色,這種漸進的扭曲和丟失少數特征的現象就是模型崩潰。

具體來說,模型崩潰可以分為兩種情況:

1. 早期模型崩潰(early model collapse),模型開始丟失有關分布尾部的信息;

2. 后期模型崩潰(late model collapse),模型與原始分布的不同模式糾纏在一起,并收斂到一個與原始分布幾乎沒有相似之處的分布,往往方差也會非常小。

與此同時,研究人員也總結出了造成模型崩潰的兩個主要原因:

其中,在更多的時候,我們會得到一種級聯效應,即單個不準確的組合會導致整體誤差的增加。

1. 統計近似誤差(Statistical approximation error)

在重采樣的每一步中,信息中非零概率都可能會丟失,導致出現統計近似誤差,當樣本數量趨于無限會逐漸消失,該誤差是導致模型崩潰的主要原因。

2. 函數近似誤差(Functional approximation error)

該誤差主要源于模型中的函數近似器表達能力不足,或者有時在原始分布支持之外的表達能力太強。

眾所周知,神經網絡在極限情況下是通用的函數近似器,但實際上這種假設并不總是成立的,特別是神經網絡可以在原始分布的支持范圍之外引入非零似然。

舉個簡單例子,如果我們試圖用一個高斯分布來擬合兩個高斯的混合分布,即使模型具有關于數據分布的完美信息,模型誤差也是不可避免的。

需要注意的是,在沒有統計誤差的情況下,函數近似誤差只會發生在第一代,一旦新的分布能被函數近似器描述出來,就會在各代模型中保持完全相同的分布。

可以說,模型強大的近似能力是一把雙刃劍:其表達能力可能會抵消統計噪聲,從而更好地擬合真實分布,但同樣也會使噪聲復雜化。

對此,論文共同一作Ilia Shumailov表示:「生成數據中的錯誤會累積,最終迫使從生成數據中學習的模型進一步錯誤地理解現實。而且模型崩潰發生得非常快,模型會迅速忘記最初學習的大部分原始數據。」

解決方法

好在,研究人員發現,我們還是有辦法來避免模型崩潰的。

第一種方法是保留原始的、完全或名義上由人類生成的數據集的高質量副本,并避免與AI生成的數據混合,然后定期使用這些數據對模型進行重新訓練,或者完全從頭訓練一遍模型。

第二種避免回復質量下降并減少AI模型中的錯誤或重復的方法是將全新的、干凈的、由人類生成的數據集重新引入訓練中。

為了防止模型崩潰,開發者需要確保原始數據中的少數派在后續數據集中得到公正的表征。

數據需要仔細備份,并覆蓋所有可能的邊界情況;在評估模型的性能時,需要考慮到模型將要處理的數據,甚至是最不可信的數據。

隨后,當重新訓練模型時,還需要確保同時包括舊數據和新數據,雖然會增加訓練的成本,但至少在某種程度上有助于緩解模型崩潰。

不過,這些方法必須要內容制作者或AI公司采取某種大規模的標記機制,來區分AI生成的內容和人類生成的內容。

目前,有一些開箱即用的解決方案,比如GPTZero,OpenAI Detector,或Writer在簡單的文本上工作得很好。

然而,在一些特殊的文本中,這些方法并不能有效執行。比如,在EPFL研究中有ChatGPT合成的10個總結,而GPTZero只檢測到6個是合成的。

對此,研究人員通過微調自己的模型來檢測AI的使用,發現ChatGPT在編寫本文時是最常用的LLM。

對于構建的檢測AI數據的方法,研究人員利用原始研究中的答案和用ChatGPT合成的數據,訓練了一個定制的「合成-真實分類器」。

然后用這個分類器來估計重新進行的任務中合成答案的普遍性。

具體來講,研究人員首先使用真正由人類撰寫的MTurk回應,和合成LLM生成的回應,來訓練特定任務的「合成-真實分類器」。

其次,將這個分類器用于MTurk的真實回應(其中眾包人可能使用,也可能沒有依賴LLM),以估計LLM使用的普遍性。

最后,研究者確認了結果的有效性,在事后比較分析擊鍵數據與MTurk的回應。

實驗結果顯示,這個模型在正確識別人工智能文本方面高達99%的準確率。

此外,研究人員用擊鍵數據驗證了結果,發現:

- 完全在MTurk文本框中寫的總結(不太可能是合成的)都被歸類為真實的;

- 在粘貼的總結中,提取式總結和LLM的使用有明顯區別。

具體來講,人工智能生成的文本通常與原始總結幾乎沒有相似之處。這表明AI模型正在生成新文本,而不是復制和粘貼原始內容的一部分。

「人類數據」很重要

現在,人們普遍擔心LLM將塑造人類的「信息生態系統」,也就是說,在線可獲得的大部分信息都是由LLM生成的。

使用綜合生成數據訓練的LLM的性能明顯降低,就像Ilia Shumailov所稱會讓模型患上「癡呆癥」。

而這個問題將會變得更加嚴重,因為隨著LLM的普及,眾包工作者們已經廣泛使用ChatGPT等各種LLM。

但對于人類內容創作者來說,這是一個好消息,提高工作效率的同時,還賺到了錢。

但是,若想挽救LLM不陷于崩潰的邊緣,還是需要真實的「人類數據」。

1. 人類數據在科學中仍然是至關重要的

2. 在合成數據上訓練模型可能會帶來偏見和意識形態永久化

3. 隨著模型變得流行和更好/多模態,采用率只會增加

總的來說,由人類生成的原始數據可以更好地表示世界,雖然也可能包含某些劣質、概率較低的數據;而生成式模型往往只會過度擬合流行數據,并對概率更低的數據產生誤解。

那么,在充斥著生成式AI工具和相關內容的未來,人類制作的內容或許會比今天更有價值,尤其是作為AI原始訓練數據的來源。

參考資料:

https://arxiv.org/abs/2306.07899v1

https://arxiv.org/abs/2305.17493v2

本文(含圖片)為合作媒體授權創業邦轉載,不代表創業邦立場,轉載請聯系原作者。如有任何疑問,請聯系editor@cyzone.cn。

標簽:

責任編輯:FD31
上一篇:時訊:國乒公布斯洛文尼亞挑戰賽名單,馬龍帶新人打資格賽,球迷感動!
下一篇:最后一頁

精彩圖集(熱圖)

熱點圖集

最近更新

信用中國

  • 信用信息
  • 行政許可和行政處罰
  • 網站文章

日韩在线资源网_欧美电影在线观看_亚洲欧美精品一区二区_亚洲精品永久免费_亚洲福利视频久久_黄网动漫久久久_在线日韩av观看_欧美精品videos_国产精品一区免费视频_成人国内精品久久久久一区
99久久er热在这里只有精品66| 中文一区二区在线观看| 国产一区二区三区日韩| 欧美三级中文字幕| 一区二区三区日韩欧美精品| 91视视频在线观看入口直接观看www| 国产欧美日韩中文久久| 国产精品自拍毛片| 国产精品欧美久久久久无广告 | 国产精品丝袜91| 丰满岳乱妇一区二区三区| 久久免费的精品国产v∧| 成人福利在线看| 亚洲精品中文在线影院| 欧美精品vⅰdeose4hd| 奇米亚洲午夜久久精品| 国产亚洲va综合人人澡精品| 在线免费观看日本欧美| 美日韩一区二区| 中文字幕一区二区视频| 欧美一区二区啪啪| 波波电影院一区二区三区| 午夜av电影一区| 久久综合九色综合97_久久久| av在线一区二区三区| 美国一区二区三区在线播放| 亚洲欧洲日产国码二区| 91精品国产欧美一区二区成人| 国产成人av电影在线| 亚洲国产综合91精品麻豆| 久久蜜臀精品av| 欧美一区日韩一区| 色噜噜狠狠一区二区三区果冻| 老司机精品视频线观看86| 亚洲欧美韩国综合色| 国产婷婷色一区二区三区在线| 欧美视频日韩视频在线观看| 成人午夜视频在线观看| 麻豆精品在线看| 天堂va蜜桃一区二区三区| 欧美韩国日本不卡| 久久久久久久久蜜桃| 精品国产一区a| 欧美成人一区二区三区在线观看| 欧美亚洲国产一区在线观看网站| 波多野结衣中文一区| 国产精品888| 成人免费福利片| 国产成人综合亚洲网站| 国v精品久久久网| 成人三级在线视频| 岛国一区二区三区| av激情综合网| 91视频一区二区三区| 91麻豆自制传媒国产之光| 成人av电影在线| 一本一道久久a久久精品综合蜜臀 一本一道综合狠狠老 | 亚洲欧美日韩电影| ●精品国产综合乱码久久久久| 中文字幕av资源一区| 亚洲欧美在线视频观看| 亚洲四区在线观看| 视频一区视频二区中文| 三级在线观看一区二区| 久久精品久久99精品久久| 国产毛片一区二区| 99久久综合国产精品| 欧美日韩在线播放| 精品国产凹凸成av人网站| 国产欧美日韩不卡免费| 亚洲精品视频在线看| 日本不卡一二三区黄网| 国产精品白丝jk黑袜喷水| av影院午夜一区| 欧美一区二区三区四区久久| 久久精品在线免费观看| 亚洲图片欧美综合| 国产美女精品一区二区三区| 日本丰满少妇一区二区三区| 精品成人佐山爱一区二区| 亚洲综合久久久| 国产成人鲁色资源国产91色综| 欧美视频一区在线观看| 国产蜜臀97一区二区三区| 天堂va蜜桃一区二区三区| 成人短视频下载| 精品国产亚洲一区二区三区在线观看| 综合久久久久综合| 国产在线观看一区二区| 欧美日韩高清一区二区不卡 | 制服丝袜亚洲播放| 亚洲色图在线看| 国产乱子伦一区二区三区国色天香| 色一情一乱一乱一91av| 久久精品一区二区三区不卡| 日本视频免费一区| 777亚洲妇女| 日韩激情视频网站| 欧美日韩久久不卡| 亚洲精品精品亚洲| 91麻豆福利精品推荐| ...av二区三区久久精品| 国产在线播精品第三| 欧美va亚洲va在线观看蝴蝶网| 青草国产精品久久久久久| 欧美精品电影在线播放| 午夜在线成人av| 欧美裸体bbwbbwbbw| 丝袜亚洲另类欧美综合| 欧美男人的天堂一二区| 日韩国产欧美视频| 日韩一级片在线观看| 免费成人你懂的| 久久综合丝袜日本网| 国产一区二区主播在线| 精品久久久久av影院 | 国产亚洲女人久久久久毛片| 国产高清不卡一区二区| 国产精品久久看| 欧美中文字幕亚洲一区二区va在线 | 日韩理论片在线| va亚洲va日韩不卡在线观看| 日本一二三不卡| 在线亚洲人成电影网站色www| 亚洲精品中文在线影院| 5858s免费视频成人| 久久66热偷产精品| 国产精品卡一卡二卡三| 欧美日韩综合一区| 国产九色sp调教91| 亚洲一区二区三区四区五区中文| 欧美日本国产一区| 国产成人精品免费| 亚洲va中文字幕| 国产日韩欧美不卡| 99在线精品一区二区三区| 丝袜国产日韩另类美女| 久久精品一区二区| 在线不卡免费av| 成人av电影在线| 精品一区二区三区欧美| 亚洲免费av高清| 2021久久国产精品不只是精品| 不卡一区中文字幕| 国产乱码字幕精品高清av| 亚洲午夜久久久久久久久久久| 久久无码av三级| 欧美老肥妇做.爰bbww视频| 国产成人8x视频一区二区| 日本不卡免费在线视频| 亚洲欧美aⅴ...| 国产三级一区二区三区| 91精品国产免费久久综合| 色噜噜偷拍精品综合在线| 国产传媒一区在线| 国产精品自拍av| 久久不见久久见免费视频1| 五月婷婷综合网| 午夜精品成人在线| 婷婷综合另类小说色区| 亚洲不卡av一区二区三区| 亚洲综合一二区| 亚洲精品视频在线看| 亚洲欧洲综合另类| 亚洲欧美在线aaa| 综合网在线视频| 国产精品护士白丝一区av| 国产视频视频一区| 国产欧美一区二区精品性| 久久久99久久| 中文字幕精品在线不卡| 国产精品久久久一区麻豆最新章节| 久久九九久久九九| 国产亲近乱来精品视频| 国产天堂亚洲国产碰碰| 国产精品视频麻豆| 欧美国产一区二区| 亚洲精品免费看| 天天综合天天综合色| 欧美一区二区二区| 一区精品在线播放| 国产精品白丝在线| 中文字幕一区二区三区不卡在线| 国产日韩影视精品| 亚洲女性喷水在线观看一区| 亚洲一区二区三区爽爽爽爽爽| 亚洲自拍另类综合| 老司机免费视频一区二区三区| 国产成人自拍网| 色婷婷一区二区| 欧美一区二区视频观看视频| 国产亚洲欧美中文| 一区二区在线看| 久久精品国产成人一区二区三区 | 日韩精品资源二区在线| 国产亚洲精品免费| 亚洲成a人片在线不卡一二三区 | 欧美精品久久天天躁| 久久综合av免费| 亚洲影院免费观看|