Twitter老闆馬斯克突然宣布,暫時限制用戶每天閱讀帖文數量,有藍剔認證用戶每天1萬個帖文,無認證舊有用戶每天1,000個,新登記的未認證用戶則為500個。馬斯克起初宣布的限制「更辣」,認證用戶只可閱讀6,000個帖文、無認證600個和新無認證用戶300個。Twitter限制閱讀帖文相信是與研發聊天機械人的人工智能(AI)公司有關,他們大量抓取Twitter數據作研究之用,但卻完全免費。
Twitter|馬斯克:數據遭掠劫影響一般用戶
上周五有用戶展示Twitter要求他們登入帳戶以閱讀帖文內容的螢幕截圖,馬斯克其後解釋「我們的數據遭大規模掠劫,影響一般用戶的服務」。報道指,Twitter周六早上似乎死機,近7,500名用戶在Downdetector(報錯網站)投訴無法使用Twitter。馬斯克之後便發文稱,為了解決數據抓取(data scraping)和系統操縱(system manipulation)極端嚴重情況,Twitter要實施上述限制閱讀帖文的暫時措施。馬斯克所提及的數據抓取應該與聊天機械人有關,如Open AI的ChatGPT和Google的Bard,這些AI公司抓取大量數據訓練聊天機械人。
Twitter|冀聊天機械人研發商為數據抓取付費
數據抓取是指從互聯網抓取資料,而聊天機械人需靠大量真人對話來學習溝通。Twitter和網上論壇Reddit的帖文和內容是聊天機械人學習的主要數據來源,這些社交網都想AI公司付費使用這些資料。Reddit行政總裁Steve Huffman於4月向《紐約時報》稱,不滿AI公司的行為,指Reddit的語料庫很寶貴,無義務向部分大公司免費提供。