Blog

科技龍頭涉嫌盜用知名作家作品訓練AI,引發版權風暴與訴訟潮

Blog Image
科技龍頭涉嫌盜用知名作家作品訓練AI,引發版權風暴與訴訟潮

October 10, 2023

重點摘要:
  1. 多家科技公司被指控使用近20萬本包括知名作家作品的「Books3」盜版書籍數據集來訓練他們的生成式AI模型,而未經作家同意。
  2. 這一行為引發了作家界的廣泛憤慨,多位作家在社群媒體上公開表示他們對此行為的不滿和失望。
  3. 雖然一些公司如彭博社表示將不再使用這些數據集,但這一事件已經引發了多起針對Meta和其他使用該數據集的公司的訴訟。

新聞內文:
許多作家紛紛在社群媒體上表達了他們的憤慨,並分享了顯示他們的受版權保護的小說被列入清單的螢幕截圖。

根據大西洋的報導,一些科技龍頭公司正在使用近20萬本書籍來訓練他們的生成式人工智慧模型。這些書籍包括J.K.羅琳、阿米塔夫·高什、魯皮·卡爾和尼爾·蓋曼等知名作家的作品,它們被稱為「Books3」,是一個盜版書籍數據集。然而卻沒有人通知這些作家。

這個書籍集合包括從色情小說到散文詩的各種文類。報導稱,這些書籍幫助生成式人工智慧系統學習如何傳達訊息。

CNN的報導說,一些AI訓練文本可以從網路上發表的文章中提取。Books3已經成為多起針對Meta和其他使用該系統來訓練AI公司的訴訟主題。

許多作家紛紛在社群媒體上表達了他們的憤怒,並分享了顯示他們的受版權保護的小說被列入清單的螢幕截圖。

《緊急聯絡》的作者Mary H.K.Choi在發現她的作品被AI使用後在社群媒體上發聲。她說:「我感到非常難過,心情非常沮喪。我也感到憤怒,同時也感到無助」。她是《紐約時報》的暢銷作家。



在接受CNN的採訪時,喬伊女士說:「一本書包含無限的選擇,無窮的變化,甚至是作者當時的不足。想到這些所有都可以被扔進一個巨大的AI生成機器中,迅速地縮小了很多東西」。她說:「這不僅在經濟上對作家有所減損,也使得書店店長、圖書館員和讀者失去了許多親密感」。

Min Jin Lee,著有小說《Pachinko》和《百萬富翁的免費食品》的作者,也對她的書被AI使用感到失望,並稱這是一種「偷竊」。

她說:「我花了三十年的時間來寫我的書。而AI公司沒有『吸收』或『爬取數據』。AI公司偷了我的工作、時間和創造力。他們偷走了我的故事。他們偷走了我的一部分」。



彭博社的一位發言人告訴CNN,「該公司使用了多種不同的數據來源」。包括Books3,來訓練其初版的BloombergGPT模型,這是一個針對金融行業的人工智慧模型。但根據發言人的說法,彭博社將『不會將Books3數據集包括在用於訓練未來商業版本的BloombergGPT的數據來源中』」。

然而,作者詹姆斯·查普爾並不在意他的書被用在數據庫中。他寫道:「我希望我的書被閱讀!」「我希望它能教育人們!」

新聞原址: https://www.ndtv.com/world-news/tech-companies-using-183-000-books-to-train-ai-the-problem-is-4464034?ref=futurepedia