Blog

Meta被指控冒著法律風險使用盜版書籍訓練AI模型

Blog Image
Meta被指控冒著法律風險使用盜版書籍訓練AI模型

December 13, 2023

重點摘要:
  1. Meta Platforms(META.O)被指控在律師警告其存在法律風險的情況下,仍使用數千本未經授權的盜版書籍訓練其人工智慧語言模型「Llama」。
  2. 訴訟最初由知名作者如Sarah Silverman和普利策獎得主Michael Chabon提起,指控Meta未經許可使用他們的作品。
  3. 根據新提交的訴訟文件,Meta的研究員在與法律部門討論時明確知道使用這些書籍作為訓練數據可能違反美國著作權法。



新聞內文:
據最新訴訟文件透露,雖然Meta Platforms(META.O)的律師曾警告該公司使用數千本盜版書籍訓練其人工智慧模型的法律風險,但該公司仍然這樣做了。這起著作權侵權訴訟最初於今年夏天提起。

週一晚上提交的新文件整合了對Facebook和Instagram母公司提起的兩起訴訟,由喜劇演員Sarah Silverman、普利策獎得主Michael Chabon和其他知名作者提起。他們指控Meta未經許可使用他們的作品訓練其人工智慧語言模型「Llama」。

上個月,加州一名法官駁回了Silverman訴訟的部分內容,並表示他將允許作者修改他們的訴求。

Meta尚未對指控發表評論的請求作出回應。

週一提交的新訴訟文件包括Meta附屬研究員在Discord伺服器上討論獲取數據集的聊天記錄,這可能是一個重要的證據,表明Meta意識到其使用書籍可能不受美國著作權法保護。

訴訟文件引述的聊天記錄顯示,研究員Tim Dettmers與Meta的法律部門就使用書籍檔案作為訓練數據是否「合法」進行了來回討論。

Dettmers在2021年寫道:「在Facebook,有很多人有興趣使用(T)he(P)ile,包括我自己,但以目前的形式,我們因法律原因無法使用它」。根據訴訟文件,他指的是Meta已承認用於訓練Llama第一版的數據庫。

新聞原址: https://www.reuters.com/technology/meta-used-copyrighted-books-ai-training-despite-its-own-lawyers-warnings-authors-2023-12-12/