Blog

Medium領頭封鎖OpenAI「GPTBot」:媒體龍頭將聯手對抗AI內容的剝削

Blog Image
Medium領頭封鎖OpenAI「GPTBot」:媒體龍頭將聯手對抗AI內容的剝削

September 30, 2023

重點摘要:
  1. Medium宣布將封鎖OpenAI的「GPTBot」,並加入了CNN、紐約時報等多家媒體機構,以阻止其擷取網頁內容用於AI模型訓練。
  2. Medium的CEO Tony Stubblebine明確表示,目前的生成式AI對網路生態並非全然有益,並批評AI公司未經同意或提供報酬就利用作家的內容。
  3. Stubblebine透露,Medium正在積極招募其他平台的聯盟,以尋找AI時代內容公平使用的解決方案。

新聞內文:
網路發布平台「Medium」宣布將封鎖OpenAI的「GPTBot」,該機器代理會擷取網頁內容,用於訓練該公司的AI模型。但真正的新聞是一組平台可能會結成統一陣線,反對許多人認為是對他們內容的剝削。

Medium加入了CNN、紐約時報和眾多其他媒體機構(雖然還不包括TechCrunch)將「User-Agent: GPTBot」添加到其robots.txt中的不允許代理列表中。這是在許多網站上找到的文件,告訴網路爬蟲和搜尋引擎,不斷掃描網路的自動系統,該站是否同意被掃描。如果出於某種原因您希望不在Google上被搜尋,您可以在robots.txt中說明。

當然,AI製造商不僅僅是搜尋:他們會擷取數據,以用作其模型的源材料。很少有人對此感到滿意,特別是Medium的CEO Tony Stubblebine,他寫道:「我不是討厭AI的人,但我也想明確地說,目前的生成式AI狀態對網路生態並不是一個淨利潤。」

他們正在利用您的文章賺錢,卻未經您的同意,也未提供報酬和擔保。AI公司已經透過剝削作家的價值來向網路讀者發送垃圾郵件。

因此,他寫道,當OpenAI的爬蟲來訪時,Medium將默認告訴它「滾蛋」。(Medium是少數尊重該要求的網站之一)。

然而,他迅速承認,這種基本上是自願的方法不太可能對該要求簡單忽略的垃圾郵件發送者等行為產生影響。儘管還有可能採取主動措施(例如,透過將爬蟲指向虛假內容來毒化其數據),但那將導致升級和費用,可能會引發訴訟。

然而,仍然有希望。Stubblebine寫道:「Medium不是唯一。我們正在積極招募其他平台的聯盟,以幫助在AI時代的公平使用未來找到解決方案」。


其他人面臨相同的問題,就像科技中的許多事情一樣,更多的人在標準或平台上保持一致,會產生網路效應,並改善每個人的結果。一個由大型組織組成的聯盟將成為不道德AI平台的強大對抗力量。

是什麼阻礙了它們?不幸的是,眾多行業合作夥伴關係一般來說發展緩慢,原因多如您所想。從出版和版權的標準來看,AI絕對是全新的,有無數的法律和倫理問題,沒有明確的答案,更不用說被廣泛接受的答案了。

當IP和版權的定義處於變動中時,您如何同意IP保護合作夥伴的關係?當您的董事會正努力找到使用它以使公司受益的方法時,您如何將話題移轉到「禁止使用AI」?

也許需要像維基百科這樣大型的網路大猩猩採取大膽的第一步,「打破僵局」。其他組織可能會受到業務擔憂的制約,但也有一些組織沒有這些問題,可以在不擔憂會讓股東失望的情況下安全前進。但在有人站出來之前,我們將繼續受到爬蟲的摧殘,他們會尊重或忽視我們的同意。

新聞原址: https://techcrunch.com/2023/09/28/medium-hints-at-a-nascent-media-coalition-to-block-ai-crawlers/