Blog

Google給網站擁有者「選擇權」:道德問題引發爭議,Medium全面封鎖網路爬蟲

Blog Image
Google給網站擁有者「選擇權」:道德問題引發爭議,Medium全面封鎖網路爬蟲

September 30, 2023

重點摘要:
  1. Google現在允許網站擁有者透過在「robots.txt」文件中添加特定指令,來選擇不讓其AI模型Bard使用網站內容作為訓練數據。
  2. 儘管Google強調這是一種「道德和包容的」做法,該公司的行為被批評為在事後才尋求許可,並缺乏真實性。
  3. Medium宣布將全面封鎖這類網路爬蟲,顯示對Google這種數據收集方式的不滿正在擴大。

新聞內文:
您的網站現在可以選擇不讓Google的Bard和未來的人工智慧模型使用它作為訓練材料了。

這很簡單,只需在您的網站的「robots.txt」文件中添加不允許「User-Agent: Google-Extended」的指令,這個文件會告訴自動網路爬蟲哪些內容可以使用。

儘管Google聲稱「以道德和包容的方式開發其人工智慧」,但人工智慧訓練的用例與網路搜索的方式有明顯不同。

該公司的副總裁Danielle Romain在部落格文章中寫道:「我們也聽到網路出版商希望對新興的生成式人工智慧用例如何使用其內容擁有更多選擇和控制權」,這仿佛這是一個驚喜。

有趣的是,該文章中並未出現「訓練」這個詞,儘管很明顯,這些數據是用來訓練機器學習模型的原材料。

相反地,副總裁問您是否真的不想「幫助改進Bard和Vertex AI生成API」,「幫助這些人工智慧模型隨著時間變得更加準確和強大」。

看,這不是關於Google拿走了您的東西。這是關於您是否願意幫助。


一方面,這可能是提出這個問題的最佳方式,因為同意是這個方程式的重要部分,積極選擇參與正是Google應該要求的。另一方面,Bard和其它模型已經根據來自使用者的大量數據進行了訓練,而這些使用者並未經過他們的同意,這種表述缺乏真實性。

Google的行動不可避免地顯示,它利用對網路數據的無限制使用,獲得了所需的內容,現在在事後請求許可,以看起來像同意和道德數據收集對他們來說是一個優先考慮的事情。如果是這樣,多年前我們就應該有這個設置了。

巧合的是,Medium今天宣布,除非有更好、更細化的解決方案,否則將全面封鎖這類網路爬蟲。而且他們絕不是唯一一家這樣做的。

新聞內文: https://techcrunch.com/2023/09/28/your-website-can-now-opt-out-of-training-googles-bard-and-future-ais/