AI 偏好控制：IETF 正在完善 robots.txt 以應對無視版權的 AI 爬蟲_港資訊

AI 偏好控制：IETF 正在完善 robots.txt 以應對無視版權的 AI 爬蟲

至頂頭條

更新于：2025-04-11 09:27:24

互聯網工程任務組 (IETF) 已成立一個工作組，旨在制定一個標準，讓內容創作者能夠告知 AI 開發者是否允許使用他們的作品。

這個名為 AI 偏好工作組 (AIPREF) 的組織被要求開發兩個方面的內容：

首先是制定一個通用詞彙表，用於表達作者和發行者對其內容用於 AI 訓練及相關任務的偏好；

其次是開發將這些詞彙表附加到互聯網內容的方法，可以通過將其嵌入內容中，或者採用類似 robots.txt 的格式，並建立一個標準機制來協調多個偏好表達。

AIPREF 章程建議通過"在內容元數據中包含偏好，或通過傳遞內容的協議發送偏好信號"來實現這些目標。

AIPREF 聯合主席 Mark Nottingham 認為之所以需要這些措施，是因為當前的系統並不能很好地發揮作用。

他認為 robots.txt 檔中的"非標準信號"（這是一個 IETF 標準，用於定義爬蟲是否允許訪問網路內容的語法）已經失效。

"結果就是，作者和發行者對他們的偏好是否會被遵守失去了信心，只能採取諸如遮罩 [AI 供應商] IP 位址的措施。"

內容創作者之所以採取 IP 遮罩措施，是因為主要的模型開發商在抓取互聯網內容用於訓練 AI 時，並沒有徵求許可或尋求授權。

OpenAI 目前正在遊說推動版權改革，希望能夠在不付費的情況下抓取更多內容。

版權持有者正在通過起訴那些使用版權材料構建模型的機構進行反擊，同時也在簽署許可協定，讓 AI 公司付費訪問內容。

AI 爬蟲還給發行者帶來了經濟負擔。維琪媒體基金會最近抱怨說，用於處理圖像檢索請求的頻寬在過去一年增加了 50%，主要是因為 AI 爬蟲下載資料。

IETF 並不關心這些法律和運營問題：它只想構建技術，讓人們能夠表達他們的偏好，希望爬蟲運營者能夠接受並只獲取創作者願意提供給 AI 使用的內容。

為了推進這項工作，AIPREF 在三月中旬的 IETF 122 會議上召開了會議，並已經制定了兩個草案。一個提出了"用於自動處理的簡短使用偏好字串"，建議這些字串可以用在 robots.txt 檔或 HTTP 頭欄位中。

另一個來自 Common Crawl Foundation 的提案題為"用於 AI 訓練的內容偏好表達詞彙"，同樣建議將偏好語法存儲在 robots.txt 檔或 HTTP 頭欄位中，還建議在元標籤中使用proposed vocabulary。

AIPREF 本周正在召開會議，儘管一個計劃中的會議似乎已被取消。

該工作組給自己設定了 2025 年 8 月的截止日期來提交提案。參與者似乎都知道這是一個緊迫的期限，因此該組織需要加快行動。

AI 視頻生成創企 Runway 以 30 億美元估值融資 3.08 億美元

AI 視頻生成創企 Runway 以 30 億美元估值融資 3.08 億美元

2025-04-06 01:01:14

Amazon Nova Act 重磅發佈：挑戰 OpenAI、Microsoft 和 Salesforce 的全新 AI 代理 SDK

Amazon Nova Act 重磅發佈：挑戰 OpenAI、Microsoft 和 Salesforce 的全新 AI 代理 SDK

2025-04-06 01:01:46

DeepMind 詳解 AGI 可能給世界帶來的威脅

DeepMind 詳解 AGI 可能給世界帶來的威脅

2025-04-06 01:01:56

Razer 想成為你的 Copilot，新開發工具可能為遊戲帶來更多 AI

Razer 想成為你的 Copilot，新開發工具可能為遊戲帶來更多 AI

2025-04-06 08:43:35

Midjourney 推出一年多以來首個新圖像生成模型

Midjourney 推出一年多以來首個新圖像生成模型

2025-04-07 10:49:53

ChatGPT 圖像生成功能現已向所有使用者免費開放

ChatGPT 圖像生成功能現已向所有使用者免費開放

2025-04-07 18:49:35

紮克伯格：Meta最新Llama模型將開源AI推向領導地位

紮克伯格：Meta最新Llama模型將開源AI推向領導地位

2025-04-08 16:54:01

Gemini Live 不僅僅是會對話的 AI，它現在有了"眼睛"。我親自體驗了一下

Gemini Live 不僅僅是會對話的 AI，它現在有了"眼睛"。我親自體驗了一下

2025-04-10 07:59:03

Deep Cogito 推出混合型 AI "推理"模型

Deep Cogito 推出混合型 AI "推理"模型

2025-04-10 09:31:55

Mozilla 向 Firefox 擴展開發者伸出援手

Mozilla 向 Firefox 擴展開發者伸出援手

2025-04-11 00:51:28

Copilot Vision 更新：Microsoft 讓 AI 助手能"看見"你的螢幕和應用程式

Copilot Vision 更新：Microsoft 讓 AI 助手能"看見"你的螢幕和應用程式

2025-04-11 01:19:15

AI 時代的領導力變革：2035 年的 5 個關鍵啟示

AI 時代的領導力變革：2035 年的 5 個關鍵啟示

2025-04-11 01:22:40

Google 推出企業級 AI 智慧體開發套件，助力快速原型開發和部署

Google 推出企業級 AI 智慧體開發套件，助力快速原型開發和部署

2025-04-11 01:22:54

Google Workspace 升級，新增自動化流程和播客式內容摘要功能

Google Workspace 升級，新增自動化流程和播客式內容摘要功能

2025-04-11 02:04:26

波音 787 無線電軟體安全修復未奏效，卡達航空表示

波音 787 無線電軟體安全修復未奏效，卡達航空表示

2025-04-11 06:05:32

FreeDOS 1.4：依然是 DOS，依然開源，更加現代化

FreeDOS 1.4：依然是 DOS，依然開源，更加現代化

2025-04-11 06:05:43

企業級"氛圍程式設計"：AI 工具現可應對完整開發生命週期

企業級"氛圍程式設計"：AI 工具現可應對完整開發生命週期

2025-04-11 08:39:34

AI 偏好控制：IETF 正在完善 robots.txt 以應對無視版權的 AI 爬蟲

AI 偏好控制：IETF 正在完善 robots.txt 以應對無視版權的 AI 爬蟲

2025-04-11 09:27:24

ChatGPT 獲得記憶增強升級，讓對話體驗更進一步

ChatGPT 獲得記憶增強升級，讓對話體驗更進一步

2025-04-11 11:29:33

Windows 11 高效使用者的七個使用習慣

Windows 11 高效使用者的七個使用習慣

2025-04-11 17:58:05

Amazon CEO Andy Jassy 強調需投入數十億美元建設 AI 基礎設施

Amazon CEO Andy Jassy 強調需投入數十億美元建設 AI 基礎設施

2025-04-13 20:43:29

量子計算與經典計算：瞭解未來技術的平衡

量子計算與經典計算：瞭解未來技術的平衡

2025-04-14 04:46:45

量子硬體可能是 AI 的最佳搭檔

量子硬體可能是 AI 的最佳搭檔

2025-04-14 08:59:46

DeepCoder：高效的 14B 開源模型展現頂級程式設計性能

DeepCoder：高效的 14B 開源模型展現頂級程式設計性能

2025-04-14 11:08:19