近日,社交媒體平臺Reddit對人工智能公司Anthropic提起了法律訴訟,指控其未經授權,系統性地抓取Reddit上的帖子以訓練Claude語言模型。這一行為據稱違反了Reddit的用戶協議和商業使用條款,引起了業界廣泛關注。
此次訴訟不僅揭示了AI訓練數據獲取過程中存在的法律爭議,也進一步加劇了內容平臺與AI公司之間的緊張關系。Reddit在訴訟中要求法院強制Anthropic刪除所有包含Reddit內容的AI模型和數據集,并永久禁止其將基于Reddit數據訓練的AI模型用于任何商業目的。
據訴訟文件顯示,Anthropic在抓取Reddit數據時,無視了平臺的技術保障措施,包括robots.txt文件和基于IP的速率限制等。更令Reddit不滿的是,Anthropic并未使用Reddit提供的合規API,這一工具能夠在用戶刪除帖子時通知被許可方,從而確保相關內容從訓練系統中及時移除。
訴訟中還提到了一個令人震驚的事實:Anthropic的發言人在公開場合聲稱已將Reddit列入ClaudeBot的黑名單,但Reddit的內部日志卻顯示,在該聲明發布后的幾個月內,Anthropic的機器人對Reddit服務器的訪問次數仍然高達數十萬次。這一發現直接質疑了Anthropic的誠信,并成為了Reddit訴訟的重要證據。
Reddit在訴訟中強調,Anthropic的行為不僅損害了公司的商業利益,更對用戶的隱私構成了嚴重威脅。由于Anthropic未經授權地抓取數據,Reddit無法確認已刪除或敏感帖子是否仍被嵌入在Claude模型中。這意味著Reddit用戶可能無法享受到公共內容政策和隱私政策的保護,因為他們無法得知哪些第三方已經抓取并獲取了他們的數據。
與此同時,Reddit還特別指出了其他AI公司在數據獲取方面的合規做法。例如,谷歌每年向Reddit支付高達6000萬美元的費用,以獲得訓練數據的授權。這一合作不僅提升了Reddit在谷歌搜索中的曝光度,也展示了AI公司在數據獲取方面的合法路徑。
Reddit的訴訟要求Anthropic賠償因違約和不正當競爭而造成的許可收入損失,并尋求法院發布禁令,以阻止Anthropic繼續將Claude或任何基于Reddit數據訓練的AI模型用于商業用途。如果Reddit勝訴,這一案件可能會為其他內容平臺對AI公司的類似訴訟樹立先例,從而重新定義AI訓練數據的合法獲取邊界。
當前,這一爭議反映了AI快速發展與傳統版權和隱私保護機制之間的根本性沖突。Reddit訴Anthropic案或將成為解決這一問題的關鍵判例,對AI行業的數據使用實踐和成本結構產生深遠影響。
本文鏈接:http://www.www897cc.com/showinfo-45-13439-0.htmlReddit維權:起訴Anthropic非法抓取數據,要求銷毀含Reddit內容的AI模型
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com