Reddit計劃封殺谷歌/必應等搜索引擎 防止這些搜索引擎拿數據訓練AI – 藍點網
據華盛頓郵報發布的計劃消息,為了防止自己平臺的封殺內容被其他公司白嫖,知名網絡社區 Reddit 計劃在后續封殺谷歌和必應等搜索引擎的谷歌爬蟲,同時為了防止 OPENAI 等獲取 Reddit 論壇的等搜內容,Reddit 還計劃要求用戶必須登錄賬號才可以瀏覽內容。索引索引數據
最近一年因為 AI 問題 Reddit 似乎有些魔怔了,擎防擎拿例如之前 Reddit 要求 AI 公司必須與該公司簽訂協議支付費用才能獲取數據進行訓練。止搜

那么怎么防止這些 AI 公司未經授權抓爬數據呢?訓練Reddit 直接調整了 API 接口,結果這也導致大量第三方 Reddit 客戶端涼涼,藍點這引起了巨大爭議,計劃但 Reddit 最終也沒有松口。封殺
現在封殺搜索引擎對 Reddit 來說其實是谷歌個大事件,因為 Reddit 很多流量是等搜靠著搜索引擎導流而來的,如果封殺谷歌和必應等搜索引擎,索引索引數據未來 Reddit 上的擎防擎拿新內容將無法在網上搜到,那這肯定會導致流量下跌。
針對華盛頓郵報的報道 Reddit 澄清表示沒有任何變動,同時向華盛頓郵報發郵件要求他們進行更正。
隨后華盛頓郵報也確實添加了更正信息,不過新增信息只變更了要求用戶登錄才能閱讀帖子的部分,但 Reddit 并未否認可能會封殺谷歌和必應等搜索引擎的傳聞。
也有匿名人士告訴華盛頓郵報稱,Reddit 高管認為即便封殺搜索引擎,Reddit 也可以繼續撐下來。言外之意就是流量肯定會下跌,但 Reddit 也決意這么做。
對 Reddit 來說,可能現在靠著 AI 大潮賣數據才是最好的買賣,所以現在不惜毀掉第三方客戶端和封殺搜索引擎,冒著流量大跌的風險也要牢牢守住自己的數據。
PS:我覺得 Reddit 可能已經在某些帖子里埋上特定的標識符,后續等各種 AI 產品更新后可以通過測試標識符來判斷這些模型是否使用了 Reddit 的數據,如果被判定使用了數據但不是簽訂 API 合同的客戶,那 Reddit 就可以起訴了。(類似做法在國內已經比較流行,主要就是防止競爭對手抓爬數據的。)
(責任編輯:知識)














