A Reddit szerint mesterséges intelligencia-fejlesztő cégek a Wayback Machine archívumából is szisztematikusan gyűjtötték a Reddit-adatokat, megszegve a platform szabályait. Ezért a vállalat most drasztikus korlátozásokat vezet be: az Internet Archive ezentúl nem indexelhet bejegyzéseket, kommenteket és felhasználói profilokat, csak a reddit.com nyitóoldalát – vagyis legfeljebb a napi topposztok listája lesz visszanézhető.
Tim Rathschmidt, a Reddit szóvivője hangsúlyozta: amíg az Internet Archive nem tudja megvédeni saját rendszerét a visszaélésektől és nem teljesíti a platform adatvédelmi elvárásait (például törölt tartalmak eltávolítása), addig nem férhet hozzá a legtöbb Reddit-tartalomhoz.
Fizetni kell az adatért
Ez nem az első ilyen lépés:
- 2024-ben a Reddit megállapodott a Google-lel, hogy pénzért ad hozzáférést keresési és AI-tréningadatokhoz.
- Ugyanebben az évben a nagy keresőmotorok csak fizetés ellenében indexelhetik a tartalmait.
- 2023-ban az API-szabályok szigorítása miatt több népszerű harmadik féltől származó alkalmazás bezárt – a Reddit szerint ezek adatait is AI-modellek betanítására használták.
- Idén OpenAI-val is szerződtek, de beperelték az Anthropicot, mert állításuk szerint titokban továbbra is adatokat gyűjtöttek tőlük.
Az Internet Archive reakciója
Mark Graham, a Wayback Machine igazgatója szerint hosszú távú kapcsolatuk van a Reddit-tel, és folyamatos egyeztetés zajlik a kérdésről.













