Entertainment
Illegale dataset voor trainen van AI offline gehaald door Brein
BREIN meldt dat het gaat om een omvangrijke dataset die tienduizenden boeken, miljoenen regels uit nieuwsartikelen en een groot aantal ondertitels voor films en tv-series bevat. “BREIN treedt op tegen inbreukmakend en tegen onrechtmatig gebruik van artificial intelligence. We hebben in de dataset onder meer gezocht naar de letterlijke tekst: ‘Niets uit deze uitgave mag worden verveelvoudigd’ en dit leverde meer dan 10.000 resultaten op. Stuk voor stuk betrof dit illegaal gekopieerde boeken. Ook de nieuwsartikelen zijn gekopieerd van websites met auteursrechtvoorbehoud. Dit toont duidelijk aan dat de auteursrechten niet zijn gerespecteerd, een heterdaadje noemen we dat ook wel” aldus directeur Bastiaan van Ramshorst van Stichting BREIN.
De dataset is inmiddels offline. De maker van de dataset wordt niet genoemd. Wel meldt BREIN dat de maker een verklaring heeft ondertekend waarin hij belooft geen inbreuk meer te maken. Ook heeft Stiching BREIN informatie over wie de dataset heeft ontvangen. Het onderzoekt welke AI-modellen de dataset hebben gebruikt en gaat de betrokken partijen hierop aanspreken.