Om generatieve AI-systemen te trainen maken de techpartijen achter onder meer ChatGPT, Bing Chat en Google Bard gebruik van zeer omvangrijke datasets. Uit recent onderzoek van weekblad De Groene Amsterdammer blijkt dat de categorie ‘Nieuws en media’ één van de belangrijkste bronnen is voor de trainingsdata van ChatGPT.
Nieuwsmedia zien dat hun journalistieke artikelen zonder enig overleg op grote schaal worden gescraped. De Partij voor de Dieren stelde daarover Kamervragen aan het kabinet.
Bewindspersonen verschillen van opvatting
De demissionaire minister Weerwind (Rechtsbescherming) en staatssecretaris Van Huffelen (Koninkrijksrelaties en Digitalisering) antwoorden nu dat een uitzonderingsgrond in de Auteurswet mogelijk zo kan worden geïnterpreteerd dat het toegestaan is om zonder toestemming massaal te scrapen. Dat is opmerkelijk, want in januari liet het kabinet bij monde van minister Adriaansens (Economische Zaken) nog weten dat deze praktijk in strijd is met de Auteurswet.
Uitzondering voor text- & datamining (TDM)
De minister en staatssecretaris verwijzen in hun beantwoording naar de uitzondering voor commerciële text- & datamining in de Auteurswet. Deze voorziening vindt haar oorsprong in de Europese DSM-richtlijn en is primair bedoeld om wetenschappers en erfgoedinstellingen de mogelijkheid te geven om grote hoeveelheden teksten geautomatiseerd te doorzoeken zonder winstoogmerk.
In de Europese richtlijn en de omzetting daarvan door Nederland is duidelijk gemaakt dat commerciële partijen niet onbeperkt data mogen vergaren: dat mag alleen als de artikelen openbaar beschikbaar zijn en er geen voorbehoud is gemaakt door de rechthebbenden. De uitzondering moet beperkt worden uitgelegd en mag niet ten koste gaan van de exploitatie van de rechthebbenden.
Uitzondering geen rechtvaardiging voor scrapen big tech
Dat de demissionaire minister en staatssecretaris nu lijken te suggereren dat de wet ruimte biedt aan grote techpartijen om onbeperkt beroep te doen op deze uitzondering die in de eerste plaats is gecreëerd voor wetenschappers en erfgoedinstellingen, is wat NDP Nieuwsmedia betreft uiterst onwenselijk.
Herman Wolswinkel, directeur van NDP Nieuwsmedia: ‘De wetgever heeft de uitzondering voor text- & datamining in de wet opgenomen als impuls voor de publieke zaak. In de antwoorden op de Kamervragen lijkt een goed bedoelde uitzondering nu een steun in de rug te worden voor de grote techbedrijven om hun marktmacht te vergroten. Dat kan niet de bedoeling zijn.’
Nieuwsuitgevers maken altijd rechtenvoorbehoud
Nieuwsuitgevers behouden zich altijd de rechten op hun online content voor met een vermelding op de website. Commercieel gebruik van hun artikelen en foto’s mag dus niet zonder toestemming. Helaas wordt ook zonder toestemming op buitengewoon omvangrijke schaal journalistieke content gescraped, zo toonden de onderzoeksjournalisten van De Groene aan. Ook journalistieke artikelen die achter een betaalmuur geplaatst zijn en dus niet vrij beschikbaar zijn, worden gescraped.
Meer duidelijkheid wenselijk in kabinetsvisie AI
Het kabinet werkt momenteel aan een visie op AI. NDP Nieuwsmedia roept het kabinet op daarin duidelijk stelling te nemen tegen het scrapen van journalistieke artikelen door grote techpartijen en in te zetten op een (Europese) transparantieverplichting voor techbedrijven over de data waarmee zij hun AI-modellen trainen.
Wolswinkel: ‘Het is niet meer dan logisch en redelijk dat nieuwsbedrijven inzicht krijgen in de aard en omvang waarop hun journalistieke artikelen door AI-modellen worden gebruikt. Het draagt eraan bij dat generatieve AI op een verantwoorde manier kan groeien.’