Toezichthouder: AI-platforms moeten transparant zijn over trainingsdata

De Autoriteit Persoonsgegevens (AP) benadrukt in de Tweede Kamer dat AI-aanbieders transparant moeten zijn over de herkomst van trainingsdata, waaronder nieuwsartikelen.

Tijdens een rondetafelgesprek op 10 oktober jl. gingen de leden van de vaste commissie Digitale Zaken van de Tweede Kamer in gesprek met verschillende toezichthouders op het terrein van artificiële intelligentie.

Risico’s voor uitgevers

Jesse Six Dijkstra (NSC) en Barbara Kathmann (GroenLinks-PvdA) vroegen de toezichthouders hoe zij de transparantieverplichting op trainingsdata, zoals vastgelegd in de AI Act, gaan handhaven. NSC wees daarbij op de risico’s voor uitgevers die door big tech massaal worden gescrapet.

Aleid Wolfsen, voorzitter van de Autoriteit Persoonsgegevens (AP) die coördinerend toezicht houdt op AI: “Alles begint met transparantie. Dan kun je zien waar het vandaan komt, kun je zien of er intellectueel eigendom mee wordt geschonden ja of nee. Wij vinden het samen onze taak dat een van de toezichthouders dat oppakt.”

NDP Nieuwsmedia is blij dat zowel de Tweede Kamer als de AP oog hebben voor de positie van nieuwsuitgevers.

‘Scraping rechtmatig, ja of nee?’

Barbara Kathmann van Groenlinks-PvdA wilde daarop weten hoe dit toezicht er in de praktijk uit zou zien, “want als data eenmaal in een AI-systeem zitten, knip je ze er niet zomaar uit”.

Wolfsen gaf aan dat dat nog extra werk vereist: “We zijn op Europees niveau met de toezichthouders bezig met scraping. Is dat rechtmatig ja of nee, wanneer zou het wel of niet kunnen? Als je zo’n systeem ontwikkelt, moet je ook daar transparant zijn over hoe het is getraind. Anders kun je zo’n systeem ook niet goed beoordelen, want het kan getraind zijn met data die leiden tot allerlei discriminatoire uitkomsten en dat moet niet kunnen.”

AI en de overheid

Zeker waar het gaat om de inzet van AI door de overheid spoort AP-voorzitter Wolfsen de Tweede Kamer aan volledige transparantie te eisen van AI-aanbieders: “U moet dat goed kunnen controleren. U moet kraakhelder uitgelegd krijgen hoe het getraind is, waar het vandaan komt. En als daar niet aan voldaan kan worden, dan voldoe je dus niet aan openbaarheidsverplichting, aan je verantwoordingsplicht. Dan is het in zichzelf al onrechtmatig.”

Transparantie en goede voorwaarden essentieel voor uitgevers

Met de totstandkoming van journalistieke artikelen is alleen al in Nederland jaarlijks honderden miljoenen euro’s gemoeid. Voor het gebruik van deze artikelen door AI-systemen is echter nog geen enkele vorm van toestemming verkregen, laat staan een vergoeding betaald.

Herman Wolswinkel, directeur van NDP Nieuwsmedia: “De praktijk van massale scraping moet stoppen en voor de al gebruikte content is een oplossing vereist. Dat begint met inzicht in wie de Nederlandse nieuwsartikelen hebben gebruikt, zodat fatsoenlijke voorwaarden en een redelijke vergoeding kunnen worden afgesproken. We verwelkomen daarom de opstelling van de AP, die geen misverstand laat bestaan over de noodzaak van transparantie.”