Talkdesk en veel andere [Customer Care]aaS-leveranciers gebruiken de inhoud van de gesprekken van de klanten van hun eigengebruikers om hun AI-modellen te trainen. Dat las ik bij Ziptone onlangs. Aanleiding was een rechtszaak aangespannen door een Californische consument die daar niet op zat te wachten. Het riep de vraag op: hoe zou je dat legaal kunnen inrichten in Nederland?
Iedereen denkt wellicht aan de AI Act, maar die zegt niet zo gek veel over hoe je aan databestanden komt om een AI mee te trainen. Ja, als je toepassing hoogrisico is dan moet die data “relevant, voldoende representatief, en zoveel mogelijk foutenvrij en volledig met het oog op het beoogde doel” zijn (artikel 10 lid 3 AIA). Maar eisen zoals “met toestemming verkregen” zul je niet terugvinden in deze wet.
Wél daarover gaat natuurlijk de AVG: het opnemen van een zakelijk telefoongesprek, of het loggen van een zakelijke chat, is een verwerking van persoonsgegevens. Dat gebeurt met een doel – het bewijzen van de geleverde dienst of eventuele geschillen (uitvoering overeenkomst), of het meer algemeen verbeteren van de dienstverlening (“service- en trainingsdoeleinden“). Het kan ook met toestemming, maar buiten salesgesprekken zie je dat eigenlijk nooit.
Het AVG-technisch probleem is met name dat doel, in vaktermen de doelbinding. De gegevens worden verkregen voor het ene doel (die servicedoeleinden, bewijsvoering, etc) en nu ingezet voor iets anders, namelijk het samenstellen van een dataset waarmee een AI getraind gaat worden. Je kunt dat op twee manieren doen:
- Binnen de AVG, waarbij je te maken krijgt met beperkingen zoals doelbinding en grondslagen.
- Buiten de AVG, waarbij die beperkingen niet gelden maar je wel écht anonieme data moet hebben.
Het is vrij moeilijk om data echt te anonimiseren, ook bij spraak: in zo’n gesprek kan een klantnaam of -nummer worden genoemd, of een uitspraak worden gedaan over betaling, adressen en ga zo maar door.
De enige escape is dan wellicht nog de bepaling uit de AVG dat verdere verwerking voor statistische doeleinden (art. 5 lid 1b AVG) geen probleem met doelbinding is. Het is alleen onduidelijk of deze bepaling ingeroepen kan worden als het “statistische doeleind” eigenlijk een commercieel inzetbaar AI datamodel is.
Arnoud
https://blog.iusmentis.com/2024/08/15/dit-gesprek-kan-worden-opgenomen-voor-ai-trainingsdoeleinden/