Naarmate generatieve AI zich snel ontwikkelt, komen spanningen tussen technologische vooruitgang en regelgeving op het gebied van gegevensprivacy, zoals de Europese GDPR, op de voorgrond te staan.
Onlangs verbood de Italiaanse toezichthouder voor gegevens OpenAI’s ChatGPT, op beschuldiging van onwettig gebruik van persoonlijke gegevens door het bedrijf. Deze ontwikkeling roept vragen op over de toekomst van AI-technologie en het vermogen van de industrie om zich aan te passen met inachtneming van de privacywetgeving.
In dit artikel gaan we in op de uitdagingen waarmee grote taalmodellen zoals ChatGPT worden geconfronteerd en de mogelijke gevolgen voor de evolutie van AI.
De bouwstenen van intelligente AI-taalmodellen
Large Language Models (LLM’s) zoals ChatGPT zijn afhankelijk van uitgebreide datasets om te leren en mensachtige tekst te produceren.
OpenAI’s GPT-3 gebruikte bijvoorbeeld miljoenen webpagina’s, Reddit-posts, boeken en andere bronnen om taal en context te begrijpen. Deze overvloed aan gegevens stelt AI-modellen in staat om nauwkeurige en samenhangende reacties te genereren op een breed scala aan gebruikersinputs.
Om effectieve taalmodellen te maken, hebben ontwikkelaars toegang nodig tot een breed scala aan content.
Door grote hoeveelheden tekst te bestuderen, kunnen AI-systemen patronen onderscheiden, zinsbouw en grammatica leren en contextuele informatie leren begrijpen. Bovendien is blootstelling aan verschillende schrijfstijlen en onderwerpen essentieel voor het produceren van contextueel passende en samenhangende reacties.
De enorme hoeveelheid gegevens die nodig is om deze modellen te trainen, leidt er echter vaak toe dat persoonlijke informatie in deze datasets wordt opgenomen.
In de technische documenten van OpenAI wordt erkend dat openbaar toegankelijke persoonlijke gegevens kunnen worden opgenomen in AI-trainingsdatasets.
Dit roept zorgen op over privacy en de rechtmatigheid van het gebruik van dergelijke informatie zonder de expliciete toestemming van individuen.
Koorddansen: een evenwicht vinden tussen AI-ontwikkeling en privacyrechten
Het opnemen van persoonlijke gegevens in AI-trainingsdatasets vormt de kern van de juridische uitdagingen waarmee bedrijven als OpenAI worden geconfronteerd.
De Italiaanse toezichthouder voor gegevensbescherming (Garante per la Protezione dei Dati Personali) heeft OpenAI onlangs bevolen om te stoppen met het gebruik van persoonlijke gegevens van miljoenen Italianen, omdat het bedrijf niet de wettelijke bevoegdheid heeft om dit te doen.
De bezorgdheid heeft zich al verspreid naar toezichthouders in Frankrijk, Duitsland en het Verenigd Koninkrijk.
De Europese GDPR-regels reguleren het verzamelen, opslaan en gebruiken van persoonlijke gegevens en hebben invloed op meer dan 400 miljoen Europeanen.
GDPR is van toepassing op alle informatie waarmee een individu kan worden ge?dentificeerd en zelfs openbaar beschikbare gegevens mogen niet worden geschrapt en gebruikt zonder de juiste toestemming of wettelijke rechtvaardiging.
Naast privacyproblemen kan het opnemen van persoonlijke gegevens in AI-trainingssets andere onbedoelde gevolgen hebben. AI-modellen kunnen onbedoeld gevoelige informatie vrijgeven, vooroordelen en stereotypen in stand houden of misleidende inhoud genereren.
Deze mogelijke gevolgen maken de ethische en juridische uitdagingen voor AI-ontwikkelaars alleen maar groter.
Juridische uitdagingen: Wanneer ChatGPT en GDPR botsen
De Italiaanse Garante heeft vier belangrijke problemen vastgesteld met betrekking tot de GDPR-compliance van OpenAI:
- Gebrek aan leeftijdscontroles voor gebruikers jonger dan 13 jaar
- Potentieel voor AI-gegenereerde onjuiste informatie over mensen
- Geen meldingen aan personen over hun gegevensgebruik
- Ontbreken van een wettelijke basis voor het verzamelen van persoonlijke informatie voor taalmodeltraining
Nu toezichthouders voor gegevensbescherming in Frankrijk, Duitsland en Ierland de situatie nauwlettend in de gaten houden, zouden soortgelijke uitspraken in heel Europa kunnen worden gedaan, wat mogelijk gevolgen heeft voor de hele AI-sector.
Om te voldoen aan de GDPR moeten bedrijven zich kunnen beroepen op een van de zes wettelijke rechtvaardigingen voor het verzamelen en gebruiken van persoonlijke gegevens. Deze rechtvaardigingen vari?ren van het verkrijgen van expliciete toestemming tot het aantonen van een legitiem belang bij het gebruik van de gegevens.
In het geval van OpenAI lijkt aan geen van deze rechtvaardigingen te zijn voldaan, waardoor het bedrijf vatbaar is voor juridische stappen. En er kunnen in de nabije toekomst nog meer zaken volgen tegen soortgelijke AI-projecten.
De weg vrijmaken voor verantwoorde AI-innovatie
De plotselinge opkomst van generatieve AI-technologie heeft toezichthouders op het gebied van gegevensbescherming onvoorbereid gemaakt. Nu meer landen onderzoek doen naar AI-bedrijven zoals OpenAI, lijkt een botsing tussen technologische vooruitgang en privacywetgeving onvermijdelijk.
De situatie benadrukt de noodzaak voor AI-ontwikkelaars om hun benadering van gegevensverzameling en -gebruik opnieuw te evalueren en tegelijkertijd de privacywetgeving na te leven. Om deze problemen aan te pakken, zouden bedrijven door de ICO aanbevolen strategie?n kunnen ontwikkelen, waaronder
– Anonimiseren en de-identifying van persoonlijke gegevens: Door zorgvuldig persoonlijke informatie uit trainingsdatasets te verwijderen, kunnen AI-ontwikkelaars privacyrisico’s beperken en voldoen aan de wetgeving op het gebied van gegevensbescherming.
– Transparantie en toestemming: Bedrijven moeten open zijn over hun verzameling, gebruik en verwerking van persoonsgegevens. Het verkrijgen van expliciete toestemming van individuen kan helpen bij het vaststellen van een rechtsgrondslag voor het gebruik van gegevens.
– Samenwerking met toezichthouders: Gesprekken aangaan met gegevensbeschermingsautoriteiten kan bedrijven helpen om de wettelijke vereisten te begrijpen en AI-systemen te ontwikkelen die aan de wet voldoen.
– Investeren in AI-onderzoek dat de privacy beschermt: Technieken zoals federatief leren en differenti?le privacy kunnen ontwikkelaars helpen bij het maken van AI-modellen die privacy respecteren zonder dat dit ten koste gaat van de prestaties.
– Industriestandaarden ontwikkelen: Naarmate de AI-technologie zich verder ontwikkelt, groeit de behoefte aan industriebrede standaarden en richtlijnen voor gegevensbescherming, privacy en ethische overwegingen.
Een balans vinden: De toekomst voor GPT-4, AI en privacy
Het ChatGPT-conflict benadrukt de ingewikkelde relatie tussen AI-ontwikkeling en data privacy.
Naarmate AI-modellen zich blijven uitbreiden en steeds meer leren van enorme gegevensbronnen, moeten ontwikkelaars manieren bedenken om ervoor te zorgen dat de wetgeving voor gegevensbescherming wordt nageleefd, terwijl de effectiviteit en bruikbaarheid van hun AI-systemen behouden blijft.
Een proactieve aanpak die samenwerking met regelgevers, transparantie en investeringen in privacybeschermend onderzoek omvat, kan de AI-industrie helpen een balans te vinden tussen innovatie en privacy.
Uiteindelijk is het bereiken van deze balans cruciaal voor het succes op lange termijn en de acceptatie van AI-technologie wereldwijd.