Comment des IA ont été utilisées pour générer des images à partir de contenus pédopornographiques

mostrar índice

Des intelligences artificielles au cœur d’une controverse pédopornographique
L’utilisation inattendue des bases de données AI
L’origine controversée des données
Des tentatives de filtration inefficaces
Les implications pour les utilisateurs
Tableau Récapitulatif

Des intelligences artificielles au cœur d’une controverse pédopornographique

IA et Art : processus de création des œuvres IA présenté par @obv_ious pic.twitter.com/p3wqJpf9zs
— CNIL (@CNIL) November 28, 2023

L’utilisation inattendue des bases de données AI

Lorsque des enthousiastes de la technologie emploient des systèmes d’IA pour générer des visuels, ils ignorent souvent que ces outils peuvent piocher dans des collections d’images répréhensibles. Selon des recherches menées par l’Observatoire Internet de Stanford et relayées par 404 Media, cette situation alarmante est liée à LAION-5B, une vaste base de données utilisée pour la formation de multiples algorithmes, dont le notable Stable Diffusion. Cette immense bibliothèque d’environ six milliards d’éléments comprend malheureusement des milliers de fichiers illicites, avec pas moins de 3 226 images classifiées comme pédopornographiques.

L’origine controversée des données

À l’origine, l’organisation à but non lucratif LAION a été créée dans le dessein de fournir des outils d’apprentissage automatique accessibles au public. LAION-5B figure parmi ses principales contributions. La base répertorie divers liens d’images provenant d’Internet, y compris des plateformes sociales où la pédopornographie peut malheureusement se cacher. Marcus Rogers de l’Université Purdue soulève une critique sévère à cet égard: les entreprises manquent soit de volonté pour prendre connaissance des contenus illicites, soit elles ont franchement perdu la maîtrise sur le contenu diffusé.

Des tentatives de filtration inefficaces

Dès 2021, les responsables de LAION exprimaient des doutes sur la conformité légale de certains éléments de leur base de données. Malgré des tentatives de nettoyage, des images douteuses ont subsisté et LAION-5B a été mise à la disposition du public. Les signalements d’utilisateurs concernés n’ont été sérieusement considérés qu’après plusieurs mois, conduisant finalement à la suspension temporaire de LAION-5B et d’une autre base, LAION-44M, le temps de rendre ces outils inoffensifs.

Les implications pour les utilisateurs

Les implications sont sérieuses pour quiconque télécharge la totalité de ces bases de données sans prendre des mesures extrêmes: ils se retrouvent potentiellement en possession de contenu illégal. David Thiel de Stanford précise que les filtres développés par LAION pour éliminer ces images ne sont apparus que récemment.

Tableau Récapitulatif

Base de données	Nombre d’images	Contenus illicites	Action de LAION
LAION-5B	~6 milliards	Oui, inclut des images pédopornographiques	Filtrage et suspension temporaire
LAION-44M	Non spécifié	Potentiellement (suspension préventive)	Suspension temporaire

En conclusion, cette affaire soulève des questions éthiques et légales cruciales sur la gestion des données par les organisations qui promeuvent l’open source, ainsi que sur les responsabilités incombant aux utilisateurs de ces bases de données. Elle met en lumière la nécessité de protéger l’intégrité et la sécurité des systèmes d’IA générative.

Avalie este artigo

Descubra o autor, Gabriel Fouquet

Sou Gabriel Fouquet, um escritor apaixonado por tecnologia e inteligência artificial, com foco particular em como esses dois campos se cruzam e se complementam. Atualmente, compartilho meus conhecimentos e minhas descobertas no blog intercoaching.fr, um site dedicado à tecnologia, IA e seu impacto em nossas vidas diárias. Desde muito jovem, sempre fui atraído pela tecnologia e sua influência em nosso mundo. O meu fascínio por estas áreas foi crescendo ao longo dos anos, evoluindo de uma simples curiosidade para uma verdadeira paixão. O que sempre me atraiu é como esses campos em constante mudança estão moldando nossa sociedade e nosso futuro. Tendo dedicado minha vida a estudar e entender a inteligência artificial e a tecnologia, meu objetivo é desmistificar esses tópicos frequentemente complexos. No blog intercoaching.fr, escrevo artigos que traduzem esses conceitos em linguagem compreensível, com a intenção de tornar a IA e a tecnologia acessíveis a todos. Meu trabalho é movido por uma verdadeira paixão por aprender e compartilhar conhecimento. Estou constantemente atento aos últimos avanços nessas áreas e espero inspirar outras pessoas a compartilhar minha curiosidade e entusiasmo por tecnologia e IA.