mostra indice nascondi indice
Nightshade : le système d’intrusion dans les IA d’images textuelles
Des spécialistes en informatique de l’Université de Chicago viennent de mettre au point un outil, baptisé Nightshade, qui a la capacité de perturber la phase d’apprentissage automatique des IA orientées vers la génération d’images à partir de textes. Cette approche vise à introduire des données altérées au sein de ces modèles intelligents.
La subversion discrète des banques d’images
Les intelligences artificielles dédiées à la conversion du texte en images nécessitent des bases de données conséquentes et de haute qualité, souvent constituées à partir de collections éclectiques disponibles sur Internet. Or, la moisson de ces données massives, parfois en infraction avec les lois sur le droit d’auteur, est une pratique courante chez les concepteurs de tels systèmes, y compris de solutions connues telles que Dall-E 3 ou Stable Diffusion.
Une manipulation furtive mais impactante
Dans le dessein de protéger les droits des artistes, les chercheurs de l’Université de Chicago ont donc élaboré Nightshade, un mécanisme subvertissant imperceptiblement le contenu des images. Bien que les transformations faites sur les images soient indécelables par l’œil humain, elles induisent des erreurs dans l’interprétation des modèles d’IA, ce qui entraîne des dérèglements lors de leur entraînement. Un cas illustratif serait une image de loup qui, une fois les manipulations de Nightshade appliquées, serait perçue par l’algorithme comme une image de voiture durant son apprentissage automatique, provoquant ainsi des réponses inadéquates de la part de l’IA.
- Les étiquettes d’images pour le modèle sont faussées.
- L’outil est spécialement efficace contre les algorithmes de Stable Diffusion.
Défendre l’intégrité des modèles face aux corruptions
Nightshade constitue une menace réelle pour la fiabilité des modèles concernés, puisqu’il suffit d’introduire un faible pourcentage d’images corrompues dans le flux d’entraînement pour alterer notoirement leurs capacités. Déconcertés face à la sophistication de l’outil, les experts n’ont pas encore trouvé de parades infaillibles pour déjouer ces altérations, mais proposent des mécanismes de réaction, tels que l’élimination d’images problématiques durant l’apprentissage ou la mise au point d’un système de détection en réponse à Nightshade, plongeant les développeurs dans une lutte constante pour la sécurité de leurs modèles.
Une arme à double tranchant
Envisageant de rendre Nightshade accessible en open source, les chercheurs escomptent inciter les concepteurs de modèles d’IA ainsi que les propriétaires de contenus à engager un dialogue constructif autour de la légitimité et de la rémunération de l’usage des images en ligne pour l’entraînement des intelligences artificielles.
En conclusion, il est probable que les stratégies d’empreinte de données, telles que Nightshade, jouent un rôle crucial à l’avenir, à la fois comme instrument de défense pour les créateurs de contenu et comme facteur de transformation des méthodes d’acquisition de données pour les futures technologies d’IA.
