INTELLIGENCE ARTIFICIELLE ET PHOTO

Depuis des mois et des mois, l’IA occupe le terrain médiatique. Avec des générateurs d’images comme Midjourney et Dall-E, ou des agents conversationnels comme ChatGPT. La photo n’y échappe pas non plus, avec des fonctions qui tiennent du miracle pour débruiter les clichés, reconstituer des parties absentes au recadrage, identifier et détecter des objets, des personnes. Sans oublier les recherches en cours plus spectaculaires les unes que les autres, certaines accessibles dans Photoshop

L’IA ne remplace pas le retoucheur, mais optimise sa productivité et allège des tâches ardues comme masquer un objet au contour complexe

L’IA de Photoshop permet d’élargir une photo, sans déformer son contenu, mais en recréant les parties absentes.

Faire mouliner nos ordinateurs avec des techniques pointues pour améliorer les photos ne date pas d’hier. Mais un plafond de verre a été brisé avec l’intelligence artificielle. Pas un mois sans que l’on ne découvre, dans les logiciels ou dans  les labos de recherche des techniques qui laissent pantois. L’intelligence artificielle infiltre la prise de vue, le choix et le classement des photos, les  retouches des plus simples aux plus sophistiquées, et même la création d’images photoréalistes. Ceux qui achètent un hybride noteront que l’IA a enrichi l’autofocus pour détecter, outre les visages et les yeux, la présence de véhicules ou d’animaux, animés de mouvements parfois complexes. Cela grâce à un pan de l’IA qui analyse le contenu de l’image, pour distinguer ses composants : ciel, végétation, constructions, animaux, personnes, objets et dont l’application ne concerne pas que l’autofocus avec suivi.

Pour découvrir notre sélection d’équipements de photographie, d’optiques, de matériel vidéo, de son, de drones, de trépieds, de bagagerie, de solutions de stockage, d’énergie, de flashs, de produits de téléphonie multimédia, ainsi que des articles d’occasion, rendez-vous sur la page de Phox.fr

Faciliter l’organisation

Cette analyse du contenu est employée pour décharger le photographe de la tâche fastidieuse qu’est l’association de mots-clés à ses images, pour mieux les identifier et faciliter les recherches ultérieures dans une copieuse photothèque. Ce que propose Lightroom CC, mais pas Lightroom Classic. ON1 l’a intégré dans ON1 Photo Raw 2023.5 et ON1 Photo Keyword AI 2023. Excire le réalise dans Excire Search voué à compléter Lightroom Classic. Plus récemment, Cyme, avec le gestionnaire universel PeakTo qui agrège des photothèques de logiciels différents s’y est mis, sous macOS uniquement. Il propose aussi une recherche fondée sur une description du contenu ou la présentation d’une image similaire (ce que fait déjà la recherche de Google). Voilà des commandes qui vont se généraliser, tant elles sont pratiques.

Évidemment, des affinages sont nécessaires. Parce que les procédures ne sont pas fiables à cent pour cent. Parce que la liste des mots clés est limitée et ne couvrira pas les classements les plus fins. Parce que des mots-clés inutiles seront générés, par exemple « mammifères » alors que « félins » suffirait. D’ailleurs, il faudra mettre la main à la pâte pour identifier ses proches et relations, avec l’aide de l’IA bien sûr. Cette analyse couvre aussi des critères pour attribuer des mots-clés à vocation esthétique : ambiances de couleurs, luminosité (clair, sombre), niveau d’abstraction, structures géométriques, etc.
Une autre fonction est l’aide à la sélection des photos, le culling en bon français. Les images sont scrutées et un logiciel comme Narrative sait extraire les visages d’une photo, et pour chacun d’entre eux dire si les yeux sont ouverts, semi-ouverts ou fermés et quel est le niveau de netteté. Cela assorti de filtres sur ce type de critère, pour une présélection des photos qui, sans forcément être esthétiquement bonnes, le sont techniquement. Le photographe de mariage appréciera. L’IA commence même à qualifier l’expression faciale : joie, colère, étonnement… Quant à l’évaluation purement esthétique, elle ne convainc  pas encore

Faciliter la vie

L’intelligence artificielle ne remplace pas le retoucheur, mais elle optimise sa productivité et allège des tâches ardues comme masquer un objet au contour complexe. Même si la fiabilité n’est pas de 100 %, le travail pour améliorer le masque résultant sera plus rapide. La retouche fait l’objet de nombreuses recherches. Aujourd’hui, pour corriger la sur ou sous-exposition, ajuster les hautes et basses lumières, l’IA ne fait pas un meilleur travail que les réglages manuels. Surtout, elle ne prend pas en compte les critères esthétiques de chacun.

En revanche, pour faire ressortir des détails, rendre de la netteté à une image plus ou moins floue, à l’inverse flouter l’arrière-plan, elle s’avère plus pertinente. Cela en fait un outil intéressant pour donner du peps à d’anciennes photos, celles de famille que l’on aura numérisées ou même celles prises avec un compact  numérique doté d’un capteur de 2 ou 3 Mpxl. Si, si, il y en a eu autrefois ! Et vous pourrez aussi les redimensionner, là aussi l’IA a fait progresser la technique, mais gare au rendu peu naturel que l’ajout de grain argentique peut contrecarrer.
Un autre domaine, initié par DxO, est celui de la réduction du bruit grâce à l’IA. Rejointe par d’autres, comme Topaz, ON1 ou encore Adobe. Obtenir une image détaillée, avec de vraies couleurs, d’un amas de pixels pollué par un bruit intense est désormais une réalité que l’on n’aurait jamais crue possible avec des clichés pris aux sensibilités extrêmes (6 400 Iso et au-delà).

Voilà qui étend le champ  d’action des appareils aux capteurs 1 pouce ou Micro 4/3, moins performants en ISO élevés et basses lumières que les APS-C et plein format.Autre domaine, la reconstitution de zones en bordure d’une image que l’on fait pivoter pour redresser l’horizon par exemple. Avec l’IA générative Adobe Firefly ou les fonctions du  logiciel Luminar Neo en cours de déploiement, il est envisageable de recréer les parties manquantes avec une bonne dose de pertinence et de réalisme. Mieux, élargir une photo, pour passer du format 3/2 au 16/9 ou transformer une orientation portrait en paysage, en reconstituant un contenu plausible,  en accord avec l’image, y compris en couleur et lumière, est envisageable !

Aide à la pratique professionnelle

On peut se gausser de la fonction de remplacement du ciel, mais le pro qui travaille pour un office du tourisme, qui se déplace sur site et tombe sur une journée de grisaille pourra facilement, transformer le gris uniforme des nuages en un ciel radieux, puis ré-éclairer et recolorer le paysage en quelques clics de souris. Le couturier créatif, au vu de la photo d’un mannequin portant ses créations pourra décider de raccourcir une robe, élargir un pantalon en déplaçant la souris, l’IA se  chargeant de redessiner la photo, une technique encore à l’étude ! Enfin, si le cliché que vous souhaitez publier ou exposer présente une personne, il suffira d’en changer la tête avec un visage imaginé par l’IA, pour éviter les problèmes de droit à l’image, ce que réalise EraseID de l’éditeur PiktID !

C’est le bon côté. Reste qu’avec la quasi-majorité des outils actuels d’IA, il est impossible d’apporter son grain de sel à la phase d’apprentissage, par exemple en donnant quelques exemples avant/après de  photos que vous avez corrigées pour que le logiciel assimile vos préférences. Ou lui apprendre, à partir de quelques clichés personnels, à attribuer les bons mots-clés.  Enfin, si vous employez une IA générative, pour créer des photos de toute pièce ou compléter des images existantes en bordure à l’occasion d’un recadrage, ce n’est pas plus d’actualité. Mais Adobe réfléchit à ce que le photographe puisse apporter son grain de sel à ses photos. Et une application comme PhotoAI propose à partir d’une trentaine d’images d’une même personne de la mettre en scène avec différentes tenues et situations.

étonnant ou inquiétant…

L’IA explore aussi des pistes les plus insolites. Par exemple l’appareil photo sans objectif ni pellicule. Le Paragrafica, virtualisé via un site web, fonctionne à partir des coordonnées GPS, d’une date (du passé au présent), avec un angle de  vision variable. Il produit une photo du lieu où il est censé se trouver et fait varier l’image selon la date. Un prototype physique est déjà dans les mains du concepteur. Utile ? À vous de juger ! Une autre piste est encore plus folle. Des chercheurs travaillent sur l’association d’IRM, d’analyse par l’IA et d’un générateur d’image (Stable Diffusion pour un récent projet) afin de recréer la photo à laquelle le sujet de l’expérience a pensé. Pas gagné, mais les résultats restent cohérents avec ce qui a été traversé, le cerveau.

Quel bilan tirer de cela ?

À ce jour, si les inquiétudes sur l’IA sont légitimes, force est de reconnaître à la fois son aspect spectaculaire et l’aide qu’elle peut apporter pour améliorer des photos, actuelles ou issues de la numérisation de diapositives et négatifs d’une faible qualité technique. Reste à tous, du législateur aux individus dans leurs usages, de lui donner unew place. Il est rassurant de savoir que la mise au point d’outils capables de détecter une photo relevant de l’IA est en cours, pour éviter les usages contestables, ou simplement informer le public

Les photos qui n’existent pas

Midjourney, Dall-E, Stable Diffusion, ces IA dites génératives, créent des images à partir d’une description (un prompt). D’autres arrivent, Firefly chez Adobe, CM3Leon chez Meta… Elles produisent toute sorte de styles : du manga à la peinture impressionniste en passant par l’illustration de science-fiction.

Imaginant des paysages, des architectures, des végétations et des animaux réels ou fantastiques, imitant au besoin le style de peintres célèbres. La photo n’y échappe pas, même si des exemples récents, surprenants en apparence par leur réalisme, révèlent les failles actuelles : mains à six doigts par exemple, difformités ponctuelles sur les yeux, les lèvres ou le nez. Un examen de portraits générés par l’IA dans la banque d’images Shutterstock montre bien des défauts. Tant mieux pour les photographes ! Pour l’instant…

Où vont-ils chercher tout cela ?

L’intelligence artificielle n’a rien d’humaine. Il faut l’entraîner avec des centaines de milliers voire des millions d’images. Beaucoup ne se gênent pas pour aspirer sur les réseaux sociaux, les sites de vidéos ou les photothèques en ligne la matière pour éduquer leurs enfants technologiques.

Et pour leur IA générative, les dirigeants de Midjourney et Stable Diffusion ont admis avoir employé des milliards d’images sans consulter leurs propriétaires. Voilà qui ouvre de nombreux chapitres aux juristes quant au droit d’auteur (le cliché lui-même et sur son contenu) et au droit à l’image si un visage était identifiable en cas de publication d’une photo artificielle.

Explorez les dernières nouveautés et plongez dans les toutes dernières innovations pour concrétiser vos idées et projets Phox