Pourquoi les générateurs d'images AI luttent avec les mains

Pourquoi les générateurs d'images AI luttent avec les mains
Des lecteurs comme vous aident à soutenir MUO. Lorsque vous effectuez un achat en utilisant des liens sur notre site, nous pouvons gagner une commission d'affiliation. En savoir plus.

Les générateurs d'IA évoluent sous nos yeux à un rythme effrayant, mais ils ont encore des défauts. Repérer des détails étranges dans les images AI est en fait assez amusant. C'est pourquoi les mains Midjourney sont devenues un sujet brûlant, un problème commun à de nombreux moteurs.





Voyons pourquoi les mains défient tant les générateurs d'images AI. Leurs programmeurs résolvent déjà ce problème digne d'un mème, mais il est intéressant de réfléchir à la façon dont l'intelligence artificielle apprend, sans parler de ce qui se met en travers de son chemin.





comment obtenir les nouveaux filtres sur snapchat
UTILISEZ LA VIDÉO DU JOUR FAITES DÉFILER POUR CONTINUER AVEC LE CONTENU

Pourquoi les mains générées par l'IA ont fait sensation

Quiconque utilise des moteurs d'intelligence artificielle pour créer des images a peut-être remarqué que les mains sortent rarement correctement, mais le problème a fait tourner les têtes lorsqu'un tas de 'photos' sont apparues sur Twitter.





En y regardant de plus près, les mains étranges des gens les ont révélées comme des images générées par l'IA. Le fait qu'il s'agissait de la tentative de Midjourney rendait la situation plus intéressante.

L'un des meilleurs moteurs d'IA du moment ne pouvait pas s'attaquer à la complexité des mains humaines, de sorte que les capacités de Midjourney et de ses concurrents ont été mises à l'épreuve. Il est vrai que même DALL-E est sujet aux doigts et aux ongles irréalistes.



  de personnes se serrant la main sur DALL-E

Le battage médiatique était hors de proportion, étant donné que les mains générées par l'IA ont toujours été un problème, mais l'attention supplémentaire a incité la sortie de Midjourney v5 pour améliorer la v4 .

La nouvelle version a mis un point d'honneur à améliorer la conception des mains, une indication claire que les ingénieurs en IA ont prêté attention à l'agitation hilarante et ont décidé de mettre à niveau les capacités du logiciel.





Les autres moteurs sont lents à suivre l'exemple de Midjourney, donc réparer l'art de l'IA avec Photoshop demeure une compétence inestimable. Le principal obstacle pour les programmeurs est la difficulté d'entraîner l'intelligence artificielle à dessiner des mains convaincantes.

Pourquoi les générateurs d'images AI ont-ils du mal avec les mains ?

Les moteurs d'IA utilisent des réseaux antagonistes génératifs (GAN) ou la diffusion stable pour produire des images. Les deux technologies nécessitent des matériaux sources, une formation et une puissance de traitement considérables pour créer même les œuvres d'art les plus élémentaires.





Étant donné que les images préexistantes sont au cœur de la formation d'une IA, les programmeurs doivent alimenter leur logiciel avec des milliers, voire des millions, d'images accompagnées d'invites, répétant le processus encore et encore jusqu'à ce que le moteur comprenne à quoi un mot particulier fait référence et comment le représenter. cet objet.

Mais les images sources à partir desquelles une IA apprend sont principalement en 2D, où les mains sont représentées dans une variété de positions. Que ce soit droit ou recourbé, montrant cinq doigts ou trois.

En fin de compte, une machine ne comprend pas vraiment le concept des mains, et les images dont elle tire les leçons ne présentent pas toujours les mains de manière suffisamment claire ou cohérente. C'est pourquoi les mains de Midjourney peuvent être si laides : la confusion de l'IA.

Aussi valide que Les inquiétudes d'Elon Musk concernant le développement de l'IA peut-être que certaines parties de la technologie ont encore beaucoup à apprendre. Et leurs obstacles vont au-delà des exemples insuffisants de mains.

Autres raisons pour lesquelles les générateurs d'images AI sont lents à s'améliorer

  Femme codant sur ordinateur

Regarder Les modèles de Midjourney , la v5 offre une cohérence avancée entre les invites textuelles et les images produites, ainsi qu'une résolution plus élevée et des outils supplémentaires. Mais de telles réalisations ne sont pas bon marché.

comment récupérer des photos supprimées sur android

Entraîner une IA à mieux faire de ses mains nécessite de lui donner de meilleures images, notamment en 3D. Cela signifie que beaucoup de temps et de main-d'œuvre sont consacrés aux processus, de l'acquisition des matériaux sources à l'amélioration du codage et à la répétition de la formation jusqu'à ce que l'IA réussisse.

Même dans ce cas, le logiciel peut faire des erreurs dans des œuvres d'art autrement époustouflantes. En plus d'être un travail énorme et complexe, c'est cher. Alors, ne vous attendez pas générateurs de texte en image AI gratuits pour passer au calibre de Midjourney pour le moment.

En termes simples, le problème avec les moteurs d'intelligence artificielle ne concerne pas seulement l'incapacité de ces programmes informatiques à comprendre complètement l'apparence ou le fonctionnement des caractéristiques humaines telles que les mains et les pieds. Cela dépend également de ce qu'il en coûte et de l'accès de la technologie à l'imagerie 3D et aux techniques d'apprentissage automatique qui peuvent aider les générateurs à avoir une compréhension plus réaliste du monde qui les entoure.

Les générateurs d'images AI ne lutteront pas éternellement

Les mains sont un concept délicat pour l'intelligence artificielle pour envelopper sa tête binaire, mais des solutions au problème sont déjà à l'œuvre. Midjourney, DALL-E 2 et d'autres plates-formes pourront éventuellement réduire au minimum les doigts excentriques, voire les éradiquer complètement.

Les avancées dans d'autres domaines de l'IA garantissent que la technologie évolue constamment et que ses développeurs apprennent toujours de nouvelles façons de l'appliquer et de l'améliorer.