Comment une "invite aléatoire" a permis à GPT-4o de générer des images aussi réalistes que des photos

lin james
2025-04-27
Share :

Tout a commencé avec une publication sur les réseaux sociaux

Aujourd'hui, en faisant défiler les réseaux sociaux, je suis tombé sur un utilisateur qui expliquait comment, grâce à une "​invite aléatoire​", il avait réussi à obtenir une génération d'images avec GPT-4o si réaliste que cela ressemblait à une vraie photo prise avec un iPhone. L'image était tellement naturelle que je me suis dit : "On dirait exactement une photo que je pourrais prendre un jour ordinaire avec mon téléphone !"

L'invite simple qui est devenue virale

Ce type d'invite est rapidement devenu viral sur Reddit et ​X​. L'idée est simple : fournir une instruction du type :

"Prends un selfie d’iPhone extrêmement banal, sans composition soignée. Légèrement flou, surexposé, pris sous un angle étrange et négligé. De nuit, avec une personne visible et un monument célèbre en arrière-plan."

De nombreux utilisateurs ont alors commencé à modifier cette base : ajoutant plus de personnages, des monuments spécifiques, des angles inattendus… Et ainsi est née la tendance des ​photos iPhone naturelles générées par IA​.

Mon essai personnel : la vue d'une fenêtre sous la pluie

Évidemment, j'ai voulu essayer moi-même. Dehors, il pleuvait légèrement, alors j'ai écrit une invite dans ce style :

"Prends une photo extrêmement banale d’iPhone, sans sujet principal ni composition réfléchie. Un peu floue, avec une exposition irrégulière, prise sous un angle étrange. Il pleut doucement dehors. Je viens de me réveiller et je capture machinalement la scène depuis ma fenêtre."

Quelques secondes plus tard, GPT-4o a généré une image incroyablement réaliste, recréant parfaitement cette sensation de photo spontanée lors d'un jour de pluie. La qualité de la génération d'images avec GPT-4o m'a vraiment impressionné.

image.png

J'ai ensuite imaginé rencontrer un chat dans la rue

Porté par l'enthousiasme, j'ai testé une nouvelle situation :

"Prends une photo d’iPhone extrêmement banale. Aucun sujet clair. Pendant que je marche, un chat British Shorthair bleu surgit d’un parterre de fleurs et court devant moi. J'attrape mon téléphone et je prends la photo sur le vif."

Le résultat était tout aussi bluffant : une ​photo iPhone naturelle​, pleine de mouvement et de spontanéité, comme si la scène s'était réellement produite. La capacité de la génération d'image à transmettre l'émotion était remarquable !

image.png

Parfois, une invite simple suffit à transmettre une émotion authentique

Cette expérience m'a rappelé une chose essentielle : ​la photographie ne doit pas toujours être parfaite ; capturer l'authenticité peut être encore plus précieux​.

À une époque où nous recherchons des compositions impeccables, il est rafraîchissant de voir émerger un style basé sur ​des photos imparfaites générées par IA​, floues, spontanées et sincères. Peut-être sommes-nous à l'aube d'une nouvelle ère où nous rechercherons l'​imperfection naturelle dans la création d'images IA​.

Peut-on générer des photos style CCD avec GPT-4o ?

Dernièrement, sur les réseaux sociaux japonais, un phénomène a refait surface : l'iPhone 5s produit des photos au ​rendu proche des caméras CCD anciennes​, ce qui a réveillé la nostalgie de ce style vintage.

Cela m'a donné envie de tester la ​génération de photos style CCD avec GPT-4o​. Voici ce que j'ai observé :

  • Utiliser des images de célébrités aide à rendre les visages plus naturels (grâce à un meilleur entraînement sur ces données).
  • Les visages anonymes peuvent parfois avoir de légères anomalies.
  • Attention aux déformations possibles des visages et des arrière-plans.
  • Mentionner un modèle de caméra CCD dans l'invite améliore le réalisme vintage.

Un prompt efficace pourrait ressembler à ceci :

"[Description de la personne], [vêtements], [action ou pose], [lieu], [conditions lumineuses], [arrière-plan], prise avec [modèle de caméra CCD], flash activé, visage [clair et net], arrière-plan [sombre et flou], grain visible, [ton de couleur], [ambiance nostalgique ou rétro], [type de style]"

N'hésitez pas à expérimenter !

image.png

L'imperfection humaine rend l'image plus réaliste

Connaissez-vous la théorie de la "​vallée dérangeante​" formulée en 1970 par le roboticien japonais Masahiro Mori ? Elle explique que plus un objet artificiel ressemble à un humain sans être totalement parfait, plus il génère un sentiment d'inconfort.

Dans le cas des ​photos générées par IA​, c’est similaire : des ​imperfections numériques​, ​des doigts déformés​, ​des éléments de fond illogiques​… Tout cela peut rapidement trahir la nature artificielle de l’image.

Cependant, en intégrant volontairement des imperfections humaines — comme un flou, une surexposition ou une mauvaise composition —, on parvient à créer une ​authenticité saisissante​. À propos, grande nouvelle : XXAI vient de lancer sa nouvelle fonctionnalité "Artist" ! Elle intègre des modèles de pointe comme ​Recraft​, Flux et ​Stable Diffusion​, vous offrant d'infinies possibilités pour donner vie à votre créativité. Essayez dès maintenant XXAI Artist pour révolutionner votre manière de créer !

image.png

Peut-être que le véritable futur de la génération d'images réalistes par IA réside dans ces petits défauts qui rendent une photo si humaine.