Modification de photos à l’aide de commandes de texte – le travail d’Apple AI se poursuit

0
157

Le travail d’Apple en matière d’IA est peut-être un peu lent en ce qui concerne Siri, mais la société ne reste pas les bras croisés à ne rien faire. La société vient de publier un modèle d’IA open source permettant d’éditer des photos à l’aide de simples commandes de texte – ce qui a été décrit comme une avancée majeure.

Nommé MGIE – pour Multimodal large language model Guided Image Editing – le modèle permet à l’utilisateur d’utiliser le langage naturel pour indiquer à l’éditeur ce que vous souhaitez réaliser…

Par exemple, un utilisateur peut simplement dire « rendre le ciel plus bleu » et MGIE interprétera cela comme « identifier et sélectionner le ciel, puis augmenter la saturation de cette zone de 20 % ».

EntrepriseBeat rapporte que MGIE est capable de réaliser une gamme impressionnante de montages.

MGIE peut effectuer des modifications courantes de style Photoshop, telles que le recadrage, le redimensionnement, la rotation, le retournement et l’ajout de filtres. Le modèle peut également appliquer des modifications plus avancées, telles que la modification de l’arrière-plan, l’ajout ou la suppression d’objets et la fusion d’images.

MGIE peut optimiser la qualité globale d’une photo, telle que la luminosité, le contraste, la netteté et la balance des couleurs. Le modèle peut également appliquer des effets artistiques comme des croquis, de la peinture et des dessins animés.

MGIE peut modifier des régions ou des objets spécifiques dans une image, tels que des visages, des yeux, des cheveux, des vêtements et des accessoires. Le modèle peut également modifier les attributs de ces régions ou objets, tels que la forme, la taille, la couleur, la texture et le style.

Si le modèle ne fournit pas le résultat attendu, vous pouvez affiner votre demande, ou annuler l’effet et donner une instruction différente.

Pour l’instant, il ne s’agit que d’un modèle open source sur Github, mais il y a une démo en ligne vous pouvez utiliser pour télécharger vos propres images et jouer avec. Un bref jeu avec ceci montre qu’il s’agit certainement d’une première version bêta, mais je peux certainement voir le potentiel

Voici ma photo originale :

Ma consigne était de « rendre le ciel légèrement plus rouge », ce que MGIE interprétait comme « faire en sorte que le ciel de l’image soit une nuance de rouge plutôt qu’un bleu chatoyant. Faites du paysage urbain une ombre ombragée au lieu d’un ciel d’un blanc immaculé. Voici le résultat (qui est tronqué, pour des raisons inconnues) :

Bien qu’il ne s’agisse pas d’une édition utilisable telle quelle (et de toute façon, la démo ne prend en charge que les sorties en très basse résolution), ce qui est remarquable pour moi, c’est la façon dont elle a ajusté avec précision la réflexion à l’intérieur du cadre métallique pour qu’elle corresponde au ciel. Cela semble certainement prometteur.

Nous ne savons pas encore quand ou si Apple pourrait ajouter cette fonctionnalité à l’iPhone une fois qu’il aura fourni des résultats plus soignés, mais cela semble certainement une étape très logique pour une entreprise qui a toujours cherché à rendre les fonctionnalités de photographie IA aussi automatiques/faciles à utiliser que possible. possible.

FTC : Nous utilisons des liens d’affiliation automatique générateurs de revenus. Plus.

Marion Legrand
Marion a été éditeur en chef pour SOON. elle a précédemment créé des stratégies de marketing de contenu et des textes convaincants pour diverses entreprises de technologie et de commerce électronique. Elle a cofondé deux jeux de rôle fantastiques en direct qui ont offert des expériences immersives et interactives pendant près de 10 ans.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici