L’arrivée des IA dans l’art graphique : Dall·E-2 et Midjourney

Nous assistons à un véritable jump technologique avec l'arrivée des IA dans le monde des arts visuels !

L’arrivée des IA dans l’art graphique : Dall·E-2 et Midjourney

Lorsque j’ai créé cette Newsletter, j’étais certes motivé par les promesses du Web3, mais j'étais surtout motivé par son côté disruptif.

En effet, il n'a pas été question d'attendre 10 ans pour profiter de ces outils, que sont les NFTs et la Blockchain. Ils sont rapidement devenus accessibles pour commencer à penser et construire l'internet de demain.

💡
*Se dit d'une entreprise, d'un produit, d'un concept, etc., qui créent une véritable rupture au sein d'un secteur d'activité en renouvelant radicalement son fonctionnement.

C’est à mon sens exactement ce qui est en train de se passer avec l’arrivée des IA dans le monde de l’art graphique.

Une technologie disruptive qui va s’intégrer dans nos vies de manière quasi-instantanée !

Et pour nous autres musiciens, nous permettre de créer du contenu graphique, sans aucune connaissance technique.

Vous avez peut-être déjà entendu parler de Dalle 2 ou de Midjourney ?

Non ?

🗣️
Alors, voici le sommaire :
  • 🤖 Présentation & utilisation de Dall-E 2
  • 🤖 Présentation & utilisation de MidJourney
  • ⚖️ Pouvez-vous vendre ces oeuvres ?
  • 😎 2 cas d'études : lW3M et l'artiste SHMOOLIK
  • ☕️ Un tour d'horizon des autres solutions similaires

🟠 Dall-E 2

Tout a commencé pour Dalle lorsque en 2015 à San Francisco Elon Musk, Sam Altman et d'autres, ont promis 1 milliard de dollars pour la création d’un fond de recherche.

Plus précisément, un laboratoire de recherche sur l'intelligence artificielle (IA).

« La société, mène des recherches dans le domaine de l'IA avec l’objectif de promouvoir et de développer une IA conviviale qui profite à l'humanité dans son ensemble. «

Elon Musk quittera le board en 2018 tout en continuant de financer le projet, mais c’est surtout Microsoft qui en 2019 investira 1 milliard de dollars.

Alors DALL-E 2, c’est quoi ?

DALL-E 2 est un système d’Intelligence Artificielle texte-image. (connecting text to images).

Il s'agit d’un système qui permet d’encoder un texte qu'on appelle « prompt* » et de le décoder en une image visuelle.

💡
* Le prompt, est une directive écrite qui fournit une idée de sujet potentiel ou un point de départ pour plusieurs formes d’écriture."

Comment ça fonctionne ?

DALL-E 2 repose sur un algorithme d'apprentissage en langage naturel, nommé GPT-3 et d’un réseau neuronal créé par OpenAI connu sous le nom de CLIP (Contrastive Language-Image Pre-training).

GPT-3 et CLIP permettent donc à un ordinateur de comprendre et de générer à partir d’un langage naturel sophistiqué, une image, en puisant dans une base de données, composée de milliards d'images et de descriptions.

Et la grande partie de ce réseau repose sur Internet lui-même.

" DALL-E 2 peut créer des images et des œuvres d'art originales et réalistes à partir d'une description textuelle. Il peut combiner des concepts, des attributs et des styles. "

Il vous suffit de décrire simplement une vision, un astronaute sur un cheval, pour que l'IA se charge de générer une image entièrement originale en se basant sur tout ce qu'elle a appris sur les astronautes et les chevaux.

Pourquoi DALL-E 2 est si disruptif

Par le passé, il y a déjà eu de nombreux systèmes d’IA. Craiyon, anciennement connu sous le nom de "DALL-E mini », était déjà un outil Web, gratuit, qui générait des images de la même manière.

Mais les utilisateurs trouvaient les résultats presque dérangeants, comme « sortis tout droit d’un mauvais rêve ». 😅

À la différence, les images produites par DALL-E 2 sont objectivement très belles !

Elles ont, d’un point de vue artistique, un sens de l’esthétique certain au point où il est impossible pour un néophyte de différencier des images créées par Dall-E 2 de celles créées par de véritables artistes.

Et non seulement le système est capable de créer de magnifiques images, en haute résolution et en quelques secondes, à partir d'instructions en langage naturel, mais il peut également modifier et éditer ces images pour fournir de multiples variations.

"  DALL-E 2 peut apporter des modifications réalistes à des images existantes à partir d'une légende en langage naturel. Il peut ajouter et supprimer des éléments tout en tenant compte des ombres, des reflets et des textures. "

En pratique

Dall-E 2 est pour le moment en beta et pour y accéder vous devez passer par une liste d’invitation et honnêtement, les délais sont assez vagues (2 semaines pour certains, 3 mois pour d’autres)

Une fois votre invitation reçue, vous pourrez tester l’app avec 50 essais gratuits, le premier mois et 15 chaque mois.

Au-delà, il faudra forcément passer à la caisse et acheter des crédits.

Tarifs

  • $15 pour 115 Credits
  • Un crédit est appliqué chaque fois qu'une commande « prompt » est saisie et qu'un utilisateur appuie sur le bouton "générer" ou "variations".
  • Ce qui fait à peu près 115 crédits x 4 variations, soit 460 images générées pour 15$, soit 0,032$/image

Les utilisateurs ont fait savoir leur mécontentement au sujet de cette tarification et la société semble encore explorer d'autres options de tarification.

« Il s'agit du premier modèle de tarification et nous prévoyons d'explorer d'autres options de tarification qui s'aligneront sur les processus créatifs des utilisateurs au fur et à mesure que nous recueillons plus de données. »
💡
À noter que les crédits gratuits expirent un mois après avoir été accordés, tandis que les crédits payants expirent 12 mois après la date d’achat.

Utilisation

L'utilisation de Dall-E 2 est assez simple.

Un search vous permet de taper votre prompt* et ce dernier doit obligatoirement se faire en anglais !

Pour ce test, nous avons choisi "Musical explorer in space"

Après quelques secondes Dall-E 2 nous propose 4 directions :

On décide de creuser la proposition numéro 3 et demandons 4 nouvelles variations :

Une fois que le résultat vous convient, il suffit de cliquer sur l'image et de la télécharger.

Précisions

Plus votre formulation sera riche, précise et plus Dall-E pourra ajouter de détails. Toutefois, il n'est pas rare d'obtenir exactement ce que l'on recherche avec de simples phrases, courtes.

De plus, changer un seul mot dans votre prompt vous ouvrira un chemin totalement différent. Les possibilités sont donc illimitées.


🔹 Pour aller plus loin dans l'utilisation de Dalle-2, voici un ebook très complet (en 🇺🇸) :


🟣 Midjourney

MidJourney est une IA qui crée également des images à partir de « prompts ».

C’est un laboratoire de recherche indépendant, une petite équipe autofinancée, qui se concentre sur le design, l'infrastructure humaine et l’IA.

Créer par David Holz et composée de seulement 11 employés, ils se décrivent comme :

"Un laboratoire de recherche indépendant. Explorant de nouveaux moyens de pensée. Développer les pouvoirs imaginatifs de l'espèce humaine. »

Alors que Dall-E crée des images plus réalistes, MidJourney brille en adaptant des styles artistiques existants et créer des compositions vraiment incroyables.

"MidJourney a un certain "je ne sais quoi", les imperfections sont plus belles. DALL-E traite mieux les scènes très clairement instruites. »

En pratique

Contrairement à DALL-E 2, tout le monde peut essayer la version bêta de Midjourney, et ce, dès à présent.

Aucune liste invitée ou période d'attente n'est requise.

La seule chose dont vous avez besoin pour utiliser la bêta est d’un compte Discord.

Une fois votre compte Discord créé, il suffit de se rendre sur le site Web de Midjourney et de sélectionner "Rejoindre la bêta".

Cela vous mènera à leur Discord.

Vous disposez d’une version d’essai gratuite, qui vous permettra de réaliser environ 25 images.

Après cela, vous devrez souscrire à un plan payant.

Utilisation

Pour commencer, rendez-vous sur l'un des nombreux canaux qui se trouvent dans "Newcomer Rooms", dans la barre latérale.

Nous utilisons le canal "#newbies-200", mais il en existe un certain nombre pour supporter le nombre important d’utilisateurs.

Dans la zone de texte, entrez /imagine, puis tapez votre texte à la suite et enfin cliquez sur Entrer.

Midjourney va alors générer 4 propositions. Vous pouvez observer la progression de la création en temps réel et cela ne prend que quelques secondes.

Vous disposez à présent de plusieurs options :

U = Upscale : Crée une version plus grande de l'image.

V = Variation : Crée une nouvelle image basée sur celle que vous avez sélectionnée.

Rafraîchir : Permet d'obtenir quatre nouvelles images à partir de la même invite.

Si vous choisissez une image parmi les 4, soit pour l'agrandir, car elle vous plaît telle quelle, soit pour obtenir de nouvelles variations, Midjourney générera alors un nouveau message.

Vous pouvez de nouveau demander plus de variations. La recherche devient dès lors, quasi sans fin.

Enfin, pour récupérer votre image, il vous suffit de cliquer sur l'image et sur afficher l'original. Vous pouvez à ce stade la glisser sur votre ordinateur.

En cliquant sur Max Upscale, vous obtiendrez des fichiers qui font, à ce jour, 1600px X 1600px en moyenne.

📐 Il existe néanmoins des solutions externes pour aller au delà de cette taille sans perte de définition :

À tout moment, vous pouvez retrouver vos recherches, ainsi que vos prompts textuels, dans votre tableau de bord, ou tout y est archivé et disponible.

🔹 Nouvelle bêta

En cette fin de mois d'août, Midjourney propose déjà une nouvelle bêta, qui va beaucoup plus loin avec des photos plus réalistes et les résultats sont bluffants !

images de © Jim Clyde Monge

Remasterisez vos créations

Et il est possible de tester cette nouvelle bêta sur vos anciennes réalisations.

En pratique :

  • Rendez-vous dans votre tableau de bord Midjourney et dans Archives
  • Une fois que vous avez trouvé l'image que vous souhaitez remasteriser, cliquez sur les 3 petits points et sur Copy Job ID
  • Rendez-vous sur un salon et tapez la commande /show et sélectionnez la commande show job_id puis collez votre id
  • Dans ce nouveau message se trouvera le bouton Remaster
  • L'IA vous générera cette fois 2 variations avec plus de détails.
  • Vous pourrez choisir, soit de l'upscale, soit de continuer une série de variations.

Autres exemples d'améliorations :


⚖️ Pouvez-vous vendre ces oeuvres ?

Si vous utilisez un compte gratuit sur Midjourney, vous bénéficiez d'une licence internationale Commons Noncommercial 4.0 Attribution, ce qui signifie que vous pouvez utiliser les images tant que vous ne les vendez pas ou ne gagnez pas d'argent avec et tant que vous créditez Midjourney.

Si vous avez un plan payant, la société affirme que :

"Vous êtes fondamentalement propriétaire de tous les actifs que vous créez en utilisant les services de génération d'images et de chat de Midjourney".

L’entreprise précise également que vous accordez à Midjourney une :

"licence de droit d'auteur perpétuelle, mondiale, non exclusive, sous-licenciable, gratuite et irrévocable pour reproduire, préparer des œuvres dérivées, afficher publiquement, exécuter publiquement, accorder des sous-licences et distribuer les textes et les images que vous saisissez dans les services, ou les actifs produits par le service selon vos instructions ».

En d'autres termes, même si vous "créez" une nouvelle œuvre d'art, et que vous disposez de tous les droits d'utilisation, Midjourney conserve également sa propre licence d'utilisation de vos œuvres, y compris la sous-licence.

L'autre particularité est que "Midjourney est une communauté ouverte, qui permet aux autres d'utiliser vos prompts en les remixant dès lors que vous publiez dans un salon public.

Un autre utilisateur peut utiliser votre image comme base pour sa propre expérimentation, et créer des œuvres dérivées qui sont extrêmement similaires aux "vôtres"."

Nous pourrons donc avoir une situation où deux personnes ont véritablement créé une image qu'elles pensaient être leur original, mais se retrouveront accidentellement avec des visuels extrêmement proches.

Il y a également le cadre du plagiat et du droit d'auteur avec des oeuvres générées qui s’inspireront fortement d’un style d’artistes, comme Banksy, beeples qu'il faudra suivre de près.

Du côté de Dall-E 2, même positionnement :

"Vous pouvez utiliser toutes les images que vous générez à toutes fins commerciales."

👊 Deux cas d'études

lW3M

C’est avec MidJourney que nous avons créé notre collection NFTs (toujours en cours de création et non destinée à la vente) et qui permet à nos abonnés lW3M de s’authentifier sur notre Discord !

Nous avons tout d'abord pensé quelques mots-clés : Musical Explorer, Space, New World, New dimension, Spaceship, Galaxy, Retro Style etc et après plusieurs tentatives dans nos formulations, nous avons enfin trouvé notre style et généré ce type d’images :

Les résultats sont de suites assez spectaculaires ! Et la première chose que je me suis dite honnêtement, c'est :

"Pu#@/, c'est de vraies pochettes d'albums!"

Les résultats sont de suite très artistiques, et même assez poétiques.

De plus, le fait de garder les mêmes réglages nous a permis de créer une collection cohérente graphiquement, comme si c'était la patte d'un seul et même artiste !

Nul doute que de nombreux artistes s'en serviront pour créer leur artwork de single ou d'album !

———

BEATSHMOO

Shmoolik est un artiste multi-talents et accessoirement un ami 💙

Designer de métier, il est aussi artiste peintre, producer, rappeur et beatmaker.

Il était donc intéressant de voir comment un artiste, qui à l'habitude de créer de ses mains, l'ensemble de ses oeuvres auditives et graphiques, allait intégrer ces IA dans son process créatif et comment il les a accueilli.

Et ça tombe bien parce qu'il sort un projet qui rassemble à la fois l'utilisation de ces IA, la création musicale et le Web3 avec une sortie en NFT !

🎙️
Interview de Shmoolik

Quel a été ta première réaction lorsque tu as découvert ces IA ?
Bluffé !

Comme tout le monde je me suis demandé comment cela était possible et puis en faisant mes recherches autour de la AI j'ai vite compris que cette technologie prenait d'assaut bon nombre de secteur, comme la musique et qu'on était dans une suite logique des choses qu'il ne faut surtout pas rater.

Est-ce que tu t’es senti en danger ou remplacé ?
Pas du tout !

Au contraire j'utilise déjà ces atouts pour créer davantage et me permettre d'aller plus loin dans ma recherche et mes propositions.

Il ne faut pas confondre skills et vision.

"La AI est pour les visionnaires."

Est ce que tu penses utiliser Dall-e ou Midjourney et comment, en tant que designer, tu comptes intégrer ces IA dans ton procès créatif ?
Avec la AI, je peux rapidement obtenir une direction qui correspond a une idée encore abstraite.

J'utilise ensuite l'image générée comme tout autre "asset" graphique pour réaliser mes montages visuels et obtenir des résultats innovants et improbables.

J'adore !

Tu peux nous parler de ce projet qui allie donc beatmaking, univers graphique Star Waresque et NFT's ?
En faisant mes créas sur Midjourney, je me suis amusé avec des icônes de pop culture pour voir ou cela me mènerait et découvrir peut-être quelque chose de nouveau.

Et en bon fan de Star War, j'ai eu l'idée de jouer avec les visuels des vaisseaux du film.

Les résultats m'ont tellement inspiré que je me suis mis a imaginer une bande son qui accompagnerait l'image.

J'ai allumé mon sampler et j'ai composé la musique avec le visuel comme model. Le 1er track se nomme MILLENNIUM FALCON et d'autre spacebeat arrivent tout prochainement!

Ça faisait longtemps que je cherchais le bon projet pour sortir des sons en NFTs, tout coïncidait enfin !

J'invite donc tout le monde à aller checker tout ça sur Opensea !


1. L'Artwork

Après plusieurs recherches, c'est avec ce prompt qu'il générera l'artwork qu'il retravaillera ensuite sur Photoshop :

"A cinematographic scene of the Star Wars Millennium Falcon in the middle of the street of Manhattan with a curious crowd around."

2. Le Son

Dans la pure tradition du beatmaking, le titre est Hip Hop, avec beaucoup de matière et de layers pour donner une impression d'apesanteur totale.

audio-thumbnail
Beatshmoo Millenium Falcon
0:00
/3:40

3. Le NFT

La musique fut assemblée au design pour obtenir une oeuvre totalement unique, frappée dans la blockchain et disponible en NFT sur Opensea!

💎
226 NFTs seront disponibles gratuitement progressivement, n'hésitez à revenir sur la page de la collection 🔥

🔵 D'autres solutions arrivent déjà

Dans l'ombre de ces deux grosses solutions, Disco Diffusion est une alternative qui a le mérite d'être totalement gratuite, même si bien plus austère au niveau de son interface.

🔹 Disco Diffusion

Il s'agit d'un générateur texte-art très performant, comparable à MidJourney, orienté peinture mais entièrement gratuit.

Disco Diffusion est un petit logiciel écrit en Python et destiné à fonctionner dans Google Colab.

Vous pouvez l'utiliser pour créer des œuvres d'art et également des vidéos générées par l'IA.

Comment ça marche ?

Tout se passe dans le navigateur, vous n'avez donc besoin que des trois éléments :

  • Un navigateur (Chrome de préférence)
  • Un compte Google
  • Un compte GoogleDrive

1. Accéder à l'outil Google Colab

Vous pouvez accéder à l'outil ici.

2. Ajoutez votre prompt

Développez l'étape Paramètres (3) pour révéler les sous-réglages.

Dans la section "Prompt", changez le prompt avec ce que vous voulez que l'outil peigne.

Appuyer sur le petit bouton play pour exécuter le code.

🔹 App online ou mobile

Mais d'autres ont évidemment vu le potentiel commercial et plusieurs app voient déjà le jour avec des résultats plus ou moins convainquant.

🔹 TikTok intègre son IA graphique

TikTok Brings Basic AI-Generated Art to the Masses
TikTok’s bringing AI-image generation to the masses.

CONCLUSION

Est-ce que cette technologie va mettre les artistes au chômage ou en danger ?

OpenAI a été très prudent quant à la diffusion de sa technologie au monde entier.

Mais la boite de Pandore est à présent ouverte.

Le monde des arts visuels va irrémédiablement changer, mais selon moi, cela ne signifie pas pour autant, la mort des artistes.

Cette technologie met juste le pouvoir de générer de l'art entre les mains de tout le monde.

L’expression artistique ne passera plus obligatoirement par la maîtrise d'une exécution technique mais aussi par notre capacité à formuler notre imaginaire ou notre vision.

Alors, il est évident qu’aucun artiste ne pourra rivaliser dans le cadre d'une production à grande échelle avec une machine capable de générer une oeuvre en quelques secondes et les initiatives commerciales vont forcément voir le jour.

On trouve déjà plusieurs offres sur Fiverr de freelancers qui se proposent de réaliser votre oeuvre sur ces IA.

Un marketplace a même déjà vu le jour où il est possible d'acheter des prompts!

Mais il y aura toujours des gens qui souhaiteront acheter de l’art créé spécifiquement par des hommes, qui ont des choses à dire et une identité visuelle unique au travers de laquelle ils s’expriment.


  • Vous avez aimé cet article ? Partagez-le 🚀
  • Vous souhaitez nous supporter et accéder aux articles premiums, ainsi qu'à notre Discord ? Abonnez-vous 🧡

Pour aller plus loin

Bonus de lecture