DALL-E 2 vs Midjourney vs Canva: Welche KI erstellt die besseren „Text to Image“ Bilder?
Als ich vor ca. einem Monat meinen Chat GPT Erfahrungsbericht hier auf dem Blog veröffentlicht habe, habe ich mir auch gleich die „Text to Image“ Software DALL-E 2 angeschaut, die ebenfalls auf der Open.ai Website zur Verfügung gestellt wird. In diesem Blogbeitrag möchte ich heute von meinen Erfahrungen berichten. Es geht dabei um folgende Punkte:
- Wie ihr DALL-E 2 ausprobieren und konkrete Textvorgaben (= Prompts) in Bilder umwandeln könnt
- Wie ihr den DALL-E 2 Konkurenten Midjourney ausprobieren könnt
- Welche Bilder die in Canva integrierte KI aus Texten produziert
- Allgemeine Tipps zur Erstellung von KI-generierten Bildern mithilfe von Prompts
- Mein Fazit
DALL-E 2: So könnt ihr die beliebte KI zum Erstellen von Bildern ausprobieren
Falls ihr gerne mal ausprobieren möchtet, wie das Erstellen von Bildern aus Texten funktioniert, aber nicht wisst, wie ihr anfangen sollt, habe ich nun eine einfache Schritt-für-Schritt Anleitung für euch. Öffnet den Link zu DALL-E 2 unten auf der Open AI Website:
Nachdem ihr euch über den „Sign Up“ Link registriert habt, könnt ihr auch schon loslegen. Das heißt: Ihr gebt eine möglichst konkrete Beschreibung des von euch gewünschten Bildes in das Textfeld ein und bestätigt die Eingabe mit der „Generate“ Taste.
Den Text könnt ihr sowohl auf Englisch, als auch auf Deutsch eingeben. Eurer Fantasie sind keine Grenzen gesetzt. Hier seht ihr einige Beispiele für die Umsetzung von Texten: „3D render of a cute tropical fish in an aquarium on a dark blue background, digital art“:
So sieht die Interpretation meiner Eingabe: „Young Harry Potter chilling in cinque terre digital art“ aus. Erschreckend genial, oder?
Und so das Ergebnis des Prompts: „Ein Panda fährt mit einem Fahrrad durch eine Stadt mit Tiefenschärfe“, den ich weiter unten für einen direkten Vergleich auch in die Programme von Midjourney und Canva eingegeben habe.
Darf man mit DALL-E erstellte Bilder für eine kommerzielle Nutzung verwenden? Auf der open.ai Website habe ich dazu folgende Information gefunden: Vorbehaltlich der Inhaltsrichtlinien und -bedingungen sind Sie Eigentümer der Bilder, die Sie mit DALL-E erstellen, einschließlich des Rechts, diese nachzudrucken, zu verkaufen und zu vermarkten – unabhängig davon, ob ein Bild durch einen kostenlosen oder bezahlten Credit erstellt wurde.
Midjourney: So könnt ihr die DALL-E 2 Alternative zum Erstellen von Bildern testen
Nachdem ich total begeistert von DALL-E 2 war, habe ich auf Tiktok und Twitter immer häufiger gelesen, dass die Qualität der Bilder, die die künstliche Intelligenz Midjourney kreiert, noch viel besser sein soll. Das habe ich natürlich ebenfalls getestet.
Um Midjourney auszuprobieren, braucht ihr etwas mehr Geduld – das Programm lässt sich nämlich nur in Verbindung mit einem Discord Kanal aufrufen, was ich persönlich ziemlich unübersichtlich finde. Wie auch immer: Klickt zunächst auf diesen Link und dann auf Sign In. Ihr werdet nun automatisch zu einer Discord Seite weitergeleitet, auf der ihr euch anmelden bzw. einloggen könnt.
Nachdem ihr die Meldung „Eine externe Anwendung möchte auf deinen Discord Account zugreifen“ akzeptiert habt, kann es fast losgehen: Ihr klickt nun auf „Join the discord to start creating“ und akzeptiert dann die Meldung: „Du wurdest eingeladen beizutreten“.
Dann: Links in der Spalte eine Newbie Gruppe in einem Newcomer Room auswählen (z.B. newbies-7) und rechts unten ins Textfeld: /imagine tippen und mit Enter bestätigen.
Nun in das promt Feld einen beliebigen Text eingeben, der das zu erstellende Bild möglichst genau beschreibt, wie z.B.: „Ein Panda fährt mit einem Fahrrad durch eine Stadt mit Tiefenschärfe“. Das Ergebnis hat mich dann tatsächlich kurz sprachlos gemacht:
Jetzt könnt ihr das Bild, das euch am besten gefällt, noch „upscalen“, also auf das Format 1024 x 1024 Pixel hochrechnen, indem ihr U1, U2, U3 oder U4 eingebt. Durch die Eingabe von V1, V2, V3 und V4 erstellt ihr 4 neue Variationen des ausgewählten Bildes.
Wenn ihr in Ruhe arbeiten möchtet, ist es sinnvoll, einen neuen Server zu erstellen und den Midjourney Bot einzuladen.
Hierfür erst in der linken Spalte auf das Plus klicken und einen neuen Sever erstellen, dann rechts oben den midjourney Bot suchen, anschließend den Bot im Feld in der Mitte anklicken und „dem Server hinzufügen“ auswählen, den erstellten Server auswählen und den Zugriff bestätigen. Weitere Infos findet ihr hier auf der Midjourney Seite.
Darf man mit Midjourney erstellte Bilder für eine kommerzielle Nutzung verwenden? Auf der open.ai Website habe ich dazu folgende Information gefunden: General commercial terms ab 8 Dollar/ Monat.
Wie gut ist die in Canva integrierte „Text to Image“-KI?
Die Grafikdesign-Plattform Canva ist zu Recht wahnsinnig beliebt, weil sie Laien die Möglichkeit bietet, innerhalb von Sekunden professionelle Designs – vom Instagram Post bis zum Plakat fürs Schulfest – zu erstellen. Nun habe ich zufällig entdeckt, dass es auf Canva bereits eine Funktion gibt, um Texte in Bilder umzuwandeln. Diese findet ihr, wenn ihr ein Dokument öffnet, in der Seitenleiste links nach unten zum Punkt „Apps“ scrollt und hier „Text to Image“ auswählt.
Das Ergebnis des Prompts „Ein Panda fährt mit einem Fahrrad durch eine Stadt mit Tiefenschärfe“ ist… bestenfalls lustig:
Allgemeine Tipps zur Erstellung von KI-generierten Bildern mithilfe von Prompts:
Die Qualität des Textes (Prompts), den ihr in das Programm eintippt, entscheidet über die Qualität des Ergebnisses. Beispiele für Anweisungen sind:
- Ganzkörperporträt
- Im Stil von: Van Gogh, Monet
- Ölmalerei, Manga, Bleistiftzeichnung
- episch, fotorealistisch, SciFi, ultra detailliert, schön, unreal
- dramatische Beleuchtung
- Ultra HD
- 3 D
- 35 mm Film
Außerdem lesenswert zum Thema kommerzielle Verwendung von KI-Bildern:
- Wo kommen die Bilder eigentlich her?
- Und was ist mit dem Copyright?
In den Texten geht es darum, dass das Urheberrecht von KI generierten Bildern unter Umständen nicht eindeutig geklärt ist, da die KI zu Trainingszwecken mit realen Bildern aus Archiven bzw. Bilddatenbanken gefüttert wurde, die dann zwar abgewandelt werden, unter Umständen aber noch viele original Bilddateien enthalten. Besonders bei Bildern, auf denen Personen abgebildet sind, ist aus meiner Sicht Vorsicht geboten.
Mein Fazit:
Die Entwicklung der KI-Technologie ist insgesamt absolut faszinierend. Die Ergebnisse von Midjourney sind qualitativ definitiv am besten, gefolgt von DALL-E auf Platz 2. Die KI von Canva steckt noch in den Kinderschuhen und überzeugt mich nicht. Der große Nachteil von Midjourney ist die Nutzung über Discord. Das ist gerade für Anfänger ziemlich verwirrend.
Da die Benutzeroberfäche von DALL-E 2 übersichtlich und anwenderfreundlich gestaltet ist, würde ich euch daher insgesamt DALL-E 2 empfehlen, wenn ihr einfach mal in das Thema „Text to Image“ hineinschnuppern möchtet. Für Profis ist Midjourney die beste Wahl.
So, nun hoffe ich, dass euch der Beitrag gefallen hat und freue mich wie immer sehr über euer Feedback.
Viele Grüße,
Hier gibt es die passende Vorlage für eure Pinterest Pinnwand:
Meine Ergebnisse beim Testen der verschiedenen Generatoren waren ähnlich. Ich schwöre auf Midjourney :).
Viele Grüße,
Sonja
Hi, ich habe gerade auch ein wenig ausprobiert.
Für mich ist Canvas der Sieger. Kommt halt auf den „Prompt“ an.
https://www.canva.com/design/DAFAN4ycOGs/8wXxG-N9yXDSYbhVlAiw2A/edit?utm_content=DAFAN4ycOGs&utm_campaign=designshare&utm_medium=link2&utm_source=sharebutton
(2 Bilder mit Prompt der in Midjourney gut funktioniert hat)
Gruß Frank.
Das mag ja alles faszinierend und irgendwie cool sein, aber was ist mit den richtigen Künstlern. Leider passiert es schon das KI generierte Bilder verkauft werden oder in Museen landet oder zu Wettbewerben eingereicht werden. Ich finde das sehr kritisch. Menschen die mit ihrer echten Kunst ihren Lebensunterhalt bestreiten bekommen echte Probleme.
LG Dani
Liebe Dani,
ich verstehe deinen Gedanken – aber: Wie soll man die Entwicklung stoppen? Was ist mit Programmierern, deren Arbeit in Sekunden von der KI übernommen wird? Was ist mit Fabrikarbeitern, deren Aufgaben schon vor Jahrzehnten von Maschinen übernommen wurden? Ich denke, man muss lernen MIT den neuen Entwicklungen zu arbeiten. Anders geht es nicht.
Viele Grüße,
Patricia
Hatte relativ lange an Dalle festgehalten, aber ein paar Midjourney Anleitungen aufgenommen und direkt gewechselt. Mittlerweile verwende ich fast nur noch MJ.