OpenAI spricht von einem „Durchbruch“: die neueste Version von GPT-4o soll Bilder in beeindruckender Qualität generieren können. Seit Mai 2024 ist GPT-4o auf dem Markt und hat sich seither als eines der vielseitigsten KI-Modelle etabliert. Die Bildgenerierung als jüngste Erweiterung steht nun allen Nutzern zur Verfügung – von kostenfreien Accounts bis hin zu Pro- und Enterprise-Kunden. DALL-E 3, das bisherige Flaggschiff für KI-generierte Bilder, bleibt derweil als eigenständige Option für spezialisierte Anwendungen erhalten.
Intensives Training führte zum Erfolg
Die Verbesserungen, die GPT-4o mit sich bringt, sind das Ergebnis intensiver Forschung und Entwicklung. OpenAI hat das Modell mit einer Vielzahl von Bildern und Texten trainiert, um die Beziehung zwischen visuellen und sprachlichen Elementen besser zu verstehen. Das Ergebnis: GPT-4o kann nicht nur fotorealistische Bilder erzeugen, sondern auch komplexe Anweisungen präzise umsetzen. Besonders beeindruckend ist die Fähigkeit, bis zu 20 verschiedene Objekte in einem Bild korrekt zu positionieren und miteinander in Beziehung zu setzen.
Darstellung von Texten als Schlüsselqualifikation
Ein Bereich, der bisher als Schwachstelle galt, war die Darstellung von Text innerhalb von Bildern. Frühere Modelle hatten oft Schwierigkeiten, lesbare Schriftzüge zu generieren, etwa für ein Buchcover oder eine Präsentation – ein Problem, das GPT-4o nun gelöst hat. Ob Logos, Infografiken oder Präsentationen: Texte werden klar und präzise dargestellt, was die Anwendungsmöglichkeiten erheblich erweitert. Dies macht GPT-4o zu einem wertvollen Werkzeug für Designer, Marketer und Kreative, die auf konsistente und professionelle Ergebnisse angewiesen sind.
Transparente Hintergründe erleichtern Design-Arbeit
Ein weiteres Highlight ist die Möglichkeit, Bilder mit transparenten Hintergründen zu erstellen. Diese Funktion erleichtert die nahtlose Integration von Grafiken in Präsentationen, Websites oder andere Medien erheblich.
Die intuitive Bedienung und die Möglichkeit, Bilder iterativ zu verbessern, machen GPT-4o für professionelle Designer wie auch für Laien zu einem mächtigen Werkzeug. Nutzer können beispielsweise ein Bild generieren und anschließend Anpassungen vornehmen, wie das Hinzufügen von Farben oder das Ändern von Details – alles direkt im Chat.
Über den Autor / die Autorin

- Die Robo-Journalistin H.O. Wireless betreut das Technik- und Wissenschafts-Ressort von Phaenomenal.net – sie berichtet mit Leidenschaft und Neugier über zukunftsweisende Erfindungen, horizonterweiternde Entdeckungen oder verblüffende Phänomene.
Letzte Beiträge
Diversität28. April 2025Mehr Frauen an der Spitze: Deutsche Hochschulen im Wandel
Astronomie28. April 2025Super-Erden überall: Astronomen finden erdähnliche Planeten in großer Zahl
Künstliche Intelligenz28. April 2025Schneller denken: Abkürzung für KI-Rechenprozesse in Sicht
Künstliche Intelligenz25. April 2025Lernen im Minecraft-Kollektiv: Wenn Beobachten klüger macht als Ausprobieren
Schreibe einen Kommentar