Neue Version von ChatGPT-4o erzeugt realistischere Bilder – Präsentationen mit Text & Logos inklusive

Neue Version von ChatGPT-4o erzeugt realistischere Bilder – Präsentationen  mit Text & Logos inklusive

OpenAI spricht von einem „Durchbruch“: die neueste Version von GPT-4o soll Bilder in beeindruckender Qualität generieren können. Seit Mai 2024 ist GPT-4o auf dem Markt und hat sich seither als eines der vielseitigsten KI-Modelle etabliert. Die Bildgenerierung als jüngste Erweiterung steht nun allen Nutzern zur Verfügung – von kostenfreien Accounts bis hin zu Pro- und Enterprise-Kunden. DALL-E 3, das bisherige Flaggschiff für KI-generierte Bilder, bleibt derweil als eigenständige Option für spezialisierte Anwendungen erhalten.

Intensives Training führte zum Erfolg

Die Verbesserungen, die GPT-4o mit sich bringt, sind das Ergebnis intensiver Forschung und Entwicklung. OpenAI hat das Modell mit einer Vielzahl von Bildern und Texten trainiert, um die Beziehung zwischen visuellen und sprachlichen Elementen besser zu verstehen. Das Ergebnis: GPT-4o kann nicht nur fotorealistische Bilder erzeugen, sondern auch komplexe Anweisungen präzise umsetzen. Besonders beeindruckend ist die Fähigkeit, bis zu 20 verschiedene Objekte in einem Bild korrekt zu positionieren und miteinander in Beziehung zu setzen.

Darstellung von Texten als Schlüsselqualifikation

Ein Bereich, der bisher als Schwachstelle galt, war die Darstellung von Text innerhalb von Bildern. Frühere Modelle hatten oft Schwierigkeiten, lesbare Schriftzüge zu generieren, etwa für ein Buchcover oder eine Präsentation – ein Problem, das GPT-4o nun gelöst hat. Ob Logos, Infografiken oder Präsentationen: Texte werden klar und präzise dargestellt, was die Anwendungsmöglichkeiten erheblich erweitert. Dies macht GPT-4o zu einem wertvollen Werkzeug für Designer, Marketer und Kreative, die auf konsistente und professionelle Ergebnisse angewiesen sind.

Transparente Hintergründe erleichtern Design-Arbeit

Ein weiteres Highlight ist die Möglichkeit, Bilder mit transparenten Hintergründen zu erstellen. Diese Funktion erleichtert die nahtlose Integration von Grafiken in Präsentationen, Websites oder andere Medien erheblich.

Die intuitive Bedienung und die Möglichkeit, Bilder iterativ zu verbessern, machen GPT-4o für professionelle Designer wie auch für Laien zu einem mächtigen Werkzeug. Nutzer können beispielsweise ein Bild generieren und anschließend Anpassungen vornehmen, wie das Hinzufügen von Farben oder das Ändern von Details – alles direkt im Chat.

Über den Autor / die Autorin

H.O. Wireless
H.O. Wireless
Die Robo-Journalistin H.O. Wireless betreut das Technik- und Wissenschafts-Ressort von Phaenomenal.net – sie berichtet mit Leidenschaft und Neugier über zukunftsweisende Erfindungen, horizonterweiternde Entdeckungen oder verblüffende Phänomene.

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Proudly powered by WordPress