OpenAI kündigt wichtiges Update zur KI-Bildgenerierung in ChatGPT an

OpenAI hat kürzlich offiziell ein bemerkenswertes Upgrade der KI-Bildgenerierungsfunktion in ChatGPT vorgestellt. Dies ist ein wichtiger Schritt, um ein separates Bildgenerierungsmodell wie das vorherige DALL-E zu ersetzen. Diese neue Funktion wurde direkt in GPT-4o integriert und bringt bemerkenswerte Verbesserungen mit sich.

Inhärente Einschränkungen überwinden

Viele aktuelle KI-Modelle zur Bildgenerierung können zwar beeindruckende künstlerische Bilder erstellen, haben aber oft Schwierigkeiten mit Elementen wie Text, Logos und Alltagsgegenständen. OpenAI behauptet, dass sein neuer GPT-4o diese Einschränkungen überwinden kann, indem er:

  • Text richtig anzeigen
  • Halten Sie sich strikt an die Benutzeranforderungen
  • Nutzen Sie Hintergrundwissen und Gesprächskontext
  • Ermöglicht die Bearbeitung hochgeladener Fotos oder die Erstellung neuer Fotos basierend auf Originalfotos
  • Weit verbreitet

Diese neue Funktion wird derzeit für ChatGPT Free-, ChatGPT Plus-, Pro- und Team-Nutzer eingeführt und wird in den kommenden Wochen auch für ChatGPT Enterprise und Edu verfügbar sein. Es wird das Standard-Tool zur Bilderstellung in ChatGPT sein und ermöglicht Nutzern einen einfachen Zugriff ohne zusätzliche Optionen. Nutzer können Bilder anpassen mit:

  • Spezifisches Seitenverhältnis
  • Genaue Farbe (mit Hex-Code)
  • Transparenter Hintergrund
  • Multiplattform-Unterstützung

OpenAI kündigt wichtiges Update zur KI-Bildgenerierung in ChatGPT an

Zusätzlich zu ChatGPT wird diese Funktion auch auf Plattformen wie Sora (Bildgenerierung), dediziertem DALL·E GPT und GPT-4o API (für Entwickler, Start in den kommenden Wochen) verfügbar sein.

Trotz der vielen versprochenen Verbesserungen weist das neue Modell noch einige Einschränkungen auf:

  • Die Bildgenerierungszeit kann aufgrund der hohen Detailgenauigkeit bis zu 1 Minute betragen
  • Unerwünschtes Zuschneiden bei vertikalen Fotos
  • Manchmal werden Informationen „erfunden“, ohne dass ein Kontext erforderlich ist.
  • Schwierigkeiten, mehr als 10–20 Konzepte gleichzeitig zu verarbeiten
  • Schwierigkeiten mit nicht-lateinischen Sprachen
  • Detaillierte Korrekturen (wie Rechtschreibfehler) sind nicht sehr effektiv
  • Bei kleinen Größen ist es schwierig, detaillierte Informationen anzuzeigen

Alle von GPT-4o generierten Bilder enthalten C2PA-Metadaten, die eine Herkunftsüberprüfung mit den internen Tools von OpenAI ermöglichen.

Trotz einiger Einschränkungen verspricht GPT-4o präzisere und individuellere Bilder. OpenAI kündigt an, das Modell in den kommenden Monaten weiter zu verbessern und so neue Möglichkeiten für die KI-gestützte Erstellung visueller Inhalte zu eröffnen.

Mit diesem wichtigen Update baut OpenAI seine Führungsposition im Rennen um kreative KI weiter aus und bietet Benutzern auf mehreren Plattformen ein nahtloseres und leistungsfähigeres Erlebnis.

Sign up and earn $1000 a day ⋙

Leave a Comment

Neueste Genshin Impact Codes April 2025

Neueste Genshin Impact Codes April 2025

Mit dem Genshin Impact 5.5-Code können Sie Ursteine, magische Mineralien, Erfahrung und viele andere Belohnungen eintauschen.

So verwandeln Sie Ihr iPad in ein zusätzliches Mac-Display

So verwandeln Sie Ihr iPad in ein zusätzliches Mac-Display

macOS Catalina und iPadOS unterstützen eine neue Funktion namens Sidecar, mit der Sie Ihr iPad als Zweitdisplay für Ihren Mac verwenden können.

Wallpaper 1280, schönes Nokia 1280 Handy-Wallpaper

Wallpaper 1280, schönes Nokia 1280 Handy-Wallpaper

Dies ist ein Satz von Nokia 1280-Hintergrundbildern. Wenn Sie schon einmal eine SMS geschrieben haben, um 1280-Hintergrundbilder oder Ziegelstein-Telefon-Hintergrundbilder zu erhalten, dann schauen Sie sich diese Hintergrundbilder an.

Hyperschall-Raumflugzeug erreicht Geschwindigkeit von 11.115 km/h

Hyperschall-Raumflugzeug erreicht Geschwindigkeit von 11.115 km/h

Venus Aerospace hat die ersten Bilder seines neuen Hyperschallflugzeugs namens Stargazer veröffentlicht, das eine Höchstgeschwindigkeit von 11.115 km/h erreichen kann, was Mach 9 entspricht.

Bananen zum Frühstück helfen, Blähungen zu reduzieren

Bananen zum Frühstück helfen, Blähungen zu reduzieren

Blähungen können jeden treffen. Die gute Nachricht: Das Frühstück ist ein guter Zeitpunkt, um Ihrer Mahlzeit ein paar Zutaten hinzuzufügen, die Blähungen vorbeugen können. Diese Zutat sind Bananen.

OpenAI kündigt wichtiges Update zur KI-Bildgenerierung in ChatGPT an

OpenAI kündigt wichtiges Update zur KI-Bildgenerierung in ChatGPT an

OpenAI hat gerade offiziell ein bemerkenswertes Upgrade der KI-Bildgenerierungsfunktion in ChatGPT eingeführt, ein wichtiger Schritt nach vorne im Vergleich zur Verwendung eines separaten Bildgenerierungsmodells wie beim vorherigen DALL-E.

Deepseek veröffentlicht Free Language Model v3, das auf gängigen Hardwarekonfigurationen gut läuft

Deepseek veröffentlicht Free Language Model v3, das auf gängigen Hardwarekonfigurationen gut läuft

Das chinesische KI-Startup DeepSeek hat gerade offiziell sein neuestes großes Sprachmodell (LLM), DeepSeek-V3-0324, veröffentlicht.

Gründe, Gboard aufzugeben und auf die Samsung-Tastatur umzusteigen

Gründe, Gboard aufzugeben und auf die Samsung-Tastatur umzusteigen

Gboard war lange Zeit die bevorzugte Tastatur auf Android-Handys. Viele Nutzer sind jedoch kürzlich auf die Samsung-Tastatur umgestiegen und haben es nie bereut.

Atemberaubende Bilder des Supermondes aus aller Welt

Atemberaubende Bilder des Supermondes aus aller Welt

Schöne Mondbilder sind im Internet keine Seltenheit. Dieser Artikel fasst für Sie die schönsten Mondbilder der Welt zusammen.

ChatGPT läuft möglicherweise unbemerkt auf Ihrem Telefon und wie Sie das Problem beheben können

ChatGPT läuft möglicherweise unbemerkt auf Ihrem Telefon und wie Sie das Problem beheben können

Hintergrundgespräche ermöglichen die Unterhaltung mit ChatGPT, während andere Apps genutzt werden oder der Bildschirm ausgeschaltet ist. ChatGPT kann das Telefonverhalten eines Benutzers rund um die Uhr überwachen.

Googles Gemini antwortet einigen Benutzern mit seltsamen, wiederholten unsinnigen Wörtern

Googles Gemini antwortet einigen Benutzern mit seltsamen, wiederholten unsinnigen Wörtern

Vor kurzem ist einigen Benutzern aufgefallen, dass Google Gemini in einigen Antworten sich wiederholenden Text, seltsame Zeichen und völligen Unsinn ausgibt.

Vollständiger Code von Luc Tung Tam Quoc aktuell und Anweisungen zum Einlösen des Codes

Vollständiger Code von Luc Tung Tam Quoc aktuell und Anweisungen zum Einlösen des Codes

Code Luc Tung Tam Quoc bietet neuen Spielern alles, was sie für den Beginn ihrer Reise brauchen.

Code Giang Ho Ngu Tuyet und wie man Code eingibt

Code Giang Ho Ngu Tuyet und wie man Code eingibt

Giang Ho Ngu Tuyet ist ein MMORPG-Spiel, das auf den fünf Elementen der gegenseitigen Erzeugung und Hemmung basiert. Mit 5 Sekten: Shaolin, Minh Giao, Vo Dang, Duong Gia, Thien Nhan basierend auf den fünf Elementen Metall, Holz, Wasser, Feuer, Erde.

MIUI 13-Hintergrundbild, MIUI 13-Hintergrundbild

MIUI 13-Hintergrundbild, MIUI 13-Hintergrundbild

MIUI 13-Hintergrundbilder mit vielen verschiedenen Hintergrundthemen von abstrakt bis Landschaft, kombiniert mit lebendigen und attraktiven Farben, aus denen der Benutzer auswählen kann.

So beheben Sie den Fehler „Ihr Viren- und Bedrohungsschutz wird von Ihrer Organisation verwaltet“

So beheben Sie den Fehler „Ihr Viren- und Bedrohungsschutz wird von Ihrer Organisation verwaltet“

Was müssen Sie tun, um den Fehler zu beheben? Ihr Viren- und Bedrohungsschutz wird von Ihrer Organisation verwaltet?