Home
» Gewusst wie
»
Google Labs veröffentlicht Whisk: Ein Tool, mit dem Sie Bilder als Anweisungen anstelle von Textaufforderungen hochladen können
Google Labs veröffentlicht Whisk: Ein Tool, mit dem Sie Bilder als Anweisungen anstelle von Textaufforderungen hochladen können
KI-basierte Bilderzeugungstools begeistern uns seit Jahren – dank OpenAI, Imagen, Adobe Firefly, DALL-E-3 und anderen. Mit dem technologischen Fortschritt haben wir immer mehr Möglichkeiten, unsere Ergebnisse zu verfeinern. Google Labs hat nun Whisk veröffentlicht, ein Tool, mit dem Sie Bilder als Anweisungen anstelle von Textanweisungen hochladen können.
Whisk von Google Labs erstellt Bilder aus anderen Bildern
Wenn Sie in den USA leben, haben Sie jetzt Zugriff auf Whisk von Google Labs, ein „generatives KI-Experiment“, wie es im Google-Blog heißt. Mit Whisk können Sie Bilder als Referenzen hinzufügen, anstatt sich ausschließlich auf eine beschreibende Texteingabe zu verlassen. Die Plattform fragt nach drei Hauptmerkmalen: Motiv, Szene und Stil. Das Tool fügt diese Elemente dann zusammen und erstellt das perfekte Bild für Sie.
Hinweis : Whisk verwendet Imagen 3, das neueste Bildgenerierungsmodell von Google.
Google hat die Texteingabe mit Whisk nicht vollständig abgeschafft. Sie haben weiterhin die Möglichkeit, für jede der drei Kategorien eine Bildeingabe zu verfassen oder eine allgemeine Anmerkung hinzuzufügen. Sie können das Bild auch nach dem ersten Test von Whisk optimieren. Nehmen wir beispielsweise an, Sie erstellen eine Vintage-Grußkarte mit einer Katze im Schnee. Nachdem Sie die Ergebnisse gesehen haben, könnten Sie versucht sein, Schneeflocken hinzuzufügen, um den Look zu vervollständigen.
Jedes Mal, wenn Sie in einer der drei Kategorien von Whisk ein Bild hinzufügen oder erstellen, erstellt die Plattform eine detaillierte Textbeschreibung des Bildes. Wenn Sie also ein vorhandenes Bild hinzufügen oder bearbeiten möchten, müssen Sie lediglich den Text anpassen.
Textdialog auf der KI-Bildgenerierungsplattform Whisk ermöglicht die automatische Bearbeitung von Texteingabeaufforderungen
Wenn Ihnen die Inspiration fehlt, können Sie Ihre visuellen Elemente durch die Auswahl eines Würfelsymbols zufällig anordnen. Für komplexere Kreationen können Sie auch mehrere Themen, Szenen oder Stilreferenzen hinzufügen.
Wenn Sie mit Ihrem Meisterwerk zufrieden sind, können Sie es auf der Plattform speichern oder für den lokalen Zugriff herunterladen.
Lohnt es sich, Whisk zu verwenden?
Angesichts all der fortschrittlichen KI-basierten Bildbearbeitungsoptionen zur Verbesserung von Fotos oder zur Erstellung origineller Kunstwerke mag Googles neues Tool wie eine Spielerei erscheinen. Doch die Art und Weise, wie Whisk visuelle Referenzen im Bildbearbeitungsprozess nutzt, ist einzigartig und kann in kreativen und professionellen Situationen von großem Nutzen sein.
Angenommen, Sie arbeiten an einem Pitch Deck und benötigen Bilder, die einer vorhandenen Referenz ähneln. Anstatt zu versuchen, diese Referenz verbal zurückzuentwickeln, laden Sie einfach die Datei zusammen mit einer kurzen Textbeschreibung hoch, inwiefern sich Ihr neues Bild unterscheiden soll.
Um Whisk von anderer bestehender KI-Visualisierungssoftware abzugrenzen, hat Google klargestellt, dass die Plattform auf Exploration und nicht auf Verfeinerung ausgelegt ist. Während andere Produkte möglicherweise besser für die Feinabstimmung geeignet sind, eignet sich Whisk am besten für Brainstorming:
„Wir haben es für die schnelle visuelle Erkundung entwickelt, nicht für die pixelgenaue Bearbeitung. Bei Whisk geht es darum, Ideen auf neue und kreative Weise zu erkunden, Sie mit Dutzenden von Optionen spielen und Ihre Favoriten herunterladen zu lassen.“
Ehrlich gesagt ist es manchmal schwer, Dinge mit Worten zu beschreiben. Whisk eröffnet neue Möglichkeiten, wenn Sie einfach möchten, dass ein Bild so aussieht.