Google kündigt Gemini Robotics an, ein für Roboter optimiertes Modell Gemini 2.0

Google DeepMind hat im Bereich der KI stetige Fortschritte erzielt und regelmäßig hochgelobte Updates für Gemini, Imagen, Veo, Gemma und AlphaFold veröffentlicht. Heute sorgt Googles KI-Team erneut für Schlagzeilen: Es gibt seinen offiziellen Einstieg in die Robotikbranche bekannt und stellt zwei neue Modelle auf Basis von Gemini 2.0 vor: Gemini Robotics und Gemini Robotics-ER.

Gemini Robotics: Fortschrittliches Vision-Language-Action-Modell

Gemini Robotics ist ein fortschrittliches Vision-Language-Action-Modell (VLA), das auf Gemini 2.0 aufbaut und physische Aktionen als neue Ausgabemethode zur Robotersteuerung hinzufügt. Google behauptet, dass dieses neue Modell Situationen verstehen kann, die es während des Trainings noch nicht einmal erlebt hat.

Im Vergleich zu anderen führenden VLA-Modellen schneidet Gemini Robotics bei umfassenden Generalisierungsbenchmarks doppelt so gut ab. Da es auf dem Gemini 2.0-Modell basiert, versteht es eine Vielzahl natürlicher Sprachen und somit menschliche Befehle präziser.

Google behauptet, dass Gemini Robotics komplexe, mehrstufige Aufgaben bewältigen kann, die präzises Manipulieren erfordern. So kann das Modell beispielsweise Origami falten oder Snacks in Ziploc-Beutel packen.

Gemini Robotics-ER: Ein visuell-sprachliches Modell mit Fokus auf räumlichem Denken

Gemini Robotics-ER ist ein fortschrittliches visuell-linguistisches Modell mit Fokus auf räumlichem Denken, das Robotikern die Integration in ihre bestehenden Low-Level-Controller ermöglicht. Mit diesem Modell verfügen Robotiker über alle Schritte zur sofortigen Robotersteuerung, einschließlich Wahrnehmung, Zustandsschätzung, räumlichem Verständnis, Planung und Codegenerierung.

Die Zukunft von Gemini Robotics

Google arbeitet mit Apptronik zusammen, um humanoide Roboter auf Basis der Gemini 2.0-Modelle zu bauen. Google arbeitet außerdem mit einer Reihe vertrauenswürdiger Testpartner zusammen, darunter Agile Robots, Agility Robotics, Boston Dynamics und Enchanted Tools, um die zukünftige Entwicklung von Gemini Robotics-ER voranzutreiben.

Indem Google DeepMind Robotern ermöglicht, komplexe Aufgaben mit größerer Genauigkeit und Anpassungsfähigkeit zu verstehen und auszuführen, ebnet es den Weg für eine Zukunft, in der sich Roboter nahtlos in viele Aspekte unseres Lebens integrieren können.

Sign up and earn $1000 a day ⋙

Leave a Comment

Google kündigt Android XR an, eine neue Betriebssystemplattform für AR- und VR-Brillen

Google kündigt Android XR an, eine neue Betriebssystemplattform für AR- und VR-Brillen

Nach Jahren der Vernachlässigung hat Google nun endlich beschlossen, seine Investitionen wieder auf Extended Reality (XR)-Geräte wie Headsets und Brillen zu konzentrieren.

5 Gründe, Google Gemini auszuprobieren

5 Gründe, Google Gemini auszuprobieren

Auch wenn die KI Gemini von Google nicht so viel Aufmerksamkeit erhält wie einige ihrer Konkurrenten, hat sie doch einiges zu bieten – und hier sind fünf Gründe, warum Gemini Ihre Aufmerksamkeit verdient.

Welcher Smartphone-Hersteller hat die besten Android-Updates?

Welcher Smartphone-Hersteller hat die besten Android-Updates?

Es gibt viele Android-Hersteller, aber nicht alle legen Wert auf Software-Updates. Obwohl sich die Situation in den letzten zehn Jahren verbessert hat, bieten nicht alle Smartphone-Hersteller einen hervorragenden Software-Support.

Googles Gemini antwortet einigen Benutzern mit seltsamen, wiederholten unsinnigen Wörtern

Googles Gemini antwortet einigen Benutzern mit seltsamen, wiederholten unsinnigen Wörtern

Vor kurzem ist einigen Benutzern aufgefallen, dass Google Gemini in einigen Antworten sich wiederholenden Text, seltsame Zeichen und völligen Unsinn ausgibt.

Google entfernt Gemini-Zugriff aus der Google-App für das iPhone

Google entfernt Gemini-Zugriff aus der Google-App für das iPhone

Die Google-App für das iPhone wird bald etwas weniger nützlich sein, da Google kürzlich den Zugriff auf Gemini AI aus dieser App entfernt hat.

Was passiert, wenn Sie Ihr Google-Konto verlieren?

Was passiert, wenn Sie Ihr Google-Konto verlieren?

Der Verlust des Zugriffs auf Ihr Google-Konto kann schwerwiegende Folgen haben, die über das Senden und Empfangen von E-Mails hinausgehen.

Google führt KI-Videoerstellungsfunktion auf Gemini ein

Google führt KI-Videoerstellungsfunktion auf Gemini ein

Google hat gerade angekündigt, dass Benutzer jetzt mithilfe des Chatbots Gemini und des kürzlich eingeführten experimentellen Tools Whisk Videos mithilfe künstlicher Intelligenz erstellen können.

Google entwickelt KI-Shopping-Tool, mit dem Benutzer Kleider und Hemden zu Hause anprobieren können

Google entwickelt KI-Shopping-Tool, mit dem Benutzer Kleider und Hemden zu Hause anprobieren können

Letztes Jahr hat Google in der Suche einen KI-gestützten Einkaufsassistenten eingeführt, der es Benutzern ermöglicht, sich eine visuelle Vorstellung davon zu machen, wie ein Kleidungsstück an einem bestimmten Körpertyp aussehen würde.

Google entwickelt KI-Algorithmus zur Diagnose von Hautkrankheiten und Tuberkulose

Google entwickelt KI-Algorithmus zur Diagnose von Hautkrankheiten und Tuberkulose

Google zeigt zunehmend Interesse am Einsatz künstlicher Intelligenz in der Medizin.

So aktivieren und verwenden Sie Google Assistant auf Chrome Android

So aktivieren und verwenden Sie Google Assistant auf Chrome Android

Google stellt seine alte Spracherkennungstechnologie schrittweise ein und ersetzt sie durch seinen virtuellen Assistenten Assistant.

Google kündigt 6 neue Funktionen für Android-Telefone an

Google kündigt 6 neue Funktionen für Android-Telefone an

Google hat heute sechs neue Funktionen für Android-Smartphones angekündigt.

Was ist das Datenschutz-Dashboard unter Android 12? Warum gilt es als Durchbruch für den Datenschutz?

Was ist das Datenschutz-Dashboard unter Android 12? Warum gilt es als Durchbruch für den Datenschutz?

Sicherheit und Datenschutz werden für Smartphone-Benutzer im Allgemeinen immer wichtiger.

ChatGPT-Suche oder Google ist besser?

ChatGPT-Suche oder Google ist besser?

Viele Leute versuchen schon seit langem herauszufinden, ob sie Google tatsächlich durch die Chrome-Erweiterung ChatGPT Search ersetzen können.

Google veröffentlicht Pixel-Update für Dezember, das größtenteils mit Gemini zusammenhängt

Google veröffentlicht Pixel-Update für Dezember, das größtenteils mit Gemini zusammenhängt

Dieses neueste Update führt Verbesserungen in Bezug auf die Kamera, Audio- und Videotools und vor allem Gemini, den KI-Assistenten von Google, ein.

9 nützliche Google-Apps, die auf Android-Telefonen nicht vorinstalliert sind

9 nützliche Google-Apps, die auf Android-Telefonen nicht vorinstalliert sind

Wenn Sie Google-Dienste mögen, können diese weniger bekannten Apps Ihrem Gerät einen überraschenden Mehrwert verleihen.

Vampir-Spatz: Seltsamer Vogel, der Blut trinkt, um zu überleben

Vampir-Spatz: Seltsamer Vogel, der Blut trinkt, um zu überleben

Vampirfinken leben seit 500.000 Jahren auf Darwin Island und Wolf Island (beide Teil der Galapagosinseln – Ecuador).

Wie hoch ist die Geschwindigkeit des Flugzeugs auf der Landebahn?

Wie hoch ist die Geschwindigkeit des Flugzeugs auf der Landebahn?

Auf Flughäfen gibt es keine Geschwindigkeitsbegrenzungen, da die Piloten anhand der Fluglinienverfahren und der Wetterbedingungen entscheiden, wie schnell das Flugzeug die Landebahn entlangfahren kann.

Lustiges Telefon-Entsperr-Hintergrundbild, tolles Troll-Entsperr-Hintergrundbild

Lustiges Telefon-Entsperr-Hintergrundbild, tolles Troll-Entsperr-Hintergrundbild

Suchen Sie nach lustigen Hintergrundbildern zum Entsperren Ihres Telefons? Schauen Sie sich die folgenden Hintergrundbilder an und wählen Sie selbst ein cooles Hintergrundbild zum Entsperren Ihres Telefons.

Brandbekämpfungscode: Neuestes Erbe und wie man den Code einlöst, um Belohnungen zu erhalten

Brandbekämpfungscode: Neuestes Erbe und wie man den Code einlöst, um Belohnungen zu erhalten

Beim Eintausch des Codes „Fire Annihilation: Heritage“ erhältst du Goldmünzen, EXP-Edelsteine, Edelsteine ​​und Heldenbeschwörungstickets sowie viele weitere attraktive Belohnungen.

Neuester Skibidi Tower Defense-Code und wie man den Code gegen Belohnungen einlöst

Neuester Skibidi Tower Defense-Code und wie man den Code gegen Belohnungen einlöst

Der Spielcode von Skibidi Tower Defense hilft Ihnen dabei, Ihre Basis leichter zu verteidigen, indem er Ihnen während des Spiels kostenlose Münzen, Glückstränke und Goldverdoppelungstränke zur Verfügung stellt.

So ändern Sie Maßeinheiten in Apple Maps

So ändern Sie Maßeinheiten in Apple Maps

Mit der Apple Maps-Anwendung können Sie die Maßeinheit je nach Bedarf und Nutzungsgewohnheiten der jeweiligen Person zwischen km, Meile und Meilen ändern.

7 ChatGPT- und KI-Apps zur kostenlosen Reiseplanung

7 ChatGPT- und KI-Apps zur kostenlosen Reiseplanung

Diese kostenlosen Reiseplanungs-Apps verwenden KI- und Machine-Learning-Tools wie ChatGPT, um Ihre Reiseroute in Sekundenschnelle vorzubereiten.

So verwenden Sie Gemini über die Adressleiste von Google Chrome

So verwenden Sie Gemini über die Adressleiste von Google Chrome

Google integriert KI-Funktionen in den Google Chrome-Browser und nutzt seit neuestem Gemini aus der Google Chrome-Adressleiste.

4 Möglichkeiten zum Ändern des Benutzerkontotyps in Windows

4 Möglichkeiten zum Ändern des Benutzerkontotyps in Windows

Neben der Erstellung mehrerer Benutzer können Sie in Windows 10 auch die Aktionen anderer Benutzer auf einem gemeinsam genutzten PC einschränken, indem Sie mehrere Arten von Konten bereitstellen, nämlich Standardbenutzerkonten und Administratorkonten.

10 nützliche Tastenkombinationen zur Steigerung der Produktivität in Microsoft Edge

10 nützliche Tastenkombinationen zur Steigerung der Produktivität in Microsoft Edge

Tastaturkürzel sind ein großartiges Produktivitätstool, insbesondere für diejenigen, deren Arbeit viel Tipparbeit erfordert.

Schwerwiegender Fehler zwingt Google, die KI-Funktion zum Erstellen von Bildern mit Text zu pausieren

Schwerwiegender Fehler zwingt Google, die KI-Funktion zum Erstellen von Bildern mit Text zu pausieren

Google hat angekündigt, dass es die Funktion zur Generierung von Personenbildern aus Text seines KI-Modells Gemini aufgrund eines schwerwiegenden historischen Fehlers aussetzt.

So verwenden Sie Copilot in PowerPoint

So verwenden Sie Copilot in PowerPoint

Copilot hilft Ihnen dabei, Ihren PowerPoint-Inhaltsfolien kreative Ideen hinzuzufügen oder den schlechten Inhalt Ihrer Präsentationsfolien zu korrigieren.

So löschen Sie Google Gemini-Konversationen

So löschen Sie Google Gemini-Konversationen

Anstatt Ihren gesamten Google Gemini-Verlauf zu löschen, können Sie auch nur die gewünschten Konversationen löschen. Dieser Artikel führt Sie durch das Löschen Ihrer Google Gemini-Konversationen.

So führen Sie ein Downgrade von iOS 16 Beta 1 auf iOS 15 durch

So führen Sie ein Downgrade von iOS 16 Beta 1 auf iOS 15 durch

In diesem Artikel erklärt Ihnen WebTech360, wie Sie ein Downgrade von iOS 16 Beta auf iOS 15 durchführen.

Die besten Apps zur Überwachung der Telefonnutzung von Kindern

Die besten Apps zur Überwachung der Telefonnutzung von Kindern

Hier ist eine Liste der besten Apps zur Kindersicherung, die Ihnen beim Vergleich der verschiedenen verfügbaren Optionen hilft.