Google kündigt Gemini Robotics an, ein für Roboter optimiertes Modell Gemini 2.0

Google DeepMind hat im Bereich der KI stetige Fortschritte erzielt und regelmäßig hochgelobte Updates für Gemini, Imagen, Veo, Gemma und AlphaFold veröffentlicht. Heute sorgt Googles KI-Team erneut für Schlagzeilen: Es gibt seinen offiziellen Einstieg in die Robotikbranche bekannt und stellt zwei neue Modelle auf Basis von Gemini 2.0 vor: Gemini Robotics und Gemini Robotics-ER.

Gemini Robotics: Fortschrittliches Vision-Language-Action-Modell

Gemini Robotics ist ein fortschrittliches Vision-Language-Action-Modell (VLA), das auf Gemini 2.0 aufbaut und physische Aktionen als neue Ausgabemethode zur Robotersteuerung hinzufügt. Google behauptet, dass dieses neue Modell Situationen verstehen kann, die es während des Trainings noch nicht einmal erlebt hat.

Im Vergleich zu anderen führenden VLA-Modellen schneidet Gemini Robotics bei umfassenden Generalisierungsbenchmarks doppelt so gut ab. Da es auf dem Gemini 2.0-Modell basiert, versteht es eine Vielzahl natürlicher Sprachen und somit menschliche Befehle präziser.

Google behauptet, dass Gemini Robotics komplexe, mehrstufige Aufgaben bewältigen kann, die präzises Manipulieren erfordern. So kann das Modell beispielsweise Origami falten oder Snacks in Ziploc-Beutel packen.

Gemini Robotics-ER: Ein visuell-sprachliches Modell mit Fokus auf räumlichem Denken

Gemini Robotics-ER ist ein fortschrittliches visuell-linguistisches Modell mit Fokus auf räumlichem Denken, das Robotikern die Integration in ihre bestehenden Low-Level-Controller ermöglicht. Mit diesem Modell verfügen Robotiker über alle Schritte zur sofortigen Robotersteuerung, einschließlich Wahrnehmung, Zustandsschätzung, räumlichem Verständnis, Planung und Codegenerierung.

Die Zukunft von Gemini Robotics

Google arbeitet mit Apptronik zusammen, um humanoide Roboter auf Basis der Gemini 2.0-Modelle zu bauen. Google arbeitet außerdem mit einer Reihe vertrauenswürdiger Testpartner zusammen, darunter Agile Robots, Agility Robotics, Boston Dynamics und Enchanted Tools, um die zukünftige Entwicklung von Gemini Robotics-ER voranzutreiben.

Indem Google DeepMind Robotern ermöglicht, komplexe Aufgaben mit größerer Genauigkeit und Anpassungsfähigkeit zu verstehen und auszuführen, ebnet es den Weg für eine Zukunft, in der sich Roboter nahtlos in viele Aspekte unseres Lebens integrieren können.

Sign up and earn $1000 a day ⋙

Leave a Comment

Google entwickelt KI-Shopping-Tool, mit dem Benutzer Kleider und Hemden zu Hause anprobieren können

Google entwickelt KI-Shopping-Tool, mit dem Benutzer Kleider und Hemden zu Hause anprobieren können

Letztes Jahr hat Google in der Suche einen KI-gestützten Einkaufsassistenten eingeführt, der es Benutzern ermöglicht, sich eine visuelle Vorstellung davon zu machen, wie ein Kleidungsstück an einem bestimmten Körpertyp aussehen würde.

Google entwickelt KI-Algorithmus zur Diagnose von Hautkrankheiten und Tuberkulose

Google entwickelt KI-Algorithmus zur Diagnose von Hautkrankheiten und Tuberkulose

Google zeigt zunehmend Interesse am Einsatz künstlicher Intelligenz in der Medizin.

So aktivieren und verwenden Sie Google Assistant auf Chrome Android

So aktivieren und verwenden Sie Google Assistant auf Chrome Android

Google stellt seine alte Spracherkennungstechnologie schrittweise ein und ersetzt sie durch seinen virtuellen Assistenten Assistant.

Google kündigt 6 neue Funktionen für Android-Telefone an

Google kündigt 6 neue Funktionen für Android-Telefone an

Google hat heute sechs neue Funktionen für Android-Smartphones angekündigt.

Was ist das Datenschutz-Dashboard unter Android 12? Warum gilt es als Durchbruch für den Datenschutz?

Was ist das Datenschutz-Dashboard unter Android 12? Warum gilt es als Durchbruch für den Datenschutz?

Sicherheit und Datenschutz werden für Smartphone-Benutzer im Allgemeinen immer wichtiger.

ChatGPT-Suche oder Google ist besser?

ChatGPT-Suche oder Google ist besser?

Viele Leute versuchen schon seit langem herauszufinden, ob sie Google tatsächlich durch die Chrome-Erweiterung ChatGPT Search ersetzen können.

Google veröffentlicht Pixel-Update für Dezember, das größtenteils mit Gemini zusammenhängt

Google veröffentlicht Pixel-Update für Dezember, das größtenteils mit Gemini zusammenhängt

Dieses neueste Update führt Verbesserungen in Bezug auf die Kamera, Audio- und Videotools und vor allem Gemini, den KI-Assistenten von Google, ein.

9 nützliche Google-Apps, die auf Android-Telefonen nicht vorinstalliert sind

9 nützliche Google-Apps, die auf Android-Telefonen nicht vorinstalliert sind

Wenn Sie Google-Dienste mögen, können diese weniger bekannten Apps Ihrem Gerät einen überraschenden Mehrwert verleihen.

Google trennt sich von Qualcomm und entscheidet sich für das 5G-Modem von MediaTek für die Pixel 10-Serie

Google trennt sich von Qualcomm und entscheidet sich für das 5G-Modem von MediaTek für die Pixel 10-Serie

Google hat beschlossen, die langjährige Partnerschaft mit Qualcomm zu beenden und stattdessen das T900-Modem von MediaTek in der Pixel 10-Serie zu verwenden.

Perplexitys Social Search benötigt diese 3 Funktionen, um mit Google konkurrieren zu können

Perplexitys Social Search benötigt diese 3 Funktionen, um mit Google konkurrieren zu können

Die reguläre Suchmaschine von Perplexity ist großartig, aber die Social-Search-Funktion lässt zu wünschen übrig. Bevor Perplexity überhaupt daran denken kann, in diesem Bereich mit Google zu konkurrieren, benötigt es diese neuen Funktionen.

Die kostenlose Version von Geminis hat gerade eine wichtige Einschränkung entfernt

Die kostenlose Version von Geminis hat gerade eine wichtige Einschränkung entfernt

Als eines der leistungsstärksten Text-zu-Bild-KI-Modelle ist Google Imagen 3 bereits in Gemini-Apps verfügbar, allerdings nur in gewissem Umfang.

So schützen Sie Ihr Google-Konto mit Private Checkup

So schützen Sie Ihr Google-Konto mit Private Checkup

Google leistet großartige Arbeit, wenn es darum geht, all diese Informationen so privat wie möglich zu halten. Dennoch kann es nicht schaden, einen Blick darauf zu werfen und sich mit dem Tool „Datenschutzcheck“ vertraut zu machen, wie Sie Ihr Google-Konto schützen können.

Googles KI kann Chips schneller und besser entwickeln als Menschen

Googles KI kann Chips schneller und besser entwickeln als Menschen

Mithilfe einer komplexen neuronalen Netzwerkarchitektur auf Basis von Kantengraphen kann das KI-Modell von Google Brains Grundrisse in einem Bruchteil der Zeit entwerfen, die ein Mensch dafür benötigt.

Amazon kündigt Nova Sonic Soundmodell an und behauptet, dass die Leistung OpenAI und Google übertrifft

Amazon kündigt Nova Sonic Soundmodell an und behauptet, dass die Leistung OpenAI und Google übertrifft

Amazon hat heute Nova Sonic vorgestellt, ein fortschrittliches Spracherkennungsmodell, das es Entwicklern ermöglicht, Apps zu erstellen, die in Echtzeit mit menschenähnlichen Stimmen kommunizieren können.

Google behauptet, Gemini 2.5 übertreffe die besten Modelle von OpenAI, DeepSeek und anderen KI-Technologiegiganten

Google behauptet, Gemini 2.5 übertreffe die besten Modelle von OpenAI, DeepSeek und anderen KI-Technologiegiganten

Google hat gerade Gemini 2.5 vorgestellt, das laut Unternehmen sein bisher intelligentestes KI-Modell ist. Die erste Version des Modells, Gemini 2.5 Pro, erzielte in zahlreichen Benchmark-Tests beeindruckende Ergebnisse.

Raum „Zusammen spielen“: Nennen Sie den Raum „Zusammen spielen“

Raum „Zusammen spielen“: Nennen Sie den Raum „Zusammen spielen“

Viele Leute verwenden Leerzeichen in ihren Play Together-Namen oder verwenden kleine Unterstriche, um Leerzeichen zwischen den Buchstaben zu erstellen, die Sie in Ihrem Namen schreiben.

So laden Sie Black Beacon PC herunter

So laden Sie Black Beacon PC herunter

Obwohl es durchaus möglich ist, Black Beacon auf dem PC zu erleben, ist das Spiel derzeit nicht offiziell für diese Plattform optimiert.

Formel zur Berechnung der Oberfläche und des Volumens einer Kugel

Formel zur Berechnung der Oberfläche und des Volumens einer Kugel

Die Oberfläche einer Kugel ist viermal so groß wie die Fläche eines großen Kreises, die wiederum viermal so groß ist wie die Konstante Pi multipliziert mit dem Quadrat des Kugelradius.

Was ist das Besondere an dem Raumanzug, den China für die erste bemannte Mondlandung gewählt hat?

Was ist das Besondere an dem Raumanzug, den China für die erste bemannte Mondlandung gewählt hat?

China möchte bis 2030 seine ersten Bürger zum Mond schicken und das Land hat gerade einen neu entwickelten Raumanzug vorgestellt, der bei der bevorstehenden historischen Mission zum Einsatz kommen soll.

Lebensmittel, die leicht Entzündungen im Körper verursachen

Lebensmittel, die leicht Entzündungen im Körper verursachen

Viele Lebensmittel können Entzündungen und chronische Krankheiten verursachen. Hier sind die Lebensmittel, die Sie in großen Mengen vermeiden sollten, um Krankheiten zu vermeiden.

Anleitung zum Spielen von Zuka Lien Quan Mobile Staffel S1 2023

Anleitung zum Spielen von Zuka Lien Quan Mobile Staffel S1 2023

Zuka ist ein Assassine, der Champions mit wenig Gesundheit furchteinflößend trifft. Erfahren Sie, wie Sie Zuka in Saison 23 effektiv einsetzen.

Neuester Heroic Era Code und wie man den Code einlöst

Neuester Heroic Era Code und wie man den Code einlöst

Fast alle neuen Spieler erhalten Geschenke über Heroic Age-Geschenkcodes, wenn sie dem Spiel beitreten.

12 Einstellungen auf Samsung Galaxy-Telefonen, die Sie ändern sollten

12 Einstellungen auf Samsung Galaxy-Telefonen, die Sie ändern sollten

Sie haben gerade ein neues Samsung Galaxy-Handy gekauft und müssen es konfigurieren? Hier sind 10 Einstellungen, die Sie ändern sollten, damit Ihr Samsung-Handy besser läuft.

Die neuesten Codes für Murder Mystery 2 und wie man sie eingibt

Die neuesten Codes für Murder Mystery 2 und wie man sie eingibt

Code Murder Mystery 2 hilft Spielern, mehr Messer-Skins für ihre Charaktere auszuwählen oder mehr Geld zu bekommen, um es für Dienste auszugeben und andere Dinge im Spiel zu kaufen.

Wie Musik das Gehirn stimuliert

Wie Musik das Gehirn stimuliert

Die meisten Menschen wissen, dass Musik nicht nur der Unterhaltung dient, sondern auch viele positive Auswirkungen hat. Hier sind einige Beispiele dafür, wie Musik unsere Gehirnentwicklung fördert.

Die am häufigsten fehlenden Nährstoffe in der Ernährung

Die am häufigsten fehlenden Nährstoffe in der Ernährung

Die Ernährung ist wichtig für unsere Gesundheit. Doch den meisten unserer Mahlzeiten fehlen diese sechs wichtigen Nährstoffe.

So zeigen Sie CPU-Informationen für Chromebooks an

So zeigen Sie CPU-Informationen für Chromebooks an

In diesem Artikel erfahren Sie, wie Sie CPU-Informationen anzeigen und die CPU-Geschwindigkeit direkt auf Ihrem Chromebook überprüfen.

8 coole Dinge, die Sie mit einem alten Android-Tablet machen können

8 coole Dinge, die Sie mit einem alten Android-Tablet machen können

Wenn Sie Ihr altes Tablet weder verkaufen noch verschenken möchten, können Sie es auf 5 Arten nutzen: als hochwertigen Bilderrahmen, Musikplayer, E-Book- und Zeitschriftenleser, Haushaltshilfe und als Zweitbildschirm.

Alles, was Sie brauchen, um Ihren Laptop durch ein Telefon zu ersetzen

Alles, was Sie brauchen, um Ihren Laptop durch ein Telefon zu ersetzen

Können Sie Ihren Laptop wirklich durch Ihr Telefon ersetzen? Ja, aber Sie benötigen das richtige Zubehör, um Ihr Telefon in einen Laptop zu verwandeln.

ChatGPT wird bald alles sehen können, was auf Ihrem Bildschirm passiert

ChatGPT wird bald alles sehen können, was auf Ihrem Bildschirm passiert

Ein wichtiger Punkt im gesamten Event-Video war, dass die kommende ChatGPT-App-Funktion vorgeführt wurde, ohne dass jedoch wirkliche Details bekannt gegeben wurden. ChatGPT bietet die Möglichkeit, alles zu sehen, was auf dem Bildschirm des Benutzergeräts passiert.