Google kündigt Gemini Robotics an, ein für Roboter optimiertes Modell Gemini 2.0

Google DeepMind hat im Bereich der KI stetige Fortschritte erzielt und regelmäßig hochgelobte Updates für Gemini, Imagen, Veo, Gemma und AlphaFold veröffentlicht. Heute sorgt Googles KI-Team erneut für Schlagzeilen: Es gibt seinen offiziellen Einstieg in die Robotikbranche bekannt und stellt zwei neue Modelle auf Basis von Gemini 2.0 vor: Gemini Robotics und Gemini Robotics-ER.

Gemini Robotics: Fortschrittliches Vision-Language-Action-Modell

Gemini Robotics ist ein fortschrittliches Vision-Language-Action-Modell (VLA), das auf Gemini 2.0 aufbaut und physische Aktionen als neue Ausgabemethode zur Robotersteuerung hinzufügt. Google behauptet, dass dieses neue Modell Situationen verstehen kann, die es während des Trainings noch nicht einmal erlebt hat.

Im Vergleich zu anderen führenden VLA-Modellen schneidet Gemini Robotics bei umfassenden Generalisierungsbenchmarks doppelt so gut ab. Da es auf dem Gemini 2.0-Modell basiert, versteht es eine Vielzahl natürlicher Sprachen und somit menschliche Befehle präziser.

Google behauptet, dass Gemini Robotics komplexe, mehrstufige Aufgaben bewältigen kann, die präzises Manipulieren erfordern. So kann das Modell beispielsweise Origami falten oder Snacks in Ziploc-Beutel packen.

Gemini Robotics-ER: Ein visuell-sprachliches Modell mit Fokus auf räumlichem Denken

Gemini Robotics-ER ist ein fortschrittliches visuell-linguistisches Modell mit Fokus auf räumlichem Denken, das Robotikern die Integration in ihre bestehenden Low-Level-Controller ermöglicht. Mit diesem Modell verfügen Robotiker über alle Schritte zur sofortigen Robotersteuerung, einschließlich Wahrnehmung, Zustandsschätzung, räumlichem Verständnis, Planung und Codegenerierung.

Die Zukunft von Gemini Robotics

Google arbeitet mit Apptronik zusammen, um humanoide Roboter auf Basis der Gemini 2.0-Modelle zu bauen. Google arbeitet außerdem mit einer Reihe vertrauenswürdiger Testpartner zusammen, darunter Agile Robots, Agility Robotics, Boston Dynamics und Enchanted Tools, um die zukünftige Entwicklung von Gemini Robotics-ER voranzutreiben.

Indem Google DeepMind Robotern ermöglicht, komplexe Aufgaben mit größerer Genauigkeit und Anpassungsfähigkeit zu verstehen und auszuführen, ebnet es den Weg für eine Zukunft, in der sich Roboter nahtlos in viele Aspekte unseres Lebens integrieren können.

Sign up and earn $1000 a day ⋙

Leave a Comment

Google veröffentlicht Pixel-Update für Dezember, das größtenteils mit Gemini zusammenhängt

Google veröffentlicht Pixel-Update für Dezember, das größtenteils mit Gemini zusammenhängt

Dieses neueste Update führt Verbesserungen in Bezug auf die Kamera, Audio- und Videotools und vor allem Gemini, den KI-Assistenten von Google, ein.

9 nützliche Google-Apps, die auf Android-Telefonen nicht vorinstalliert sind

9 nützliche Google-Apps, die auf Android-Telefonen nicht vorinstalliert sind

Wenn Sie Google-Dienste mögen, können diese weniger bekannten Apps Ihrem Gerät einen überraschenden Mehrwert verleihen.

Google trennt sich von Qualcomm und entscheidet sich für das 5G-Modem von MediaTek für die Pixel 10-Serie

Google trennt sich von Qualcomm und entscheidet sich für das 5G-Modem von MediaTek für die Pixel 10-Serie

Google hat beschlossen, die langjährige Partnerschaft mit Qualcomm zu beenden und stattdessen das T900-Modem von MediaTek in der Pixel 10-Serie zu verwenden.

Perplexitys Social Search benötigt diese 3 Funktionen, um mit Google konkurrieren zu können

Perplexitys Social Search benötigt diese 3 Funktionen, um mit Google konkurrieren zu können

Die reguläre Suchmaschine von Perplexity ist großartig, aber die Social-Search-Funktion lässt zu wünschen übrig. Bevor Perplexity überhaupt daran denken kann, in diesem Bereich mit Google zu konkurrieren, benötigt es diese neuen Funktionen.

Die kostenlose Version von Geminis hat gerade eine wichtige Einschränkung entfernt

Die kostenlose Version von Geminis hat gerade eine wichtige Einschränkung entfernt

Als eines der leistungsstärksten Text-zu-Bild-KI-Modelle ist Google Imagen 3 bereits in Gemini-Apps verfügbar, allerdings nur in gewissem Umfang.

So schützen Sie Ihr Google-Konto mit Private Checkup

So schützen Sie Ihr Google-Konto mit Private Checkup

Google leistet großartige Arbeit, wenn es darum geht, all diese Informationen so privat wie möglich zu halten. Dennoch kann es nicht schaden, einen Blick darauf zu werfen und sich mit dem Tool „Datenschutzcheck“ vertraut zu machen, wie Sie Ihr Google-Konto schützen können.

Googles KI kann Chips schneller und besser entwickeln als Menschen

Googles KI kann Chips schneller und besser entwickeln als Menschen

Mithilfe einer komplexen neuronalen Netzwerkarchitektur auf Basis von Kantengraphen kann das KI-Modell von Google Brains Grundrisse in einem Bruchteil der Zeit entwerfen, die ein Mensch dafür benötigt.

Amazon kündigt Nova Sonic Soundmodell an und behauptet, dass die Leistung OpenAI und Google übertrifft

Amazon kündigt Nova Sonic Soundmodell an und behauptet, dass die Leistung OpenAI und Google übertrifft

Amazon hat heute Nova Sonic vorgestellt, ein fortschrittliches Spracherkennungsmodell, das es Entwicklern ermöglicht, Apps zu erstellen, die in Echtzeit mit menschenähnlichen Stimmen kommunizieren können.

Google behauptet, Gemini 2.5 übertreffe die besten Modelle von OpenAI, DeepSeek und anderen KI-Technologiegiganten

Google behauptet, Gemini 2.5 übertreffe die besten Modelle von OpenAI, DeepSeek und anderen KI-Technologiegiganten

Google hat gerade Gemini 2.5 vorgestellt, das laut Unternehmen sein bisher intelligentestes KI-Modell ist. Die erste Version des Modells, Gemini 2.5 Pro, erzielte in zahlreichen Benchmark-Tests beeindruckende Ergebnisse.

Google erweitert Google Workspace auf der Cloud Next 2024 um weitere KI-Funktionen

Google erweitert Google Workspace auf der Cloud Next 2024 um weitere KI-Funktionen

Zusätzlich zu Vids erhält Google Workspace auf der Cloud Next 2024 eine Reihe neuer Gemini-Funktionen und -Funktionalitäten.

Anleitung zum Spielen des olympischen Doodle Champion Island Sports Game, das gerade von Google eingeführt wurde

Anleitung zum Spielen des olympischen Doodle Champion Island Sports Game, das gerade von Google eingeführt wurde

Champion Island wird ab dem 23. Juli 2021, dem Tag der Eröffnungszeremonie der Olympischen Spiele 2020 in Tokio, auf der Google-Startseite verfügbar sein.

Google benennt Bard in Gemini um, bringt mobile App und neue Ultra 1.0-Version heraus

Google benennt Bard in Gemini um, bringt mobile App und neue Ultra 1.0-Version heraus

Google hat gerade offiziell die Umbenennung des Bard AI-Chatbots in Gemini angekündigt, ähnlich dem leistungsstärksten KI-Modell des Unternehmens.

Der Fahrmodus von Google Assistant verwandelt sich jetzt in eine Sprachleiste

Der Fahrmodus von Google Assistant verwandelt sich jetzt in eine Sprachleiste

Google hat angekündigt, eine Reihe von Google Assistant-Funktionen einzustellen. Eine der entfernten Funktionen ist der „App Launcher“ im Fahrmodus des Google Assistant.

Gemini AI kann jetzt YouTube-Videos für Sie ansehen und spart so Stunden an Zeit

Gemini AI kann jetzt YouTube-Videos für Sie ansehen und spart so Stunden an Zeit

Mit dem neuesten Update von Google Gemini können Sie jetzt erkennen, worum es bei langen YouTube-Videos geht, ohne sie anzusehen.

Wenn Google diese Funktion von Samsung kopiert, werden mehr Benutzer auf Pixel umsteigen!

Wenn Google diese Funktion von Samsung kopiert, werden mehr Benutzer auf Pixel umsteigen!

Die Leute lieben das Samsung Galaxy, aber in letzter Zeit langweilen sich viele mit der Haptik der neuen Geräte und überlegen, auf Google Pixel umzusteigen.

Warum bedecken Katzen ihr Gesicht, wenn sie schlafen?

Warum bedecken Katzen ihr Gesicht, wenn sie schlafen?

Es gibt viele verschiedene Erklärungen dafür, warum Katzen im Schlaf ihr Gesicht bedecken – vom Versuch, sich warm zu halten, bis hin zum Schutz ihrer Schnurrhaare. Hier ist die Antwort auf die Frage, warum Katzen im Schlaf ihr Gesicht bedecken.

Quiz: Wie viele Meter sind 1 Fuß?

Quiz: Wie viele Meter sind 1 Fuß?

Wie viele Meter sind 1 Fuß? Wenn Sie es nicht wissen, finden wir gemeinsam die Antwort!

So ändern Sie den NAT-Typ unter Windows 11/10

So ändern Sie den NAT-Typ unter Windows 11/10

Das beste Spielerlebnis erzielen Sie mit Open NAT oder zumindest Moderate NAT. Lernen Sie daher, den NAT-Typ zu ändern.

So senden Sie Meta-AI-Nachrichten in WhatsApp-Gruppen

So senden Sie Meta-AI-Nachrichten in WhatsApp-Gruppen

Sie können Meta AI nicht nur mit einzelnen WhatsApp-Nachrichten verwenden, sondern jetzt auch Meta AI-Nachrichten in WhatsApp-Gruppen senden.

NVIDIA-CEO: KI wird Menschen in bestimmten Jobs mit 1000-mal höherer Produktivität ersetzen

NVIDIA-CEO: KI wird Menschen in bestimmten Jobs mit 1000-mal höherer Produktivität ersetzen

Das Konzept der künstlichen Intelligenz (KI) erfreut sich immer größerer Beliebtheit, was bedeutet, dass diese überlegene Technologie nach und nach in vielen Bereichen und in allen Aspekten des modernen Lebens effektiv eingesetzt wird.

KI-Roboter können gejailbreakt werden, und die Folgen werden verheerend sein

KI-Roboter können gejailbreakt werden, und die Folgen werden verheerend sein

Forscher der Penn Engineering (USA) sollen in mehreren KI-gesteuerten Roboterplattformen bislang unbekannte Sicherheitslücken entdeckt haben.

Unterschied zwischen WAN-Port und LAN-Port

Unterschied zwischen WAN-Port und LAN-Port

Wenn Sie sich Ihren WLAN-Router ansehen, sehen Sie möglicherweise die Abkürzungen LAN und WAN, die sich normalerweise neben einigen Anschlüssen befinden. LAN steht für Local Area Network und WAN für Wide Area Network. Was ist also der Unterschied zwischen diesen beiden Anschlusstypen? Finden Sie es mit Quantrimang im folgenden Artikel heraus!

So teilen Sie große Dateien direkt in Ihrem Browser mit FilePizza

So teilen Sie große Dateien direkt in Ihrem Browser mit FilePizza

Dank FilePizza können Sie endlich große Dateien ohne Zwischenhändler teilen.

Die 20 längsten Nonstop-Flüge der Welt nach Entfernung

Die 20 längsten Nonstop-Flüge der Welt nach Entfernung

Die 20 längsten Flüge der Welt nach Entfernung (alle länger als 12.000 km und mit Flugzeiten von 15 Stunden 5 Minuten bis 18 Stunden 50 Minuten).

Sehen Sie sich das rasante Ironman-Rennen in Dubai an

Sehen Sie sich das rasante Ironman-Rennen in Dubai an

Das weltweit erste Jet Suit Race wurde in Dubai von Gravity Industries, einem Pionier im Bereich Jet Suits, in Zusammenarbeit mit dem Dubai Sports Council veranstaltet.

Laden Sie Fishing Master am einfachsten und schnellsten herunter

Laden Sie Fishing Master am einfachsten und schnellsten herunter

Fishing Master ist ein Angelsimulationsspiel, das den Spielern möglichst realistische und unterhaltsame Erlebnisse bieten soll.

Neuester Fishing Master Code und wie man den Code einlöst

Neuester Fishing Master Code und wie man den Code einlöst

In Fishing Master benötigen Sie den neuesten Fishing Master-Geschenkcode, um ihn gegen Diamanten, Münzen, Energie usw. einzutauschen.

Neuester Thuc Son Thien Ha Chien-Code und wie man den Code eingibt

Neuester Thuc Son Thien Ha Chien-Code und wie man den Code eingibt

Thuc Son Thien Ha Chien gibt den Spielern eine Reihe von Belohnungen, darunter Rubin, Diamant und Upgrade-Stein, Enhancement-Stein über Geschenkcode

Jeder kann einen Song mithilfe von KI remixen, aber sollte er das tun?

Jeder kann einen Song mithilfe von KI remixen, aber sollte er das tun?

Mit KI können Sie Songs per Mausklick remixen. Die Ergebnisse sind jedoch genauso inspirierend. Suchen Sie stattdessen nach KI-gestützten Musiktools, um die Langeweile zu reduzieren und die Kreativität anzuregen!

So helfen Ihnen Gemini-Erweiterungen, effizienter in Google Workspace zu arbeiten

So helfen Ihnen Gemini-Erweiterungen, effizienter in Google Workspace zu arbeiten

Mit der Gemini-Erweiterungsfunktion können Sie verschiedene Google-Apps verbinden, um personalisiertere Antworten zu erhalten und Ihren Arbeitsablauf zu optimieren.