Google veröffentlicht Pixel-Update für Dezember, das größtenteils mit Gemini zusammenhängt

Dieses neueste Update führt Verbesserungen in Bezug auf die Kamera, Audio- und Videotools und vor allem Gemini, den KI-Assistenten von Google, ein.
Google DeepMind hat im Bereich der KI stetige Fortschritte erzielt und regelmäßig hochgelobte Updates für Gemini, Imagen, Veo, Gemma und AlphaFold veröffentlicht. Heute sorgt Googles KI-Team erneut für Schlagzeilen: Es gibt seinen offiziellen Einstieg in die Robotikbranche bekannt und stellt zwei neue Modelle auf Basis von Gemini 2.0 vor: Gemini Robotics und Gemini Robotics-ER.
Gemini Robotics: Fortschrittliches Vision-Language-Action-Modell
Gemini Robotics ist ein fortschrittliches Vision-Language-Action-Modell (VLA), das auf Gemini 2.0 aufbaut und physische Aktionen als neue Ausgabemethode zur Robotersteuerung hinzufügt. Google behauptet, dass dieses neue Modell Situationen verstehen kann, die es während des Trainings noch nicht einmal erlebt hat.
Im Vergleich zu anderen führenden VLA-Modellen schneidet Gemini Robotics bei umfassenden Generalisierungsbenchmarks doppelt so gut ab. Da es auf dem Gemini 2.0-Modell basiert, versteht es eine Vielzahl natürlicher Sprachen und somit menschliche Befehle präziser.
Google behauptet, dass Gemini Robotics komplexe, mehrstufige Aufgaben bewältigen kann, die präzises Manipulieren erfordern. So kann das Modell beispielsweise Origami falten oder Snacks in Ziploc-Beutel packen.
Gemini Robotics-ER: Ein visuell-sprachliches Modell mit Fokus auf räumlichem Denken
Gemini Robotics-ER ist ein fortschrittliches visuell-linguistisches Modell mit Fokus auf räumlichem Denken, das Robotikern die Integration in ihre bestehenden Low-Level-Controller ermöglicht. Mit diesem Modell verfügen Robotiker über alle Schritte zur sofortigen Robotersteuerung, einschließlich Wahrnehmung, Zustandsschätzung, räumlichem Verständnis, Planung und Codegenerierung.
Die Zukunft von Gemini Robotics
Google arbeitet mit Apptronik zusammen, um humanoide Roboter auf Basis der Gemini 2.0-Modelle zu bauen. Google arbeitet außerdem mit einer Reihe vertrauenswürdiger Testpartner zusammen, darunter Agile Robots, Agility Robotics, Boston Dynamics und Enchanted Tools, um die zukünftige Entwicklung von Gemini Robotics-ER voranzutreiben.
Indem Google DeepMind Robotern ermöglicht, komplexe Aufgaben mit größerer Genauigkeit und Anpassungsfähigkeit zu verstehen und auszuführen, ebnet es den Weg für eine Zukunft, in der sich Roboter nahtlos in viele Aspekte unseres Lebens integrieren können.
Dieses neueste Update führt Verbesserungen in Bezug auf die Kamera, Audio- und Videotools und vor allem Gemini, den KI-Assistenten von Google, ein.
Wenn Sie Google-Dienste mögen, können diese weniger bekannten Apps Ihrem Gerät einen überraschenden Mehrwert verleihen.
Google hat beschlossen, die langjährige Partnerschaft mit Qualcomm zu beenden und stattdessen das T900-Modem von MediaTek in der Pixel 10-Serie zu verwenden.
Die reguläre Suchmaschine von Perplexity ist großartig, aber die Social-Search-Funktion lässt zu wünschen übrig. Bevor Perplexity überhaupt daran denken kann, in diesem Bereich mit Google zu konkurrieren, benötigt es diese neuen Funktionen.
Als eines der leistungsstärksten Text-zu-Bild-KI-Modelle ist Google Imagen 3 bereits in Gemini-Apps verfügbar, allerdings nur in gewissem Umfang.
Google leistet großartige Arbeit, wenn es darum geht, all diese Informationen so privat wie möglich zu halten. Dennoch kann es nicht schaden, einen Blick darauf zu werfen und sich mit dem Tool „Datenschutzcheck“ vertraut zu machen, wie Sie Ihr Google-Konto schützen können.
Mithilfe einer komplexen neuronalen Netzwerkarchitektur auf Basis von Kantengraphen kann das KI-Modell von Google Brains Grundrisse in einem Bruchteil der Zeit entwerfen, die ein Mensch dafür benötigt.
Amazon hat heute Nova Sonic vorgestellt, ein fortschrittliches Spracherkennungsmodell, das es Entwicklern ermöglicht, Apps zu erstellen, die in Echtzeit mit menschenähnlichen Stimmen kommunizieren können.
Google hat gerade Gemini 2.5 vorgestellt, das laut Unternehmen sein bisher intelligentestes KI-Modell ist. Die erste Version des Modells, Gemini 2.5 Pro, erzielte in zahlreichen Benchmark-Tests beeindruckende Ergebnisse.
Zusätzlich zu Vids erhält Google Workspace auf der Cloud Next 2024 eine Reihe neuer Gemini-Funktionen und -Funktionalitäten.
Champion Island wird ab dem 23. Juli 2021, dem Tag der Eröffnungszeremonie der Olympischen Spiele 2020 in Tokio, auf der Google-Startseite verfügbar sein.
Google hat gerade offiziell die Umbenennung des Bard AI-Chatbots in Gemini angekündigt, ähnlich dem leistungsstärksten KI-Modell des Unternehmens.
Google hat angekündigt, eine Reihe von Google Assistant-Funktionen einzustellen. Eine der entfernten Funktionen ist der „App Launcher“ im Fahrmodus des Google Assistant.
Mit dem neuesten Update von Google Gemini können Sie jetzt erkennen, worum es bei langen YouTube-Videos geht, ohne sie anzusehen.
Die Leute lieben das Samsung Galaxy, aber in letzter Zeit langweilen sich viele mit der Haptik der neuen Geräte und überlegen, auf Google Pixel umzusteigen.
Es gibt viele verschiedene Erklärungen dafür, warum Katzen im Schlaf ihr Gesicht bedecken – vom Versuch, sich warm zu halten, bis hin zum Schutz ihrer Schnurrhaare. Hier ist die Antwort auf die Frage, warum Katzen im Schlaf ihr Gesicht bedecken.
Wie viele Meter sind 1 Fuß? Wenn Sie es nicht wissen, finden wir gemeinsam die Antwort!
Das beste Spielerlebnis erzielen Sie mit Open NAT oder zumindest Moderate NAT. Lernen Sie daher, den NAT-Typ zu ändern.
Sie können Meta AI nicht nur mit einzelnen WhatsApp-Nachrichten verwenden, sondern jetzt auch Meta AI-Nachrichten in WhatsApp-Gruppen senden.
Das Konzept der künstlichen Intelligenz (KI) erfreut sich immer größerer Beliebtheit, was bedeutet, dass diese überlegene Technologie nach und nach in vielen Bereichen und in allen Aspekten des modernen Lebens effektiv eingesetzt wird.
Forscher der Penn Engineering (USA) sollen in mehreren KI-gesteuerten Roboterplattformen bislang unbekannte Sicherheitslücken entdeckt haben.
Wenn Sie sich Ihren WLAN-Router ansehen, sehen Sie möglicherweise die Abkürzungen LAN und WAN, die sich normalerweise neben einigen Anschlüssen befinden. LAN steht für Local Area Network und WAN für Wide Area Network. Was ist also der Unterschied zwischen diesen beiden Anschlusstypen? Finden Sie es mit Quantrimang im folgenden Artikel heraus!
Dank FilePizza können Sie endlich große Dateien ohne Zwischenhändler teilen.
Die 20 längsten Flüge der Welt nach Entfernung (alle länger als 12.000 km und mit Flugzeiten von 15 Stunden 5 Minuten bis 18 Stunden 50 Minuten).
Das weltweit erste Jet Suit Race wurde in Dubai von Gravity Industries, einem Pionier im Bereich Jet Suits, in Zusammenarbeit mit dem Dubai Sports Council veranstaltet.
Fishing Master ist ein Angelsimulationsspiel, das den Spielern möglichst realistische und unterhaltsame Erlebnisse bieten soll.
In Fishing Master benötigen Sie den neuesten Fishing Master-Geschenkcode, um ihn gegen Diamanten, Münzen, Energie usw. einzutauschen.
Thuc Son Thien Ha Chien gibt den Spielern eine Reihe von Belohnungen, darunter Rubin, Diamant und Upgrade-Stein, Enhancement-Stein über Geschenkcode
Mit KI können Sie Songs per Mausklick remixen. Die Ergebnisse sind jedoch genauso inspirierend. Suchen Sie stattdessen nach KI-gestützten Musiktools, um die Langeweile zu reduzieren und die Kreativität anzuregen!
Mit der Gemini-Erweiterungsfunktion können Sie verschiedene Google-Apps verbinden, um personalisiertere Antworten zu erhalten und Ihren Arbeitsablauf zu optimieren.