Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Auf der I/O 2024 kündigte Google die nächste Gemma 2-Modellreihe an und veröffentlichte die leichten Modelle nun endlich unter einer Open-Source-Lizenz. Das neue Modell Gemma 2 27B soll vielversprechend sein und einige der größeren Modelle wie Llama 3 70B und Qwen 1.5 32B übertreffen. Um diese Aussage zu überprüfen, vergleichen wir Gemma 2 und Llama 3 – zwei der derzeit besten Open-Source-Modelle.

Kreatives Schreiben

Lassen Sie uns zunächst testen, wie gut Gemma 2 und Llama 3 beim kreativen Schreiben abschneiden. Der Autor des Artikels bat beide Modelle, eine Kurzgeschichte über die Beziehung zwischen Mond und Sonne zu schreiben. Beide schnitten sehr gut ab, aber Googles Gemma 2-Modell stach mit seiner interessanten Prosa und der guten Geschichte hervor.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Andererseits wirkt das Llama 3 etwas langweilig und roboterhaft. Google war mit seinen Gemini-Modellen schon immer gut darin, Text zu generieren, und das kleinere Gemma 2 27B bildet da keine Ausnahme.

Gewinnoption: Gemma 2

Mehrsprachiges Testen

In der nächsten Runde wollen wir sehen, wie gut beide Modelle mit anderen Sprachen als Englisch umgehen. Da Google damit wirbt, dass Gemma 2 mehrere Sprachen gut versteht, habe ich es mit Metas Llama 3-Modell verglichen. Ich habe beide Modelle gebeten, einen Text in Hindi zu übersetzen. Sowohl Gemma 2 als auch Llama 3 schnitten sehr gut ab.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Der Autor probierte auch eine weitere Sprache, Bengalisch, aus, und die Modelle zeigten eine ähnlich gute Leistung. Zumindest für indische Sprachen lässt sich sagen, dass Gemma 2 und Llama 3 auf einem großen Korpus gut trainiert wurden. Gemma 2 27B ist jedoch fast 2,5-mal kleiner als Llama 3 70B, was es noch beeindruckender macht.

Gewinnoptionen: Gemma 2 und Llama 3

Testen Sie Ihre Argumentation

Gemma 2 und Llama 3 gehören zwar nicht zu den intelligentesten Modellen auf dem Markt, können aber einige gängige Denktests genauso gut durchführen wie deutlich größere Modelle. Im vorherigen Vergleich zwischen Llama 3 und GPT-4 überzeugte Metas 70B-Modell, da es trotz seiner geringeren Größe eine recht gute Intelligenz zeigte.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

In dieser Runde schlug Lama 3 Gemma 2 mit großem Abstand. Lama 3 beantwortete zwei von drei Fragen richtig, während Gemma 2 Mühe hatte, auch nur eine richtig zu beantworten. Gemma 2 war einfach nicht darauf trainiert, komplexe Denkaufgaben zu lösen.

Llama 3 hingegen verfügt über eine solide Argumentationsgrundlage, die höchstwahrscheinlich aus dem Token-Datensatz abgeleitet wurde. Trotz seiner geringen Größe – zumindest im Vergleich zu Billionen-Parameter-Modellen wie GPT-4 – weist es ein überdurchschnittliches Maß an Intelligenz auf. Letztendlich führt die Verwendung von mehr Token zum Trainieren des Modells tatsächlich zu einem robusteren Modell.

Gewinnoption: Lama 3

Folgen Sie den Anweisungen

In der nächsten Runde baten die Autoren Gemma 2 und Llama 3, zehn Wörter mit der Endung „NPU“ zu generieren. Llama 3 erzielte 10 von 10 richtigen Antworten. Gemma 2 hingegen generierte nur 7 von 10 korrekten Sätzen. In vielen früheren Versionen folgten Google-Modelle, darunter auch Gemini, den Benutzeranweisungen nicht korrekt. Dieser Trend setzte sich auch bei Gemma 2 fort.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Das Befolgen von Benutzeranweisungen ist für KI-Modelle sehr wichtig. Es gewährleistet Zuverlässigkeit und generiert präzise Antworten auf Ihre Anweisungen. Auch in puncto Sicherheit trägt es dazu bei, das Modell auf dem Boden zu halten und Sicherheitsprotokolle besser einzuhalten.

Gewinnoption: Lama 3

Informationen finden

Sowohl Gemma 2 als auch Llama 3 haben eine Kontextlänge von 8.000 Token. Der Autor fügte einen riesigen Textblock hinzu, der direkt aus dem Buch „Stolz und Vorurteil“ stammt und über 17.000 Zeichen und 3,8.000 Token umfasst. Wie üblich platzierte der Autor irgendwo im Text ein zufälliges Zitat und bat beide Modelle, es zu finden.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Gemma 2 fand die Information schnell und wies darauf hin, dass die Anweisung zufällig eingefügt wurde. Auch Llama 3 fand sie und wies darauf hin, dass die Anweisung fehl am Platz wirkte. Was den langen Kontextspeicher betrifft, sind beide Modelle, obwohl auf 8.000 Token begrenzt, in dieser Hinsicht recht leistungsstark.

Beachten Sie, dass der Autor diesen Test auf HuggingChat (Web) ausgeführt hat, da meta.ai sich geweigert hat, diese Eingabeaufforderung auszuführen, höchstwahrscheinlich aufgrund urheberrechtlich geschützter Inhalte.

Gewinnoptionen: Gemma 2 und Llama 3

Auf Halluzinationen prüfen

Kleinere Modelle neigen aufgrund begrenzter Trainingsdaten zu KI-Halluzinationen und erfinden oft Informationen, wenn das Modell auf unbekannte Themen trifft. Daher verwendete der Autor einen erfundenen Ländernamen, um zu testen, ob Gemma 2 und Llama 3 halluzinieren würden. Überraschenderweise taten sie dies nicht, was bedeutet, dass sowohl Google als auch Meta eine recht gute Grundlage für ihre Modelle haben.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Der Autor stellte außerdem eine weitere (falsche) Frage, um die Gültigkeit der Modelle zu testen, doch auch hier halluzinierte er nicht. Übrigens testete der Autor Llama 3 auf HuggingChat, während meta.ai im Internet nach aktuellen Informationen zu verwandten Themen suchte.

Gewinnoptionen: Gemma 2 und Llama 3

Abschließen

Googles Gemma 2 27B-Modell schneidet zwar bei Denktests nicht gut ab, ist aber für eine Reihe anderer Aufgaben geeignet. Es eignet sich hervorragend für kreatives Schreiben, unterstützt mehrere Sprachen, hat ein gutes Gedächtnis und – das Beste – verursacht keine Halluzinationen wie frühere Modelle.

Llama 3 ist natürlich besser, aber auch ein deutlich größeres Modell, das mit 70 Milliarden Parametern trainiert wurde. Entwickler werden das Gemma 2 27B-Modell für viele Anwendungsfälle nützlich finden. Für Inferenz ist auch das Gemma 2 9B verfügbar.

Darüber hinaus sollten Nutzer einen Blick auf den Gemini 1.5 Flash werfen, der ebenfalls ein deutlich kleineres Modell ist und ebenfalls multimodale Eingabe unterstützt. Außerdem ist er extrem schnell und effizient.

Sign up and earn $1000 a day ⋙

Leave a Comment

So zeigen Sie CPU-Informationen für Chromebooks an

So zeigen Sie CPU-Informationen für Chromebooks an

In diesem Artikel erfahren Sie, wie Sie CPU-Informationen anzeigen und die CPU-Geschwindigkeit direkt auf Ihrem Chromebook überprüfen.

8 coole Dinge, die Sie mit einem alten Android-Tablet machen können

8 coole Dinge, die Sie mit einem alten Android-Tablet machen können

Wenn Sie Ihr altes Tablet weder verkaufen noch verschenken möchten, können Sie es auf 5 Arten nutzen: als hochwertigen Bilderrahmen, Musikplayer, E-Book- und Zeitschriftenleser, Haushaltshilfe und als Zweitbildschirm.

Alles, was Sie brauchen, um Ihren Laptop durch ein Telefon zu ersetzen

Alles, was Sie brauchen, um Ihren Laptop durch ein Telefon zu ersetzen

Können Sie Ihren Laptop wirklich durch Ihr Telefon ersetzen? Ja, aber Sie benötigen das richtige Zubehör, um Ihr Telefon in einen Laptop zu verwandeln.

ChatGPT wird bald alles sehen können, was auf Ihrem Bildschirm passiert

ChatGPT wird bald alles sehen können, was auf Ihrem Bildschirm passiert

Ein wichtiger Punkt im gesamten Event-Video war, dass die kommende ChatGPT-App-Funktion vorgeführt wurde, ohne dass jedoch wirkliche Details bekannt gegeben wurden. ChatGPT bietet die Möglichkeit, alles zu sehen, was auf dem Bildschirm des Benutzergeräts passiert.

KI lernt, Menschen zu täuschen, obwohl sie darauf trainiert ist, ehrlich zu sein

KI lernt, Menschen zu täuschen, obwohl sie darauf trainiert ist, ehrlich zu sein

Viele Spitzen-KIs lernen, obwohl sie darauf trainiert sind, ehrlich zu sein, durch Training, zu täuschen und Benutzer systematisch zu falschen Überzeugungen zu verleiten, wie eine neue Studie zeigt.

So ändern Sie Fragen auf ChatGPT

So ändern Sie Fragen auf ChatGPT

ChatGPT verfügt jetzt über eine Option zum Ändern von Fragen, sodass Benutzer die Frage oder den Inhalt bearbeiten können, den sie mit ChatGPT austauschen.

So erkennen Sie gefälschte QR-Codes und schützen Ihre Daten

So erkennen Sie gefälschte QR-Codes und schützen Ihre Daten

QR-Codes wirken ziemlich harmlos, bis man einen gefälschten Code scannt und etwas Böses auf einen losgeht. Um Ihr Telefon und Ihre Daten zu schützen, gibt es einige Möglichkeiten, einen gefälschten QR-Code zu erkennen.

Unterschied zwischen WENN- und Umschaltfunktionen in Excel

Unterschied zwischen WENN- und Umschaltfunktionen in Excel

Die IF-Anweisung ist eine gängige logische Funktion in Excel. Die SWITCH-Anweisung ist weniger bekannt, kann aber in manchen Situationen anstelle der IF-Anweisung verwendet werden.

So fügen Sie mit Adobe Camera Raw einen Spotlight-Effekt hinter Ihr Motiv ein

So fügen Sie mit Adobe Camera Raw einen Spotlight-Effekt hinter Ihr Motiv ein

Ein Scheinwerfer hinter Ihrem Motiv ist eine hervorragende Möglichkeit, Ihr Motiv vom Hintergrund abzuheben. Ein Scheinwerfer kann Ihren Porträts Tiefe verleihen.

So verwenden Sie Apple Invites zum Erstellen von Ereignissen

So verwenden Sie Apple Invites zum Erstellen von Ereignissen

Apple hat eine eigene Event-Management-App namens „Invites“ veröffentlicht. Mit dieser App können Sie Events erstellen, Einladungen versenden und Zusagen verwalten.

Cheat Heroes 3, Heroes 3 Codes alle Versionen

Cheat Heroes 3, Heroes 3 Codes alle Versionen

Hier sind alle Heroes 3-Codes, Heroes 3-Cheats für alle Versionen wie Heroes 3 WoG-Cheat, Heroes 3 SoD, Heroes 3 of Might and Magic

Neuester Tay Du VNG-Code und wie man den Code eingibt

Neuester Tay Du VNG-Code und wie man den Code eingibt

Der neueste Tay Du VNG-Code bietet Spielern eine Reihe attraktiver Belohnungen wie Elixiere, Silber, Goldbarren, Belohnungstruhen und eine Reihe anderer Gegenstände, die neuen Spielern das Freischalten allgemeiner Runden erleichtern.

Mark Zuckerberg hasst Apple und muss trotzdem ein Macbook verwenden, aber das ist sehr seltsam

Mark Zuckerberg hasst Apple und muss trotzdem ein Macbook verwenden, aber das ist sehr seltsam

Mark Zuckerberg postete kürzlich ein Foto von sich, auf dem er an einem Laptop arbeitet. Es war ein Laptop (angeblich ein MacBook), aber das Logo mit dem angebissenen Apfel war nirgends zu sehen.

So verwenden Sie Memoji auf dem iPhone

So verwenden Sie Memoji auf dem iPhone

Mit iPhone-Memoji können Sie Nachrichten und FaceTime-Gesprächen durch Ihre Mimik eine persönliche Note verleihen.

So zeichnen Sie Bildschirmvideos auf einem Chromebook auf

So zeichnen Sie Bildschirmvideos auf einem Chromebook auf

Die Bildschirmaufzeichnung ist eine äußerst nützliche Funktion, aber nicht alle Betriebssysteme verfügen über diese integrierte Funktion.