Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Auf der I/O 2024 kündigte Google die nächste Gemma 2-Modellreihe an und veröffentlichte die leichten Modelle nun endlich unter einer Open-Source-Lizenz. Das neue Modell Gemma 2 27B soll vielversprechend sein und einige der größeren Modelle wie Llama 3 70B und Qwen 1.5 32B übertreffen. Um diese Aussage zu überprüfen, vergleichen wir Gemma 2 und Llama 3 – zwei der derzeit besten Open-Source-Modelle.

Kreatives Schreiben

Lassen Sie uns zunächst testen, wie gut Gemma 2 und Llama 3 beim kreativen Schreiben abschneiden. Der Autor des Artikels bat beide Modelle, eine Kurzgeschichte über die Beziehung zwischen Mond und Sonne zu schreiben. Beide schnitten sehr gut ab, aber Googles Gemma 2-Modell stach mit seiner interessanten Prosa und der guten Geschichte hervor.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Andererseits wirkt das Llama 3 etwas langweilig und roboterhaft. Google war mit seinen Gemini-Modellen schon immer gut darin, Text zu generieren, und das kleinere Gemma 2 27B bildet da keine Ausnahme.

Gewinnoption: Gemma 2

Mehrsprachiges Testen

In der nächsten Runde wollen wir sehen, wie gut beide Modelle mit anderen Sprachen als Englisch umgehen. Da Google damit wirbt, dass Gemma 2 mehrere Sprachen gut versteht, habe ich es mit Metas Llama 3-Modell verglichen. Ich habe beide Modelle gebeten, einen Text in Hindi zu übersetzen. Sowohl Gemma 2 als auch Llama 3 schnitten sehr gut ab.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Der Autor probierte auch eine weitere Sprache, Bengalisch, aus, und die Modelle zeigten eine ähnlich gute Leistung. Zumindest für indische Sprachen lässt sich sagen, dass Gemma 2 und Llama 3 auf einem großen Korpus gut trainiert wurden. Gemma 2 27B ist jedoch fast 2,5-mal kleiner als Llama 3 70B, was es noch beeindruckender macht.

Gewinnoptionen: Gemma 2 und Llama 3

Testen Sie Ihre Argumentation

Gemma 2 und Llama 3 gehören zwar nicht zu den intelligentesten Modellen auf dem Markt, können aber einige gängige Denktests genauso gut durchführen wie deutlich größere Modelle. Im vorherigen Vergleich zwischen Llama 3 und GPT-4 überzeugte Metas 70B-Modell, da es trotz seiner geringeren Größe eine recht gute Intelligenz zeigte.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

In dieser Runde schlug Lama 3 Gemma 2 mit großem Abstand. Lama 3 beantwortete zwei von drei Fragen richtig, während Gemma 2 Mühe hatte, auch nur eine richtig zu beantworten. Gemma 2 war einfach nicht darauf trainiert, komplexe Denkaufgaben zu lösen.

Llama 3 hingegen verfügt über eine solide Argumentationsgrundlage, die höchstwahrscheinlich aus dem Token-Datensatz abgeleitet wurde. Trotz seiner geringen Größe – zumindest im Vergleich zu Billionen-Parameter-Modellen wie GPT-4 – weist es ein überdurchschnittliches Maß an Intelligenz auf. Letztendlich führt die Verwendung von mehr Token zum Trainieren des Modells tatsächlich zu einem robusteren Modell.

Gewinnoption: Lama 3

Folgen Sie den Anweisungen

In der nächsten Runde baten die Autoren Gemma 2 und Llama 3, zehn Wörter mit der Endung „NPU“ zu generieren. Llama 3 erzielte 10 von 10 richtigen Antworten. Gemma 2 hingegen generierte nur 7 von 10 korrekten Sätzen. In vielen früheren Versionen folgten Google-Modelle, darunter auch Gemini, den Benutzeranweisungen nicht korrekt. Dieser Trend setzte sich auch bei Gemma 2 fort.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Das Befolgen von Benutzeranweisungen ist für KI-Modelle sehr wichtig. Es gewährleistet Zuverlässigkeit und generiert präzise Antworten auf Ihre Anweisungen. Auch in puncto Sicherheit trägt es dazu bei, das Modell auf dem Boden zu halten und Sicherheitsprotokolle besser einzuhalten.

Gewinnoption: Lama 3

Informationen finden

Sowohl Gemma 2 als auch Llama 3 haben eine Kontextlänge von 8.000 Token. Der Autor fügte einen riesigen Textblock hinzu, der direkt aus dem Buch „Stolz und Vorurteil“ stammt und über 17.000 Zeichen und 3,8.000 Token umfasst. Wie üblich platzierte der Autor irgendwo im Text ein zufälliges Zitat und bat beide Modelle, es zu finden.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Gemma 2 fand die Information schnell und wies darauf hin, dass die Anweisung zufällig eingefügt wurde. Auch Llama 3 fand sie und wies darauf hin, dass die Anweisung fehl am Platz wirkte. Was den langen Kontextspeicher betrifft, sind beide Modelle, obwohl auf 8.000 Token begrenzt, in dieser Hinsicht recht leistungsstark.

Beachten Sie, dass der Autor diesen Test auf HuggingChat (Web) ausgeführt hat, da meta.ai sich geweigert hat, diese Eingabeaufforderung auszuführen, höchstwahrscheinlich aufgrund urheberrechtlich geschützter Inhalte.

Gewinnoptionen: Gemma 2 und Llama 3

Auf Halluzinationen prüfen

Kleinere Modelle neigen aufgrund begrenzter Trainingsdaten zu KI-Halluzinationen und erfinden oft Informationen, wenn das Modell auf unbekannte Themen trifft. Daher verwendete der Autor einen erfundenen Ländernamen, um zu testen, ob Gemma 2 und Llama 3 halluzinieren würden. Überraschenderweise taten sie dies nicht, was bedeutet, dass sowohl Google als auch Meta eine recht gute Grundlage für ihre Modelle haben.

Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?
Ist Gemma 2 oder Llama 3 das beste Open-Source-Modell?

Der Autor stellte außerdem eine weitere (falsche) Frage, um die Gültigkeit der Modelle zu testen, doch auch hier halluzinierte er nicht. Übrigens testete der Autor Llama 3 auf HuggingChat, während meta.ai im Internet nach aktuellen Informationen zu verwandten Themen suchte.

Gewinnoptionen: Gemma 2 und Llama 3

Abschließen

Googles Gemma 2 27B-Modell schneidet zwar bei Denktests nicht gut ab, ist aber für eine Reihe anderer Aufgaben geeignet. Es eignet sich hervorragend für kreatives Schreiben, unterstützt mehrere Sprachen, hat ein gutes Gedächtnis und – das Beste – verursacht keine Halluzinationen wie frühere Modelle.

Llama 3 ist natürlich besser, aber auch ein deutlich größeres Modell, das mit 70 Milliarden Parametern trainiert wurde. Entwickler werden das Gemma 2 27B-Modell für viele Anwendungsfälle nützlich finden. Für Inferenz ist auch das Gemma 2 9B verfügbar.

Darüber hinaus sollten Nutzer einen Blick auf den Gemini 1.5 Flash werfen, der ebenfalls ein deutlich kleineres Modell ist und ebenfalls multimodale Eingabe unterstützt. Außerdem ist er extrem schnell und effizient.

Sign up and earn $1000 a day ⋙

Leave a Comment

Die besten Laptops für Studenten im Jahr 2025

Die besten Laptops für Studenten im Jahr 2025

Studierende benötigen für ihr Studium einen bestimmten Laptop-Typ. Dieser sollte nicht nur leistungsstark genug sein, um im gewählten Studienfach gute Leistungen zu erbringen, sondern auch kompakt und leicht genug, um ihn den ganzen Tag mit sich herumzutragen.

So fügen Sie Windows 10 einen Drucker hinzu

So fügen Sie Windows 10 einen Drucker hinzu

Das Hinzufügen eines Druckers zu Windows 10 ist einfach, allerdings ist der Vorgang für kabelgebundene Geräte anders als für kabellose Geräte.

So überprüfen Sie den RAM und die RAM-Fehler auf Ihrem Computer mit höchster Genauigkeit

So überprüfen Sie den RAM und die RAM-Fehler auf Ihrem Computer mit höchster Genauigkeit

Wie Sie wissen, ist RAM ein sehr wichtiger Hardwareteil eines Computers. Es dient als Speicher für die Datenverarbeitung und ist entscheidend für die Geschwindigkeit eines Laptops oder PCs. Im folgenden Artikel stellt WebTech360 einige Möglichkeiten vor, wie Sie mithilfe von Software unter Windows RAM-Fehler überprüfen können.

2 Möglichkeiten zur Behebung von Netzwerküberlastungen, die das WLAN verlangsamen

2 Möglichkeiten zur Behebung von Netzwerküberlastungen, die das WLAN verlangsamen

WLAN-Netzwerke werden von vielen Faktoren beeinflusst, die über Router, Bandbreite und Störungen hinausgehen. Es gibt jedoch einige clevere Möglichkeiten, Ihr Netzwerk zu verbessern.

So führen Sie mit Tenorshare Reiboot ein Downgrade von iOS 17 auf iOS 16 ohne Datenverlust durch

So führen Sie mit Tenorshare Reiboot ein Downgrade von iOS 17 auf iOS 16 ohne Datenverlust durch

Wenn Sie auf Ihrem Telefon zur stabilen Version von iOS 16 zurückkehren möchten, finden Sie hier die grundlegende Anleitung zum Deinstallieren von iOS 17 und zum Downgrade von iOS 17 auf 16.

Was passiert mit dem Körper, wenn man täglich Joghurt isst?

Was passiert mit dem Körper, wenn man täglich Joghurt isst?

Joghurt ist ein tolles Lebensmittel. Ist es gesund, täglich Joghurt zu essen? Was passiert mit Ihrem Körper, wenn Sie täglich Joghurt essen? Finden wir es gemeinsam heraus!

Welche Reissorte ist am gesündesten?

Welche Reissorte ist am gesündesten?

In diesem Artikel werden die nahrhaftesten Reissorten besprochen und wie Sie den gesundheitlichen Nutzen der Reissorte Ihrer Wahl maximieren können.

So wachen Sie morgens pünktlich auf

So wachen Sie morgens pünktlich auf

Das Erstellen eines Schlafplans und einer Schlafenszeitroutine, das Ändern Ihres Weckers und die Anpassung Ihrer Ernährung sind einige der Maßnahmen, die Ihnen helfen können, besser zu schlafen und morgens pünktlich aufzuwachen.

Mieten Sie bitte! Vermieter-Sim-Tipps für Anfänger

Mieten Sie bitte! Vermieter-Sim-Tipps für Anfänger

Miete bitte! Landlord Sim ist ein Simulationsspiel für iOS und Android. Du spielst den Vermieter eines Apartmentkomplexes und vermietest eine Wohnung mit dem Ziel, die Innenausstattung deiner Wohnungen zu modernisieren und sie für die Vermietung vorzubereiten.

Neueste Badezimmer-Tower-Defense-Codes und wie man Codes eingibt

Neueste Badezimmer-Tower-Defense-Codes und wie man Codes eingibt

Hol dir Roblox-Spielcodes für Bathroom Tower Defense und löse sie gegen tolle Belohnungen ein. Damit kannst du Türme mit höherem Schaden verbessern oder freischalten.

Warum ChatGPT besser ist als DeepSeek

Warum ChatGPT besser ist als DeepSeek

In DeepSeek waren anfangs große Hoffnungen gesetzt. Der KI-Chatbot wurde als starker Konkurrent von ChatGPT vermarktet und versprach intelligente Konversationsfunktionen und -erlebnisse.

Lernen Sie Fireflies.ai kennen: Die kostenlose KI-Sekretärin, die Ihnen stundenlange Arbeit erspart

Lernen Sie Fireflies.ai kennen: Die kostenlose KI-Sekretärin, die Ihnen stundenlange Arbeit erspart

Beim Notieren anderer wichtiger Dinge übersieht man leicht wichtige Details. Und während des Chats Notizen zu machen, kann ablenkend sein. Fireflies.ai ist die Lösung.

Wie man Axolotl in Minecraft züchtet, Minecraft Salamander zähmt

Wie man Axolotl in Minecraft züchtet, Minecraft Salamander zähmt

Axolot Minecraft ist für Spieler ein großartiger Helfer bei Unterwasseroperationen, wenn sie wissen, wie man ihn benutzt.

A Quiet Place: The Road Ahead PC-Spielkonfiguration

A Quiet Place: The Road Ahead PC-Spielkonfiguration

Die Konfiguration von „A Quiet Place: The Road Aheads“ wird ziemlich hoch bewertet, Sie müssen also die Konfiguration berücksichtigen, bevor Sie sich zum Herunterladen entscheiden.

Die mysteriöse Kraft der Zahl 33 in der Numerologie

Die mysteriöse Kraft der Zahl 33 in der Numerologie

In der Numerologie gilt die Zahl 33 oft als kraftvolle und mystische Zahl. Hier erfahren Sie, was Sie über die Zahl 33 in der Numerologie wissen müssen.