Deepseek veröffentlicht Free Language Model v3, das auf gängigen Hardwarekonfigurationen gut läuft

Das chinesische KI-Startup DeepSeek hat gerade sein neuestes Large Language Model (LLM), DeepSeek-V3-0324, offiziell veröffentlicht. Mit einer Kapazität von bis zu 641 GB wurde dieses Modell auf der Hugging Face AI-Plattform angekündigt, ohne dass viele Informationen preisgegeben wurden – ganz im Sinne des gewohnten Geheimniskrämerei-Stils des Unternehmens bei neuen Produkten.

Das Besondere an diesem Modell ist die MIT-Lizenz, die eine freie kommerzielle Nutzung ermöglicht. Erste Benchmark-Ergebnisse zeigen, dass DeepSeek-V3-0324 auf gängigen Hardwarekonfigurationen wie Apples Mac Studio mit M3-Ultra-Chip läuft. KI-Wissenschaftler Awni Hannun berichtete, dass mit dieser Konfiguration eine Verarbeitungsgeschwindigkeit von über 20 Token pro Sekunde erreicht werden konnte. Die Möglichkeit, ein großes Sprachmodell auf Standardhardware vor Ort auszuführen, steht im krassen Gegensatz zum traditionellen Ansatz, komplexe Rechenzentrumsinfrastrukturen zur Unterstützung fortschrittlicher KI-Modelle zu nutzen.

Deepseek veröffentlicht Free Language Model v3, das auf gängigen Hardwarekonfigurationen gut läuft

Laut DeepSeek haben erste Tests deutliche Verbesserungen gegenüber früheren Versionen gezeigt. Das Modell wurde von internen Stakeholdern rigoros getestet und zeigte eine hervorragende Leistung. Es übertraf sogar alle Konkurrenzmodelle und schlug Anthropics Claude Sonnet 3.5 bei Aufgaben, die kein Deep Learning erfordern. Im Gegensatz zu Sonnet-Modellen, die ein kostenpflichtiges Abonnement erfordern, kann DeepSeek-V3-0324 jedoch völlig kostenlos heruntergeladen und genutzt werden.

Technisch gesehen verwendet DeepSeek-V3-0324 eine Mischung aus Experten (MoE)-Architektur. Es zeichnet sich durch die selektive Nutzung von etwa 37 Milliarden der 685 Milliarden Parameter für jede Aufgabe aus. Dies erhöht die Effizienz durch reduzierten Rechenaufwand bei gleichbleibender Leistung. Das Modell nutzt außerdem die Technologien Multi-Head Latent Attention (MLA) und Multi-Token Prediction (MTP), die zu einem verbesserten Kontextspeicher und einer schnelleren Ausgabe beitragen.

Nutzer können auf Wunsch über Hugging Face, die Chat-Schnittstelle und API von OpenRouter sowie die Chat-Plattform von DeepSeek auf DeepSeek-V3-0324 zugreifen. Der Inferenzdienstleister Hyperbolic Labs bietet ebenfalls Zugriff auf das Modell.

Mit der Veröffentlichung von DeepSeek-V3-0324 behauptet das Unternehmen weiterhin seine Position im Wettlauf um die Entwicklung großer Sprachmodelle und bietet gleichzeitig eine leistungsstarke und zugängliche Option für die KI-Forschungs- und Entwicklungscommunity. Die Möglichkeit, auf Standardhardware zu laufen, gepaart mit einer kostenlosen Lizenz, wird diesem Modell in naher Zukunft sicherlich viele Möglichkeiten für die praktische Anwendung eröffnen.

Sign up and earn $1000 a day ⋙

Leave a Comment

Neueste Genshin Impact Codes April 2025

Neueste Genshin Impact Codes April 2025

Mit dem Genshin Impact 5.5-Code können Sie Ursteine, magische Mineralien, Erfahrung und viele andere Belohnungen eintauschen.

So verwandeln Sie Ihr iPad in ein zusätzliches Mac-Display

So verwandeln Sie Ihr iPad in ein zusätzliches Mac-Display

macOS Catalina und iPadOS unterstützen eine neue Funktion namens Sidecar, mit der Sie Ihr iPad als Zweitdisplay für Ihren Mac verwenden können.

Wallpaper 1280, schönes Nokia 1280 Handy-Wallpaper

Wallpaper 1280, schönes Nokia 1280 Handy-Wallpaper

Dies ist ein Satz von Nokia 1280-Hintergrundbildern. Wenn Sie schon einmal eine SMS geschrieben haben, um 1280-Hintergrundbilder oder Ziegelstein-Telefon-Hintergrundbilder zu erhalten, dann schauen Sie sich diese Hintergrundbilder an.

Hyperschall-Raumflugzeug erreicht Geschwindigkeit von 11.115 km/h

Hyperschall-Raumflugzeug erreicht Geschwindigkeit von 11.115 km/h

Venus Aerospace hat die ersten Bilder seines neuen Hyperschallflugzeugs namens Stargazer veröffentlicht, das eine Höchstgeschwindigkeit von 11.115 km/h erreichen kann, was Mach 9 entspricht.

Bananen zum Frühstück helfen, Blähungen zu reduzieren

Bananen zum Frühstück helfen, Blähungen zu reduzieren

Blähungen können jeden treffen. Die gute Nachricht: Das Frühstück ist ein guter Zeitpunkt, um Ihrer Mahlzeit ein paar Zutaten hinzuzufügen, die Blähungen vorbeugen können. Diese Zutat sind Bananen.

OpenAI kündigt wichtiges Update zur KI-Bildgenerierung in ChatGPT an

OpenAI kündigt wichtiges Update zur KI-Bildgenerierung in ChatGPT an

OpenAI hat gerade offiziell ein bemerkenswertes Upgrade der KI-Bildgenerierungsfunktion in ChatGPT eingeführt, ein wichtiger Schritt nach vorne im Vergleich zur Verwendung eines separaten Bildgenerierungsmodells wie beim vorherigen DALL-E.

Deepseek veröffentlicht Free Language Model v3, das auf gängigen Hardwarekonfigurationen gut läuft

Deepseek veröffentlicht Free Language Model v3, das auf gängigen Hardwarekonfigurationen gut läuft

Das chinesische KI-Startup DeepSeek hat gerade offiziell sein neuestes großes Sprachmodell (LLM), DeepSeek-V3-0324, veröffentlicht.

Gründe, Gboard aufzugeben und auf die Samsung-Tastatur umzusteigen

Gründe, Gboard aufzugeben und auf die Samsung-Tastatur umzusteigen

Gboard war lange Zeit die bevorzugte Tastatur auf Android-Handys. Viele Nutzer sind jedoch kürzlich auf die Samsung-Tastatur umgestiegen und haben es nie bereut.

Atemberaubende Bilder des Supermondes aus aller Welt

Atemberaubende Bilder des Supermondes aus aller Welt

Schöne Mondbilder sind im Internet keine Seltenheit. Dieser Artikel fasst für Sie die schönsten Mondbilder der Welt zusammen.

ChatGPT läuft möglicherweise unbemerkt auf Ihrem Telefon und wie Sie das Problem beheben können

ChatGPT läuft möglicherweise unbemerkt auf Ihrem Telefon und wie Sie das Problem beheben können

Hintergrundgespräche ermöglichen die Unterhaltung mit ChatGPT, während andere Apps genutzt werden oder der Bildschirm ausgeschaltet ist. ChatGPT kann das Telefonverhalten eines Benutzers rund um die Uhr überwachen.

Googles Gemini antwortet einigen Benutzern mit seltsamen, wiederholten unsinnigen Wörtern

Googles Gemini antwortet einigen Benutzern mit seltsamen, wiederholten unsinnigen Wörtern

Vor kurzem ist einigen Benutzern aufgefallen, dass Google Gemini in einigen Antworten sich wiederholenden Text, seltsame Zeichen und völligen Unsinn ausgibt.

Vollständiger Code von Luc Tung Tam Quoc aktuell und Anweisungen zum Einlösen des Codes

Vollständiger Code von Luc Tung Tam Quoc aktuell und Anweisungen zum Einlösen des Codes

Code Luc Tung Tam Quoc bietet neuen Spielern alles, was sie für den Beginn ihrer Reise brauchen.

Code Giang Ho Ngu Tuyet und wie man Code eingibt

Code Giang Ho Ngu Tuyet und wie man Code eingibt

Giang Ho Ngu Tuyet ist ein MMORPG-Spiel, das auf den fünf Elementen der gegenseitigen Erzeugung und Hemmung basiert. Mit 5 Sekten: Shaolin, Minh Giao, Vo Dang, Duong Gia, Thien Nhan basierend auf den fünf Elementen Metall, Holz, Wasser, Feuer, Erde.

MIUI 13-Hintergrundbild, MIUI 13-Hintergrundbild

MIUI 13-Hintergrundbild, MIUI 13-Hintergrundbild

MIUI 13-Hintergrundbilder mit vielen verschiedenen Hintergrundthemen von abstrakt bis Landschaft, kombiniert mit lebendigen und attraktiven Farben, aus denen der Benutzer auswählen kann.

So beheben Sie den Fehler „Ihr Viren- und Bedrohungsschutz wird von Ihrer Organisation verwaltet“

So beheben Sie den Fehler „Ihr Viren- und Bedrohungsschutz wird von Ihrer Organisation verwaltet“

Was müssen Sie tun, um den Fehler zu beheben? Ihr Viren- und Bedrohungsschutz wird von Ihrer Organisation verwaltet?