Amazon kündigt Nova Sonic Soundmodell an und behauptet, dass die Leistung OpenAI und Google übertrifft

Amazon hat heute Nova Sonic vorgestellt, ein fortschrittliches Spracherkennungsmodell, mit dem Entwickler Anwendungen entwickeln können, die in Echtzeit mit menschenähnlichen Stimmen kommunizieren. Laut Amazon bietet das neue Akustikmodell ein branchenführendes Preis-Leistungs-Verhältnis und geringe Latenzzeiten.

Normalerweise müssen Entwickler bei der Entwicklung einer sprachgesteuerten Anwendung mit mehreren Modellen gleichzeitig arbeiten:

Spracherkennungsmodell zum Konvertieren von Audio in Text.
Large Language Model (LLM) zum Verstehen und Generieren von Antworten.
Text-to-Speech-Modell.

Dieser Ansatz ist nicht nur komplex, sondern lässt auch häufig wichtige akustische Zusammenhänge wie Tonfall, Prosodie und Sprechstil außer Acht.

Amazon kündigt Nova Sonic Soundmodell an und behauptet, dass die Leistung OpenAI und Google übertrifft

Nova Sonic bewältigt diese Herausforderung, indem es Sprachverständnis und -generierung in einem einzigen Modell integriert. Dieser einheitliche Ansatz hilft dem Modell, Ton, Stil und Audioeingabe zu erfassen und so einen natürlicheren Dialog zu erzeugen. Es bestimmt außerdem, wann angemessen reagiert werden muss, und verarbeitet Einmischungen besser.

Nova Sonic unterstützt sowohl männliche als auch weibliche Stimmen mit verschiedenen englischen Akzenten, darunter amerikanische und britische. Entwickler können über Amazon Bedrock auf das Modell zugreifen, indem sie eine bidirektionale Streaming-API verwenden, die Funktionsaufrufe unterstützt. Das Modell enthält außerdem integrierte Schutzfunktionen wie Inhaltsmoderation und Wasserzeichen.

In diesem Zusammenhang kündigte OpenAI letzten Monat eine neue Generation von Sprache-zu-Text-Modellen an – gpt-4o-transcribe und gpt-4o-mini-transcribe – mit erheblichen Verbesserungen bei Wortfehlerrate, Spracherkennung und Genauigkeit im Vergleich zu früheren Whisper-Modellen.

Tags: #Amazon #Nova Sonic Soundmodell #OpenAI #Google #künstliche Intelligenz #Sprache-zu-Sprache

So aktivieren oder deaktivieren Sie 2FA bei Amazon

Die Zwei-Faktor-Authentifizierung (2FA) ist eine hervorragende Möglichkeit, die Sicherheit Ihres Amazon-Kontos zu erhöhen. Hier erfahren Sie, wie Sie diese Funktion aktivieren oder deaktivieren können.

So kaufen Sie ein Buch bei Audible

Entdecken Sie, wie Sie Bücher bei Audible kaufen können, und genießen Sie Ihre Lieblingshörbücher. Hörbücher bieten eine bequeme Möglichkeit, Geschichten zu erleben.

So führen Sie eine erweiterte Suche bei Amazon durch

Erfahren Sie, wie Sie eine erweiterte Suche bei Amazon durchführen können, um präzisere Suchergebnisse zu erzielen. Nutzen Sie spezifische Parameter und filternde Optionen für ein besseres Einkaufserlebnis.

So erhalten Sie wieder Zugriff auf die Festplatte und beheben den Fehler, dass die Festplatte nicht geöffnet werden kann

In diesem Artikel erfahren Sie, wie Sie bei einem Festplattenausfall wieder auf Ihre Festplatte zugreifen können. Folgen Sie uns!

So verwenden Sie Conversation Awareness und Live Listen auf AirPods

Auf den ersten Blick sehen AirPods wie alle anderen kabellosen Ohrhörer aus. Doch das änderte sich, als einige weniger bekannte Funktionen entdeckt wurden.

Alles über iOS 26

Apple hat iOS 26 vorgestellt – ein wichtiges Update mit einem brandneuen Milchglasdesign, intelligenteren Erlebnissen und Verbesserungen an bekannten Apps.

Die besten Laptops für Studenten im Jahr 2025

Studierende benötigen für ihr Studium einen bestimmten Laptop-Typ. Dieser sollte nicht nur leistungsstark genug sein, um im gewählten Studienfach gute Leistungen zu erbringen, sondern auch kompakt und leicht genug, um ihn den ganzen Tag mit sich herumzutragen.

So fügen Sie Windows 10 einen Drucker hinzu

Das Hinzufügen eines Druckers zu Windows 10 ist einfach, allerdings ist der Vorgang für kabelgebundene Geräte anders als für kabellose Geräte.

So überprüfen Sie den RAM und die RAM-Fehler auf Ihrem Computer mit höchster Genauigkeit

Wie Sie wissen, ist RAM ein sehr wichtiger Hardwareteil eines Computers. Es dient als Speicher für die Datenverarbeitung und ist entscheidend für die Geschwindigkeit eines Laptops oder PCs. Im folgenden Artikel stellt WebTech360 einige Möglichkeiten vor, wie Sie mithilfe von Software unter Windows RAM-Fehler überprüfen können.

2 Möglichkeiten zur Behebung von Netzwerküberlastungen, die das WLAN verlangsamen

WLAN-Netzwerke werden von vielen Faktoren beeinflusst, die über Router, Bandbreite und Störungen hinausgehen. Es gibt jedoch einige clevere Möglichkeiten, Ihr Netzwerk zu verbessern.

So führen Sie mit Tenorshare Reiboot ein Downgrade von iOS 17 auf iOS 16 ohne Datenverlust durch

Wenn Sie auf Ihrem Telefon zur stabilen Version von iOS 16 zurückkehren möchten, finden Sie hier die grundlegende Anleitung zum Deinstallieren von iOS 17 und zum Downgrade von iOS 17 auf 16.

Was passiert mit dem Körper, wenn man täglich Joghurt isst?

Joghurt ist ein tolles Lebensmittel. Ist es gesund, täglich Joghurt zu essen? Was passiert mit Ihrem Körper, wenn Sie täglich Joghurt essen? Finden wir es gemeinsam heraus!

Welche Reissorte ist am gesündesten?

In diesem Artikel werden die nahrhaftesten Reissorten besprochen und wie Sie den gesundheitlichen Nutzen der Reissorte Ihrer Wahl maximieren können.

So wachen Sie morgens pünktlich auf

Das Erstellen eines Schlafplans und einer Schlafenszeitroutine, das Ändern Ihres Weckers und die Anpassung Ihrer Ernährung sind einige der Maßnahmen, die Ihnen helfen können, besser zu schlafen und morgens pünktlich aufzuwachen.

Mieten Sie bitte! Vermieter-Sim-Tipps für Anfänger

Miete bitte! Landlord Sim ist ein Simulationsspiel für iOS und Android. Du spielst den Vermieter eines Apartmentkomplexes und vermietest eine Wohnung mit dem Ziel, die Innenausstattung deiner Wohnungen zu modernisieren und sie für die Vermietung vorzubereiten.

Neueste Badezimmer-Tower-Defense-Codes und wie man Codes eingibt

Hol dir Roblox-Spielcodes für Bathroom Tower Defense und löse sie gegen tolle Belohnungen ein. Damit kannst du Türme mit höherem Schaden verbessern oder freischalten.

Warum ChatGPT besser ist als DeepSeek

In DeepSeek waren anfangs große Hoffnungen gesetzt. Der KI-Chatbot wurde als starker Konkurrent von ChatGPT vermarktet und versprach intelligente Konversationsfunktionen und -erlebnisse.

Lernen Sie Fireflies.ai kennen: Die kostenlose KI-Sekretärin, die Ihnen stundenlange Arbeit erspart

Beim Notieren anderer wichtiger Dinge übersieht man leicht wichtige Details. Und während des Chats Notizen zu machen, kann ablenkend sein. Fireflies.ai ist die Lösung.

Amazon kündigt Nova Sonic Soundmodell an und behauptet, dass die Leistung OpenAI und Google übertrifft

Leave a Comment

So aktivieren oder deaktivieren Sie 2FA bei Amazon

So kaufen Sie ein Buch bei Audible

So führen Sie eine erweiterte Suche bei Amazon durch

So erhalten Sie wieder Zugriff auf die Festplatte und beheben den Fehler, dass die Festplatte nicht geöffnet werden kann

So verwenden Sie Conversation Awareness und Live Listen auf AirPods

Alles über iOS 26

Die besten Laptops für Studenten im Jahr 2025

So fügen Sie Windows 10 einen Drucker hinzu

So überprüfen Sie den RAM und die RAM-Fehler auf Ihrem Computer mit höchster Genauigkeit

2 Möglichkeiten zur Behebung von Netzwerküberlastungen, die das WLAN verlangsamen

So führen Sie mit Tenorshare Reiboot ein Downgrade von iOS 17 auf iOS 16 ohne Datenverlust durch

Was passiert mit dem Körper, wenn man täglich Joghurt isst?

Welche Reissorte ist am gesündesten?

So wachen Sie morgens pünktlich auf

Mieten Sie bitte! Vermieter-Sim-Tipps für Anfänger

Neueste Badezimmer-Tower-Defense-Codes und wie man Codes eingibt

Warum ChatGPT besser ist als DeepSeek

Lernen Sie Fireflies.ai kennen: Die kostenlose KI-Sekretärin, die Ihnen stundenlange Arbeit erspart