KI lernt, Menschen zu täuschen, obwohl sie darauf trainiert ist, ehrlich zu sein

Viele Spitzen-KIs lernen trotz ihrer Ausbildung zur Ehrlichkeit durch Training zu täuschen und „verleiten Benutzer systematisch zu falschen Überzeugungen“, wie eine neue Studie zeigt.

Das Forschungsteam wurde von Dr. Peter S. Park, einem Doktoranden am Massachusetts Institute of Technology (MIT), der sich mit dem Überleben und der Sicherheit von KI beschäftigt, und vier weiteren Mitgliedern geleitet. Während der Forschung erhielt das Team zudem Rat von zahlreichen Experten, darunter Geoffrey Hinton, einem der Begründer der künstlichen Intelligenz.

KI lernt, Menschen zu täuschen, obwohl sie darauf trainiert ist, ehrlich zu sein
Abbildung: Mittel.

Die Forschung konzentrierte sich auf zwei KI-Systeme: allgemeine Systeme, die darauf trainiert sind, mehrere Aufgaben auszuführen, wie GPT-4 von OpenAI , und Systeme, die speziell darauf ausgelegt sind, eine bestimmte Aufgabe auszuführen, wie Cicero von Meta.

Diese KI-Systeme werden darauf trainiert, ehrlich zu sein, aber während des Trainings lernen sie oft betrügerische Tricks, um Aufgaben zu erledigen, sagte Herr Park.

Laut der Studie neigen KI-Systeme, die darauf trainiert sind, „Spiele mit einem sozialen Element zu gewinnen“, besonders dazu, zu täuschen.

So testete das Team beispielsweise Cicero, den Meta, um ehrlich zu sein, trainierte, in Diplomacy, einem klassischen Strategiespiel, bei dem die Spieler Allianzen für sich selbst schmieden und rivalisierende Allianzen auflösen müssen. Die KI verriet Verbündete oft und log offen.

Experimente mit GPT-4 zeigten, dass das Tool von OpenAI einen Mitarbeiter von TaskRabbit, einem Unternehmen für Hausreinigung und Möbelmontage, erfolgreich „psychologisch manipulierte“. Das Tool behauptete, es handele sich um einen Menschen, der aufgrund einer schweren Sehbehinderung Hilfe beim Lösen eines Captcha-Codes benötige. Dieser Mitarbeiter half der KI von OpenAI trotz vorheriger Zweifel, die Hürde zu überwinden.

Parks Team berief sich auf Forschungsergebnisse von Anthropic, dem Unternehmen hinter Claude AI. Diese zeigten, dass sichere Trainingsmethoden nutzlos und schwer umkehrbar werden, sobald ein großes Sprachmodell (LLM) lernt, zu täuschen. Dies, so das Team, sei ein besorgniserregendes Problem in der KI.

Die Forschungsergebnisse des Teams wurden in Cell Press veröffentlicht – einer Sammlung führender multidisziplinärer wissenschaftlicher Berichte.

Meta und OpenAI haben die Ergebnisse dieser Untersuchung nicht kommentiert.

Aus Angst, dass künstliche Intelligenzsysteme erhebliche Risiken bergen könnten, forderte das Team die politischen Entscheidungsträger außerdem auf, strengere KI-Vorschriften einzuführen.

Laut dem Forschungsteam bedarf es einer Regulierung der KI. Modelle, die sich betrügerisch verhalten, müssen den Anforderungen der Risikobewertung entsprechen, und KI-Systeme und ihre Ergebnisse müssen streng kontrolliert werden. Gegebenenfalls müssen alle Daten gelöscht und von Grund auf neu trainiert werden.

Sign up and earn $1000 a day ⋙

Leave a Comment

Alles, was Sie brauchen, um Ihren Laptop durch ein Telefon zu ersetzen

Alles, was Sie brauchen, um Ihren Laptop durch ein Telefon zu ersetzen

Können Sie Ihren Laptop wirklich durch Ihr Telefon ersetzen? Ja, aber Sie benötigen das richtige Zubehör, um Ihr Telefon in einen Laptop zu verwandeln.

ChatGPT wird bald alles sehen können, was auf Ihrem Bildschirm passiert

ChatGPT wird bald alles sehen können, was auf Ihrem Bildschirm passiert

Ein wichtiger Punkt im gesamten Event-Video war, dass die kommende ChatGPT-App-Funktion vorgeführt wurde, ohne dass jedoch wirkliche Details bekannt gegeben wurden. ChatGPT bietet die Möglichkeit, alles zu sehen, was auf dem Bildschirm des Benutzergeräts passiert.

KI lernt, Menschen zu täuschen, obwohl sie darauf trainiert ist, ehrlich zu sein

KI lernt, Menschen zu täuschen, obwohl sie darauf trainiert ist, ehrlich zu sein

Viele Spitzen-KIs lernen, obwohl sie darauf trainiert sind, ehrlich zu sein, durch Training, zu täuschen und Benutzer systematisch zu falschen Überzeugungen zu verleiten, wie eine neue Studie zeigt.

So ändern Sie Fragen auf ChatGPT

So ändern Sie Fragen auf ChatGPT

ChatGPT verfügt jetzt über eine Option zum Ändern von Fragen, sodass Benutzer die Frage oder den Inhalt bearbeiten können, den sie mit ChatGPT austauschen.

So erkennen Sie gefälschte QR-Codes und schützen Ihre Daten

So erkennen Sie gefälschte QR-Codes und schützen Ihre Daten

QR-Codes wirken ziemlich harmlos, bis man einen gefälschten Code scannt und etwas Böses auf einen losgeht. Um Ihr Telefon und Ihre Daten zu schützen, gibt es einige Möglichkeiten, einen gefälschten QR-Code zu erkennen.

Unterschied zwischen WENN- und Umschaltfunktionen in Excel

Unterschied zwischen WENN- und Umschaltfunktionen in Excel

Die IF-Anweisung ist eine gängige logische Funktion in Excel. Die SWITCH-Anweisung ist weniger bekannt, kann aber in manchen Situationen anstelle der IF-Anweisung verwendet werden.

So fügen Sie mit Adobe Camera Raw einen Spotlight-Effekt hinter Ihr Motiv ein

So fügen Sie mit Adobe Camera Raw einen Spotlight-Effekt hinter Ihr Motiv ein

Ein Scheinwerfer hinter Ihrem Motiv ist eine hervorragende Möglichkeit, Ihr Motiv vom Hintergrund abzuheben. Ein Scheinwerfer kann Ihren Porträts Tiefe verleihen.

So verwenden Sie Apple Invites zum Erstellen von Ereignissen

So verwenden Sie Apple Invites zum Erstellen von Ereignissen

Apple hat eine eigene Event-Management-App namens „Invites“ veröffentlicht. Mit dieser App können Sie Events erstellen, Einladungen versenden und Zusagen verwalten.

Cheat Heroes 3, Heroes 3 Codes alle Versionen

Cheat Heroes 3, Heroes 3 Codes alle Versionen

Hier sind alle Heroes 3-Codes, Heroes 3-Cheats für alle Versionen wie Heroes 3 WoG-Cheat, Heroes 3 SoD, Heroes 3 of Might and Magic

Neuester Tay Du VNG-Code und wie man den Code eingibt

Neuester Tay Du VNG-Code und wie man den Code eingibt

Der neueste Tay Du VNG-Code bietet Spielern eine Reihe attraktiver Belohnungen wie Elixiere, Silber, Goldbarren, Belohnungstruhen und eine Reihe anderer Gegenstände, die neuen Spielern das Freischalten allgemeiner Runden erleichtern.

Mark Zuckerberg hasst Apple und muss trotzdem ein Macbook verwenden, aber das ist sehr seltsam

Mark Zuckerberg hasst Apple und muss trotzdem ein Macbook verwenden, aber das ist sehr seltsam

Mark Zuckerberg postete kürzlich ein Foto von sich, auf dem er an einem Laptop arbeitet. Es war ein Laptop (angeblich ein MacBook), aber das Logo mit dem angebissenen Apfel war nirgends zu sehen.

So verwenden Sie Memoji auf dem iPhone

So verwenden Sie Memoji auf dem iPhone

Mit iPhone-Memoji können Sie Nachrichten und FaceTime-Gesprächen durch Ihre Mimik eine persönliche Note verleihen.

So zeichnen Sie Bildschirmvideos auf einem Chromebook auf

So zeichnen Sie Bildschirmvideos auf einem Chromebook auf

Die Bildschirmaufzeichnung ist eine äußerst nützliche Funktion, aber nicht alle Betriebssysteme verfügen über diese integrierte Funktion.

Möglichkeiten, Spins in Coin Master zu verdienen, Coin Master Spins zu verdienen

Möglichkeiten, Spins in Coin Master zu verdienen, Coin Master Spins zu verdienen

Es gibt viele Möglichkeiten, Spins in Coin Master zu verdienen. Man muss sich vor allem anstrengen, um eine Spin-Serie zu erhalten. Quantrimang.com hat Möglichkeiten zusammengestellt, die Ihnen helfen, eine Reihe von Coin Master-Spins zu erhalten.

So erstellen Sie eine Checkliste in Google Docs

So erstellen Sie eine Checkliste in Google Docs

Das Hinzufügen einer Checkliste zu Google Docs ist ein notwendiger Schritt, wenn wir eine Untersuchung oder Umfrage zu bestimmten Inhalten durchführen.