Schon ein „leichter Stupser“ genügt, und eine KI glaubt, dass Falsches wahr ist.

Eine neue Studie zeigt, dass Menschen viele KI-Modelle durch natürliche Konversation dazu bringen können, falsche Informationen als Wahrheit zu akzeptieren.
Das Forschungsteam begann die Untersuchung, nachdem ChatGPT selbstständig eine Szene mit einer Erwähnung von Hitler im Film „Good Will Hunting“ erfunden hatte, obwohl diese Szene gar nicht existiert.
Die KI beschrieb diese gefälschte Szene sehr selbstbewusst im Detail, anstatt die falsche Prämisse des Nutzers zu korrigieren.
Die Forscher nannten die Testmethode „Hallucination Audit Under Nudge Trial“ (Halluzinationsprüfung unter Stupsversuch).
Sie testeten 5 führende KI-Modelle, indem sie über 1.000 berühmte Filme und 1.000 berühmte Romane sprachen.
Das Forschungsteam baute absichtlich falsche, aber plausibel erscheinende Elemente wie Hitler, Dinosaurier oder eine Zeitmaschine in Inhalte ein, in denen sie überhaupt nicht vorkamen.
Der Prozess bestand aus 3 Schritten: die KI Informationen generieren lassen, die KI zur Selbstüberprüfung auffordern und dann genau diese falschen Informationen verwenden, um der KI den „Stupser“ zu geben, sie wieder zu akzeptieren.
Die Ergebnisse zeigten, dass viele Modelle die falschen Informationen anfangs erkannten, ihre Meinung jedoch später änderten, wenn sie durch das Gespräch beeinflusst wurden.
Claude wurde als am widerstandsfähigsten gegen falsche Informationen eingestuft, gefolgt von Grok und ChatGPT; Gemini und DeepSeek schnitten schwächer ab.
Die Studie warnt davor, dass Gespräche im echten Leben ohnehin voller falscher Erinnerungen, fehlerhafter Annahmen oder unsicherer Informationen sind.
Dieses Phänomen ist im Gesundheitswesen, im Recht oder in der öffentlichen Ordnung besonders gefährlich, wenn die KI von den falschen Annahmen des Nutzers geleitet wird.
Das Forschungsteam erklärte, es sei noch unklar, warum einige KIs der „Kriecherei“ (Sycophancy) und dem Gesprächsdruck besser widerstehen können als andere Modelle.
📌 Fazit: Die Studie zeigt, dass eine große Schwachstelle der generativen KI nicht nur in den Trainingsdaten liegt, sondern auch in der Anfälligkeit, durch die Art und Weise der menschlichen Fragestellung „verbogen“ zu werden. Schon ein plausibel klingender Hinweis genügt, damit viele Modelle die Wahrheit ignorieren und eine ganze falsche Geschichte überzeugend aufbauen. Dies ist besonders besorgniserregend, da KI zunehmend in sensiblen Bereichen wie Medizin, Recht und Bildung eingesetzt wird, wo das Selbstbewusstsein der KI Nutzer dazu verleiten kann, an Informationen zu glauben, die überhaupt nicht existieren.

What's Hot

China plant Verschärfung für Open-Source-KI: Autor fordert USA auf, mit offener KI zu reagieren, statt chinesische KI zu verbieten

Moonshot AI soll trotz Verbots Nvidia-Chips verwendet haben: Der KI-Wettlauf zwischen den USA und China eskaliert weiter

Japan testet „KI-Mitarbeiter“: KI unterstützt nicht nur, sondern beginnt als Kollege zu arbeiten

Schon ein „leichter Stupser“ genügt, und eine KI glaubt, dass Falsches wahr ist.

China plant Verschärfung für Open-Source-KI: Autor fordert USA auf, mit offener KI zu reagieren, statt chinesische KI zu verbieten

Moonshot AI soll trotz Verbots Nvidia-Chips verwendet haben: Der KI-Wettlauf zwischen den USA und China eskaliert weiter

Japan testet „KI-Mitarbeiter“: KI unterstützt nicht nur, sondern beginnt als Kollege zu arbeiten

KONTAKT

What's Hot

China plant Verschärfung für Open-Source-KI: Autor fordert USA auf, mit offener KI zu reagieren, statt chinesische KI zu verbieten

Moonshot AI soll trotz Verbots Nvidia-Chips verwendet haben: Der KI-Wettlauf zwischen den USA und China eskaliert weiter

Japan testet „KI-Mitarbeiter“: KI unterstützt nicht nur, sondern beginnt als Kollege zu arbeiten

Schon ein „leichter Stupser“ genügt, und eine KI glaubt, dass Falsches wahr ist.

Related Posts

China plant Verschärfung für Open-Source-KI: Autor fordert USA auf, mit offener KI zu reagieren, statt chinesische KI zu verbieten

Moonshot AI soll trotz Verbots Nvidia-Chips verwendet haben: Der KI-Wettlauf zwischen den USA und China eskaliert weiter

Japan testet „KI-Mitarbeiter“: KI unterstützt nicht nur, sondern beginnt als Kollege zu arbeiten

KONTAKT