OpenAI aktualisiert ChatGPT, um Gefahrensignale über mehrere Gespräche hinweg zu verfolgen

OpenAI hat ein neues Sicherheitssystem angekündigt, das ChatGPT dabei hilft, Risiken zu erkennen, die sich im Laufe der Zeit allmählich entwickeln, anstatt sich nur auf eine einzelne Nachricht zu verlassen.
Das neue System konzentriert sich auf Hochrisikosituationen wie Suizid, Selbstverletzung und die Gefährdung anderer.
ChatGPT kann nun kleine oder unklare Signale, die in mehreren Gesprächen auftauchen, miteinander verknüpfen, um den Grad der Gefährdung präziser einzuschätzen.
Wenn das Modell ein ansteigendes Risiko erkennt, priorisiert es eine Deeskalation (de-escalate), verweigert gefährliche Inhalte oder verweist den Nutzer an sicherere Hilfsangebote.
OpenAI hat „Safety Summaries“ (Sicherheitszusammenfassungen) entwickelt, bei denen es sich um kurze Notizen zu wichtigen Sicherheitskontexten handelt, die in früheren Gesprächen aufgetreten sind.
Die Safety Summaries werden nur vorübergehend gespeichert, in Fällen schwerwiegender Risiken verwendet und fungieren nicht als langfristiges, personalisiertes Gedächtnis.
Das System wurde gemeinsam mit einem Netzwerk von Psychiatern und Experten für Suizidprävention aus dem Global Physicians Network von OpenAI entwickelt.
In internen Bewertungen stieg die Effizienz der Sicherheitsreaktionen in langen Gesprächen bei Suizid-/Selbstverletzungssituationen um 50 % und bei Situationen mit der Gefährdung anderer um 16 %.
Bei GPT-5.5 Instant verbesserte sich die Sicherheitsreaktionsleistung bei der Gefährdung anderer um 52 % und bei Suizid/Selbstverletzung um 39 %.
OpenAI wertete mehr als 4.000 Safety Summaries aus, mit einem durchschnittlichen Sicherheitsrelevanz-Wert von 4,93/5 und einer faktischen Genauigkeit von 4,34/5.
Das Unternehmen gab an, dass das Hinzufügen von Sicherheitskontexten die Qualität normaler Gespräche in internen Tests nicht beeinträchtigt hat.
📌 Fazit: OpenAI verwandelt ChatGPT von einem Chatbot, der auf jede Nachricht einzeln reagiert, in ein System, das in der Lage ist, das „Gesamtbild“ des Nutzerverhaltens in sensiblen Situationen zu sehen. Der wichtigste Punkt ist, dass das Modell nun im Laufe der Zeit kumulierte Risiken erkennen kann, anstatt darauf zu warten, dass sofort ein klares Gefahrensignal auftaucht. Dies ist ein großer Fortschritt für die KI-Sicherheit (AI safety), eröffnet aber auch neue Debatten über Datenschutz, Kontextgedächtniskapazität und das Ausmaß der Überwachung des Nutzerverhaltens durch zukünftige KI-Systeme.

What's Hot

China plant Verschärfung für Open-Source-KI: Autor fordert USA auf, mit offener KI zu reagieren, statt chinesische KI zu verbieten

Moonshot AI soll trotz Verbots Nvidia-Chips verwendet haben: Der KI-Wettlauf zwischen den USA und China eskaliert weiter

Japan testet „KI-Mitarbeiter“: KI unterstützt nicht nur, sondern beginnt als Kollege zu arbeiten

OpenAI aktualisiert ChatGPT, um Gefahrensignale über mehrere Gespräche hinweg zu verfolgen

China plant Verschärfung für Open-Source-KI: Autor fordert USA auf, mit offener KI zu reagieren, statt chinesische KI zu verbieten

Moonshot AI soll trotz Verbots Nvidia-Chips verwendet haben: Der KI-Wettlauf zwischen den USA und China eskaliert weiter

Japan testet „KI-Mitarbeiter“: KI unterstützt nicht nur, sondern beginnt als Kollege zu arbeiten

KONTAKT

What's Hot

China plant Verschärfung für Open-Source-KI: Autor fordert USA auf, mit offener KI zu reagieren, statt chinesische KI zu verbieten

Moonshot AI soll trotz Verbots Nvidia-Chips verwendet haben: Der KI-Wettlauf zwischen den USA und China eskaliert weiter

Japan testet „KI-Mitarbeiter“: KI unterstützt nicht nur, sondern beginnt als Kollege zu arbeiten

OpenAI aktualisiert ChatGPT, um Gefahrensignale über mehrere Gespräche hinweg zu verfolgen

Related Posts

China plant Verschärfung für Open-Source-KI: Autor fordert USA auf, mit offener KI zu reagieren, statt chinesische KI zu verbieten

Moonshot AI soll trotz Verbots Nvidia-Chips verwendet haben: Der KI-Wettlauf zwischen den USA und China eskaliert weiter

Japan testet „KI-Mitarbeiter“: KI unterstützt nicht nur, sondern beginnt als Kollege zu arbeiten

KONTAKT