OpenAI met à jour ChatGPT pour suivre les signes de danger à travers plusieurs conversations

OpenAI a annoncé un nouveau système de sécurité qui aide ChatGPT à reconnaître les risques qui apparaissent progressivement au fil du temps, plutôt que de s’appuyer uniquement sur un message unique.
Le nouveau système se concentre sur les situations à haut risque telles que le suicide, l’automutilation et les dommages causés à autrui.
ChatGPT peut désormais relier des signaux faibles ou ambigus apparaissant tout au long de plusieurs conversations pour évaluer le niveau de danger avec plus de précision.
Lorsqu’il détecte un risque croissant, le modèle donne la priorité à la désescalade (de-escalate), en refusant le contenu dangereux ou en orientant l’utilisateur vers une assistance plus sûre.
OpenAI a développé des « safety summaries » (résumés de sécurité), qui sont de courtes notes sur les contextes de sécurité importants apparus lors de conversations précédentes.
Les résumés de sécurité ne sont stockés que temporairement, sont utilisés pour des cas de risques graves et ne fonctionnent pas comme une mémoire personnalisée à long terme.
Le système a été conçu en collaboration avec un réseau de psychiatres et d’experts en prévention du suicide du Global Physicians Network d’OpenAI.
Lors des évaluations internes, l’efficacité de la réponse de sécurité au cours de conversations longues a augmenté de 50 % dans les situations de suicide/automutilation et de 16 % dans les situations de dommages causés à autrui.
Sur GPT-5.5 Instant, l’efficacité de la réponse de sécurité a augmenté de 52 % pour les situations de dommages causés à autrui et de 39 % pour le suicide/automutilation.
OpenAI a évalué plus de 4 000 résumés de sécurité avec un score moyen de pertinence de la sécurité de 4,93/5 et une exactitude factuelle de 4,34/5.
L’entreprise a précisé que l’ajout de contexte de sécurité n’avait pas réduit la qualité des conversations ordinaires lors des tests internes.
📌 Conclusion : OpenAI transforme ChatGPT d’un chatbot qui répond à chaque message individuellement en un système capable d’avoir une « vue d’ensemble » du comportement de l’utilisateur dans des situations sensibles. Le point le plus crucial est que le modèle peut désormais détecter les risques cumulés au fil du temps au lieu d’attendre qu’un signal de danger explicite apparaisse immédiatement. C’est un grand pas en avant pour la sécurité de l’IA (AI safety), mais cela ouvre également de nouveaux débats sur la vie privée, la capacité de mémoire contextuelle et le niveau de surveillance du comportement des utilisateurs par les futurs systèmes d’IA.

What's Hot

La Chine s’apprête à restreindre l’IA open-source : l’auteur appelle les États-Unis à riposter par l’ouverture, non par l’interdiction de l’IA chinoise

Moonshot AI accusé d’utiliser des puces Nvidia malgré l’interdiction : la course à l’IA entre les États-Unis et la Chine continue de s’intensifier

Le Japon teste les « employés IA » : l’IA ne se contente plus d’assister, elle commence à travailler comme un collègue

OpenAI met à jour ChatGPT pour suivre les signes de danger à travers plusieurs conversations

La Chine s’apprête à restreindre l’IA open-source : l’auteur appelle les États-Unis à riposter par l’ouverture, non par l’interdiction de l’IA chinoise

Moonshot AI accusé d’utiliser des puces Nvidia malgré l’interdiction : la course à l’IA entre les États-Unis et la Chine continue de s’intensifier

Le Japon teste les « employés IA » : l’IA ne se contente plus d’assister, elle commence à travailler comme un collègue

La Chine s’apprête à restreindre l’IA open-source : l’auteur appelle les États-Unis à riposter par l’ouverture, non par l’interdiction de l’IA chinoise

Moonshot AI accusé d’utiliser des puces Nvidia malgré l’interdiction : la course à l’IA entre les États-Unis et la Chine continue de s’intensifier

Le Japon teste les « employés IA » : l’IA ne se contente plus d’assister, elle commence à travailler comme un collègue

La fièvre de l’IA crée des gagnants inattendus au Japon : les fabricants de toilettes, de fibre de verre et de glutamate profitent des puces IA

Contact

What's Hot

OpenAI met à jour ChatGPT pour suivre les signes de danger à travers plusieurs conversations

Related Posts

Contact