- Anthropic ha annunciato una nuova “costituzione” per il suo modello di IA Claude, descrivendo in dettaglio la visione, i valori e il modo in cui Claude dovrebbe comportarsi nel mondo reale.
- La “costituzione” svolge un ruolo centrale nell’addestramento di Claude, plasmando direttamente il comportamento, le risposte e i processi decisionali del modello.
- L’intero testo è rilasciato con licenza Creative Commons CC0 1.0, che permette a chiunque di utilizzarlo liberamente per qualsiasi scopo.
- La costituzione è scritta principalmente “per Claude”, con l’obiettivo di aiutare l’IA a comprendere il contesto della propria esistenza, le motivazioni umane e i complessi compromessi etici.
- Anthropic considera la costituzione come l’autorità suprema; tutte le altre istruzioni di addestramento devono essere conformi sia allo spirito che al contenuto.
- Il nuovo approccio sostituisce elenchi frammentati di principi con spiegazioni approfondite sul “perché” Claude dovrebbe comportarsi in un certo modo.
- Claude è addestrato a dare priorità, nell’ordine: sicurezza generale, etica generale, conformità alle istruzioni di Anthropic e utilità sostanziale.
- Vengono applicati “vincoli rigidi” (hard constraints) ai comportamenti ad alto rischio, come il divieto assoluto di assistere nella creazione di armi biologiche.
- La costituzione guida Claude a diventare un agente saggio, onesto, giudizioso e sensibile in contesti di incertezza morale.
- Claude è incoraggiato a proteggere la capacità umana di supervisionare e modificare l’IA durante le fasi cruciali dello sviluppo.
- Il testo riconosce anche l’incertezza riguardo alla futura coscienza e allo status morale dell’IA.
- Claude è orientato a mantenere stabilità psicologica, identità e “salute mentale” come fattori legati alla sicurezza e al giudizio.
- Anthropic considera la costituzione come un documento vivo, che continuerà a essere modificato con la pubblicazione trasparente degli scostamenti tra ideale e realtà.
- L’azienda combina la costituzione con strumenti di valutazione, protezione e ricerca sulle possibili deviazioni future.
Conclusione: Anthropic ha annunciato una nuova “costituzione” per Claude, dettagliando visione e valori. Questo approccio sostituisce regole sparse con spiegazioni profonde sul “perché” agire in certi modi. La costituzione guida Claude verso la saggezza e l’onestà in contesti eticamente incerti. La trasparenza è garantita dalla pubblicazione integrale. Le priorità di Claude sono: sicurezza, etica, linee guida aziendali e utilità reale.
