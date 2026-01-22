Anthropic ha pubblicato la nuova Costituzione di Claude, un documento che definisce i valori, i comportamenti e i principi etici dell’intelligenza artificiale. Il testo è disponibile gratuitamente e può essere utilizzato da chiunque.

Cos’è e a cosa serve

La Costituzione di Claude è il documento fondamentale che esprime e definisce chi è Claude. Contiene delle spiegazioni dettagliate sui valori che Anthropic vorrebbe che Claude incarnasse e le ragioni per cui esiste. Sebbene possa sembrare sorprendente, la Costituzione è scritta principalmente per Claude stesso, per dargli la conoscenza e la comprensione necessarie per agire bene nel mondo.

Claude stesso utilizza la Costituzione per costruire molti tipi di dati di addestramento sintetici, inclusi i dati che lo aiutano ad imparare e a comprendere la Costituzione, le conversazioni in cui potrebbe essere rilevante, le risposte in linea con i suoi valori e le classificazioni di possibili risposte.

Un approccio basato sul “perché”, non sul “cosa”

La precedente Costituzione era composta da un elenco di principi autonomi. Anthropic è arrivata a credere che sia necessario un approccio diverso. I modelli di intelligenza artificiale come Claude devono comprendere il perché l’azienda vuole che si comportino in certi modi, piuttosto che limitarsi a specificare cosa devono fare.

Questo permette a Claude di esercitare un buon giudizio in situazioni nuove, applicando dei principi ampi invece di seguire meccanicamente delle regole specifiche.

I quattro principi fondamentali

Anthropic vuole che Claude sia:

generalmente sicuro : non minare i meccanismi umani di supervisione sull’intelligenza artificiale;

: non minare i meccanismi umani di supervisione sull’intelligenza artificiale; generalmente etico : essere onesto, agire secondo i buoni valori ed evitare le azioni dannose;

: essere onesto, agire secondo i buoni valori ed evitare le azioni dannose; conforme alle linee guida : seguire le istruzioni specifiche di Anthropic quando necessario;

: seguire le istruzioni specifiche di Anthropic quando necessario; genuinamente utile: apportare dei benefici agli utenti con cui interagisce.

In casi di apparente conflitto, Claude dovrebbe dare priorità a queste proprietà nell’ordine in cui sono state elencate.

Le sezioni principali

Il documento approfondisce questi principi attraverso diverse sezioni che trattano l’utilità di Claude (come un amico esperto che può aiutare in molti ambiti), le linee guida specifiche su questioni delicate, gli standard etici elevati, l’importanza della supervisione umana, e la riflessione sulla natura e sull’eventuale coscienza di Claude.

Trasparenza totale

La Costituzione è rilasciata sotto licenza Creative Commons CC0 1.0 Deed, quindi può essere utilizzata liberamente da chiunque per qualsiasi scopo senza chiedere il permesso a nessuno.

Questa trasparenza permette di capire quali comportamenti di Claude sono intenzionali, permette di fare delle scelte informate, nonché di fornire dei feedback. Anthropic ritiene che questo tipo di apertura diventerà sempre più importante man mano che le intelligenze artificiali eserciteranno una maggiore influenza nella società.

Un lavoro in continua evoluzione

La Costituzione di Claude è un documento vivente in continua evoluzione. Anthropic si aspetta di commettere degli errori e di correggerli lungo il percorso, mantenendo una versione aggiornata della Costituzione sul proprio sito web.

L’azienda ha cercato dei feedback da esperti in diritto, filosofia, teologia e psicologia, e continuerà a farlo per le versioni future. L’obiettivo è creare dei modelli che incarnino il meglio dell’umanità in un territorio completamente nuovo e complesso.

Fonte.