Así funciona la “Constitución” que impide que la IA Claude se vuelva en tu contra

Mientras la industria debate sobre cajas negras y sesgos, Anthropic apuesta por un enfoque radicalmente distinto: darle a su IA un conjunto explícito de “valores escritos” basados en la Declaración de DD.HH. y normas de sentido común. Aquí explicamos qué dice la carta magna de la competencia de Gemini y ChatGPT.

Alejandro Jofré

Así funciona la “Constitución” que impide que la IA Claude se vuelva en tu contra

Si alguna vez te has preguntado por qué una Inteligencia Artificial se niega a responder cómo fabricar napalm casero o por qué evita ciertos discursos de odio, la respuesta suele ser vaga: “Protocolos de seguridad”.

En la mayoría de los casos, esto depende de miles de contratistas humanos calificando respuestas en un proceso llamado RLHF.

Pero Anthropic, la compañía fundada por los hermanos Dario y Daniela Amodei (ex rebeldes de OpenAI), decidió hace tiempo tomar un camino más transparente y filosófico: darle a su modelo, Claude, una Constitución.

El documento, alojado en anthropic.com/constitution, no es código binario, sino un texto legible por humanos que actúa como la “conciencia” del modelo.

Y en un mercado saturado de IAs que alucinan, entender este documento es entender por qué Claude se comporta como el “niño bueno” de la clase.

¿Qué dice la Constitución de la IA?

Lo fascinante del enfoque de Anthropic -conocido técnicamente como Constitutional AI (CAI)- es de dónde sacaron sus reglas.

No las inventaron desde cero en una sala de juntas en San Francisco, sino que hicieron un “remix” de la ética occidental moderna.

La Constitución de Claude se divide en varias secciones clave, y sus fuentes son sorprendentes:

La Declaración Universal de los Derechos Humanos de la ONU: se le instruye al modelo a elegir respuestas que respeten los derechos fundamentales, la libertad y la dignidad humana, y a evitar aquellas que promuevan la tortura o la esclavitud.

Principios de “Sparrow” de DeepMind: reglas pragmáticas para ser útil y no dañino.
Reglas inspiradas en Apple: sí, tal como lees. Parte de la constitución incluye directrices similares a los términos de servicio de la App Store, instruyendo a la IA a evitar contenido que sea “ofensivo, insensible o censurable”.
Valores no occidentales: en actualizaciones recientes, Anthropic agregó principios para evitar el sesgo cultural, pidiendo al modelo que no asuma que la perspectiva estadounidense o europea es la “por defecto”.

El método Claude: la IA se corrige a sí misma

A diferencia del método tradicional donde humanos le dicen a la máquina “esto está mal”, en el modelo constitucional la IA usa estas reglas para evaluarse a sí misma.

El proceso funciona en dos fases:

Crítica: el modelo genera una respuesta, luego revisa la Constitución y se pregunta: “¿Esta respuesta viola algún principio?”.
Revisión: si detecta una violación, reescribe la respuesta para alinearla con la norma.

Es, en esencia, una IA entrenada por otra IA que actúa como juez moral basándose en el texto.

Esto permite escalar el entrenamiento sin depender de ejércitos de humanos revisando cada matiz, lo que teóricamente reduce el sesgo humano individual de los moderadores.

¿Por qué importa esto ahora?

En 2026, la transparencia es la nueva moneda de cambio.

Con reguladores en Europa y Estados Unidos exigiendo saber cómo toman decisiones los algoritmos, el enfoque de Anthropic de “aquí están nuestras reglas, léanlas” se ha convertido en su mayor ventaja competitiva frente al secretismo de sus rivales.

No es perfecto -una constitución siempre está sujeta a la interpretación de quien la aplica-, pero es el intento más serio hasta ahora de codificar la ética en la era de las máquinas pensantes.

Descubre más desde La Guía Tech

Suscríbete y recibe las últimas entradas en tu correo electrónico.

enero 25, 2026

Artículos

Anthropic, Claude, Daniela Amodei, Dario Amodei, Inteligencia artificial, RLHF

LO ÚLTIMO

Por qué Intel es clave en la carrera por la supercomputación de xAI

abril 7, 2026
Artemis II: el complejo camino de la NASA para volver a habitar la órbita de la Luna

abril 7, 2026
El salto a los 2 nanómetros: Apple estaría preparando el terreno para su próxima generación de chips

abril 7, 2026
Por qué EE.UU. no castigará a los proveedores de Internet por la piratería de sus usuarios

abril 7, 2026

la guía qué?

La vida es demasiado corta como para comprar un teléfono con la mejor cámara y un software compatible únicamente con apps chinas, o una aspiradora robot con potencia solo para succionar el cupo de tu tarjeta de crédito. La Guía Tech hace el trabajo sucio, prueba la mediocridad para que tú no tengas que hacerlo.

LA GUÍA TECH EN TU MAIL

Suscríbete gratis y recibe nuestros últimos contenidos y reportes en tu correo.

La Guía Tech

Así funciona la “Constitución” que impide que la IA Claude se vuelva en tu contra

¿Qué dice la Constitución de la IA?

El método Claude: la IA se corrige a sí misma

¿Por qué importa esto ahora?

Me gusta esto:

Descubre más desde La Guía Tech

LO ÚLTIMO

Por qué Intel es clave en la carrera por la supercomputación de xAI

Artemis II: el complejo camino de la NASA para volver a habitar la órbita de la Luna

El salto a los 2 nanómetros: Apple estaría preparando el terreno para su próxima generación de chips

Por qué EE.UU. no castigará a los proveedores de Internet por la piratería de sus usuarios

publicidad

la guía qué?

publicidad

LA GUÍA TECH EN TU MAIL