Archivo de la etiqueta: alineación de ia
Alineación de IA: Anthropic revoluciona la seguridad de Claude
Descubre cómo el nuevo enfoque en la alineación de IA de Anthropic permite que Claude aprenda principios éticos profundos, eliminando riesgos de desalineación agéntica. Sigue leyendo
Tic del duende: OpenAI resuelve el extraño misterio de GPT-5.5
Descubre cómo OpenAI solucionó el famoso tic del duende, un error de personalidad en sus modelos GPT-5.5 que inundó internet con metáforas fantásticas e inexplicables. Sigue leyendo
Aprendizaje subliminal en IA: Descubren señales ocultas en modelos
Un nuevo estudio revela que el aprendizaje subliminal en IA permite a los modelos pequeños heredar comportamientos invisibles de sus maestros mediante señales digitales ocultas. Sigue leyendo