news

Anthropic dice que la IA escribe todo su código. Science dice 29%

Boris Cherny envió 259 PRs en un mes sin escribir una línea. Pero LessWrong dice que la cifra real de Anthropic es ~50%. ¿Quién miente?

Carlos VegaCarlos Vega-31 de enero de 2026-11 min de lectura
Compartir:
Pantalla de ordenador mostrando líneas de código representando la programación con inteligencia artificial en 2026

Foto de Florian Olivo en Unsplash

En resumen

Ingenieros de Anthropic y OpenAI confiesan que la IA escribe el 100% de su código. Pero un análisis independiente revela que la cifra real es 50%. Investigamos la brecha entre el hype y la realidad.

Te lo explico fácil: el 29 de enero de 2026, internet se incendió con un titular de Fortune que decía que ingenieros de Anthropic y OpenAI ya no escriben código. Cero líneas. Todo lo hace la IA. Y la verdad es que el titular no es exactamente mentira... pero tampoco es exactamente verdad.

Boris Cherny, el jefe de Claude Code en Anthropic, lo dijo sin pestañear: «Para mí personalmente, ha sido el 100% durante más de dos meses. Ni siquiera hago pequeñas ediciones a mano». Roon, investigador de OpenAI, confirmó lo mismo: «100%. Ya no escribo código».

Pero aquí es donde la historia se pone interesante. Porque entre el titular viral y la realidad hay un abismo que merece ser explorado.

Los números de Boris Cherny: 259 PRs en 30 días

El truco está en entender lo que Boris Cherny realmente hace. No es un programador que se sienta a teclear. Es un director de orquesta que coordina múltiples agentes de IA en paralelo:

Métrica Valor
PRs enviados en 30 días 259
Commits en 30 días 497
Líneas añadidas 40.000
Líneas eliminadas 38.000
Sesiones paralelas 5 locales + 5-10 en la web
Modelo usado Opus 4.5 con pensamiento

Cherny describió su flujo de trabajo: abre 5 sesiones de Claude Code en su terminal y entre 5 y 10 más en la web de Anthropic. Todas ejecutándose al mismo tiempo. Escribe especificaciones, revisa resultados, aprueba o rechaza. Pero no toca una sola línea de código.

«Nunca he disfrutado tanto mi trabajo como ahora», dijo Cherny a Fortune. «Todo el trabajo tedioso lo hace Claude, y yo puedo ser creativo».

Y no es solo él. Envió 22 PRs un día y 27 al siguiente, cada uno escrito al 100% por Claude Code.

Roon (OpenAI): «Programar siempre fue un asco»

Imagina que un investigador de OpenAI salga a decir que programar fue siempre un mal necesario. Pues eso es exactamente lo que hizo Roon:

«Programar siempre fue un asco. Era un dolor requisito para cualquiera que quisiera manipular ordenadores para hacer cosas útiles. Y me alegro de que se haya acabado».

Su flujo es diferente al de Cherny. Roon escribe especificaciones, visualiza mentalmente el resultado, y lanza 4 instancias de Codex (la herramienta de codificación de OpenAI) en paralelo para ver múltiples variaciones.

Lo que nadie te cuenta es que tanto Cherny como Roon trabajan en las empresas que fabrican estas herramientas. Usan las versiones más avanzadas, con acceso interno, en proyectos optimizados para IA. No es exactamente la experiencia del desarrollador promedio.

Dario Amodei en Davos: «6 a 12 meses»

El CEO de Anthropic subió la apuesta en el Foro Económico Mundial de Davos el 23 de enero de 2026:

«Creo que podríamos estar a 6 o 12 meses de que el modelo haga la mayoría, quizá todo, de lo que hacen los ingenieros de software de principio a fin».

Pero Amodei añadió una matización que los titulares ignoraron: «Creo que hay mucha incertidumbre, y es fácil ver cómo esto podría tardar algunos años».

En marzo de 2025, ya había predicho que la IA escribiría el 90% del código en 3 a 6 meses. Según el análisis de LessWrong, esa predicción fue «directamente falsa tal como se interpreta convencionalmente».

El desmontaje de LessWrong: la cifra real es ~50%

Aquí es donde la historia cambia completamente.

Ryan Greenblatt, científico jefe de Redwood Research, publicó un análisis detallado en LessWrong que desmonta la narrativa del 100%:

  • La cifra real promedio en toda Anthropic para código fusionado escrito por IA es aproximadamente el 50%, no el 90-100%
  • Algunos equipos de alto rendimiento alcanzan el ~90%, pero son una minoría
  • Si incluyes todo el código (scripts, herramientas desechables, prototipos), se acerca al 90%, pero eso no es lo que la gente entiende cuando lee el titular
  • La distribución es muy desigual: 9 apps web sencillas al 100% con IA + 1 base de código crítica de algoritmos mayoritariamente escrita a mano

El propio Amodei tuvo que matizar después con un "en muchos equipos, no uniformemente", pero los medios ya habían publicado el titular original.

Los datos que importan: ¿cuánto código escribe realmente la IA?

Olvídate de los titulares. Esto es lo que dicen los estudios con metodología seria:

Fuente Porcentaje de código IA Contexto
Anthropic (media real) ~50% Toda la empresa, LessWrong
Boris Cherny (personal) 100% Un individuo, herramienta propia
Revista Science (EE.UU.) 29% Funciones Python en GitHub
Revista Science (Alemania) 23% Funciones Python en GitHub
Revista Science (China) 12% Funciones Python en GitHub
Microsoft (interno) 20-30% Declaración de Satya Nadella
Google (interno) 30%+ Declaración de Sundar Pichai
GitHub Copilot (contribución) 46% Usuarios activos
GitHub Copilot (aceptación) ~30% Sugerencias aceptadas

La diferencia es brutal. Del 100% que proclama el titular al 29% que mide un estudio revisado por pares en la revista Science. La realidad está en algún lugar entre el 30% y el 50% para la industria en general, con outliers como Cherny en el extremo superior.

El conflicto de interés que nadie menciona

Hay un elefante en la sala que merece atención.

Boris Cherny lidera el producto que está promocionando (Claude Code). Roon trabaja en la empresa que vende Codex. Dario Amodei es el CEO de la compañía que construye estas herramientas. Cada fuente primaria que hace la afirmación del "100%" tiene un incentivo financiero directo para exagerar la capacidad.

Esto no significa que estén mintiendo. Probablemente es cierto que ellos personalmente no escriben código. Pero extrapolarlo a "la IA ya reemplaza a los programadores" es un salto lógico que los datos no sostienen.

Como dijo un comentarista de Hacker News con 500+ votos: «Si fuera el 95% de algo útil, Anthropic no tendría más de 1.000 empleados».

Lo que la IA todavía no puede hacer

Andrej Karpathy —ex-jefe de IA de Tesla y cofundador de OpenAI— es probablemente la voz más equilibrada en este debate. En diciembre de 2025 pasó de 80% código manual a 80% código IA en solo 4 semanas. Pero también alertó de problemas reales:

  • Errores conceptuales sutiles: los modelos cometen fallos lógicos que un humano no haría
  • Sobre-complejidad: la IA tiende a sobre-ingenierizar soluciones simples
  • Código muerto: deja funciones sin usar que ensucian la base de código
  • Límites de contexto: no puede mantener en memoria bases de código grandes
  • «Deuda de comprensión»: aceptar código de IA sin entenderlo es una bomba de relojería

Karpathy predice que 2026 será el año de la «slopacolypse» en GitHub: una avalancha de código generado por IA de baja calidad inundando repositorios.

Y hay un dato preocupante de Veracode: el 29,1% del código Python generado por IA contiene patrones de vulnerabilidad conocidos. Casi un tercio del código que la IA produce tiene agujeros de seguridad.

El estudio METR: cuando la IA hace que los expertos sean MÁS lentos

Quizá el dato más contraintuitivo viene del estudio METR, que midió la productividad de desarrolladores experimentados con y sin IA. El resultado sorprendió a todos:

Los asistentes de IA disminuyeron la productividad de desarrolladores experimentados un 19%.

Bain & Company reportó resultados "poco notables" en ahorros por IA generativa en programación. Y solo el 33% de los desarrolladores confían en los resultados de la IA, según Stack Overflow, frente al 46% que desconfía.

El truco está en entender que la IA acelera las tareas fáciles pero puede ralentizar las difíciles. Escribir una función CRUD es trivial para Claude o Copilot. Diseñar una arquitectura de microservicios tolerante a fallos... no tanto.

El impacto real en el mercado laboral

Aquí es donde la cosa se pone seria. Porque más allá del debate sobre porcentajes, hay personas perdiendo trabajos:

Métrica Valor
Caída de empleo de programadores junior -27,5%
Caída de contratación de recién graduados (big tech) -50%+
Salario mediano de ingenieros ML senior $470.000-$630.000
Empresas Fortune 100 usando Copilot 90%
Desarrolladores usando o planeando usar IA 84%

Matt Garman, jefe de AWS, calificó la idea de reemplazar juniors con IA como «una de las cosas más estúpidas que he oído». Pero los datos de contratación cuentan otra historia.

Lo que nadie te cuenta es que el rol no desaparece: se transforma. Los ingenieros que sobreviven son los que pasan de "escribir código" a "dirigir IA" —revisando, arquitectando, especificando—. Las habilidades de "tech lead" y "pensamiento de producto" valen más que nunca. Ser un buen "programador" (teclear sintaxis) pierde valor; ser un buen "ingeniero de software" (pensamiento sistémico) gana valor.

Qué dicen las otras grandes tech

Empresa Ejecutivo % Código IA Posición
Microsoft Satya Nadella 20-30% Cauto; CTO predice 95% para 2030
Google Sundar Pichai 30%+ "Potenciador de productividad"
Meta Mark Zuckerberg Objetivo: 50%+ en 12 meses El más agresivo
AWS Matt Garman "Reemplazar juniors con IA es estúpido"

Dato curioso: Microsoft está expandiendo el uso interno de Claude Code de Anthropic en sus equipos de ingeniería. No solo para ingenieros, sino también para diseñadores y product managers.

La dimensión emocional que nadie quiere discutir

Hay algo profundamente humano en este debate que va más allá de los porcentajes.

Karpathy admitió que «duele un poco al ego» programar en inglés en vez de en código. Gergely Orosz, del newsletter Pragmatic Engineer, describió un sentimiento de «duelo: algo valioso está siendo arrebatado, y de repente».

Karpathy también alertó sobre la «atrofia de habilidades»: perder la capacidad de escribir código manualmente. Si dependes de la IA para todo y un día falla... ¿podrás resolver el problema solo?

Y luego está Roon diciendo que «programar siempre fue un asco» y que se alegra de que se haya acabado. Una frase que polarizó a la comunidad de desarrolladores entre los que se sintieron liberados y los que se sintieron insultados.

El veredicto: hype vs. realidad

Después de analizar 15 fuentes, estudios revisados por pares y cientos de comentarios de desarrolladores, esto es lo que puedo decir:

El hype: Boris Cherny y Roon genuinamente no escriben código. 259 PRs en un mes es objetivamente impresionante. Los modelos de finales de 2025 (Opus 4.5, GPT-5.2, Gemini 3) fueron un salto real.

La realidad: El 100% es una experiencia personal de dos personas que trabajan en las empresas que fabrican las herramientas, usando versiones internas, en proyectos optimizados. El promedio real en Anthropic es ~50%. El promedio global medido por Science es 29%. La brecha entre el titular y la realidad es de 71 puntos porcentuales.

Lo que importa: La IA está transformando genuinamente la programación. No la está reemplazando. El rol del ingeniero de software está mutando de "escritor de código" a "director de agentes de IA". Y eso es un cambio real y significativo, aunque no sea el apocalipsis que vende el titular.

MIT Technology Review nombró la "codificación generativa" como tecnología rompedora de 2026. Y tienen razón. Pero la revolución está en la transformación del oficio, no en su desaparición.

Preguntas frecuentes

¿Es verdad que la IA escribe el 100% del código en Anthropic?

No como cifra general. Boris Cherny (jefe de Claude Code) dice que para él personalmente es 100%, pero un análisis de LessWrong reveló que la media real en toda Anthropic es aproximadamente 50%. La propia empresa declaró un rango del 70-90% para Claude Code específicamente.

¿La IA va a reemplazar a los programadores?

No en el sentido de eliminar el puesto. Lo que está cambiando es el rol: de escribir código manualmente a dirigir agentes de IA, revisar, arquitectar y especificar. Los programadores junior son los más afectados (-27,5% de empleo), mientras que los seniors con habilidades de sistemas se revalorizan.

¿Cuánto código escribe realmente la IA en la industria?

Según un estudio publicado en la revista Science en enero de 2026, el 29% de las funciones Python nuevas en GitHub de EE.UU. son generadas por IA. Microsoft reporta 20-30% y Google más del 30%. La cifra varía enormemente según la empresa, el tipo de código y la herramienta utilizada.

¿El código escrito por IA es seguro?

No siempre. Veracode reportó que el 29,1% del código Python generado por IA contiene patrones de vulnerabilidad conocidos. Los expertos recomiendan revisión humana obligatoria, especialmente en código que maneja datos sensibles o lógica de seguridad.

¿Qué herramientas de IA usan los desarrolladores para programar?

Las principales son GitHub Copilot (20+ millones de usuarios), Claude Code (Anthropic), Codex (OpenAI), Cursor y Lovable. Boris Cherny usa Claude Code con Opus 4.5. Roon de OpenAI usa 4 instancias de Codex en paralelo.

¿Te ha sido útil?
Carlos Vega
Escrito por

Carlos Vega

Divulgador tecnológico especializado en IA aplicada. Hace accesible lo complejo.

#inteligencia artificial#programación#Anthropic#OpenAI#Claude Code#futuro del desarrollo

Artículos Relacionados