5 min remaining
0%
AI & Machine Learning

Cuando la IA resuelve problemas matemáticos de 56 años y a nadie le importa: La teoría de "acumulación" de la supremacía de la IA

Descubre cómo los rápidos avances de la IA están llevando a la fatiga de los descubrimientos, remodelando nuestra comprensión de la productividad y el dominio en el lugar de trabajo.

5 min read
Progress tracked
5 นาทีอ่าน
AI Generated Cover for: When AI Solves 56-Year-Old Math Problems and Nobody Cares: The "Accumulation" Theory of AI Supremacy

AI Generated Cover for: When AI Solves 56-Year-Old Math Problems and Nobody Cares: The "Accumulation" Theory of AI Supremacy

La semana pasada, Google DeepMind lanzó algo que debería haber hecho que el mundo se atragantara con su café.

Su nuevo sistema, AlphaProof Nexus, resolvió nueve problemas matemáticos abiertos—monstruos reales, de décadas de antigüedad que habían sobrevivido a carreras. Dos de ellos habían estado ahí sin tocarse desde 1970. Cincuenta y seis años de genialidad humana, y la factura ascendió a unos pocos cientos de dólares en computación.

Piensa en eso. Un misterio más antiguo que la mayoría de los CEOs, resuelto por un algoritmo por el precio de una laptop barata. Si esto hubiera sucedido en 2024, el New York Times habría publicado una edición especial. LinkedIn se habría colapsado. Todos estaríamos actualizando nuestras presentaciones del apocalipsis.

Pero la semana pasada? Grillos. Probablemente lo pasaste por alto. Yo casi lo hice también.

No estamos cínicos. Estamos exhaustos.Fatiga de Avancees real.La IA avanza tan rápido, rompiendo tantas barreras "imposibles", que lo extraordinario ahora se siente como un martes. Nos hemos vuelto insensibles a los milagros.

El Día en que Murieron las Pruebas

Mira los últimos dos años.

En 2021, MMLU era el estándar de oro—el SAT para máquinas. Hoy, cada modelo de frontera puntúa por encima del 90%. Cuando toda la clase obtiene un A+, la prueba deja de decirte algo útil.

Entonces llegó GPQA Diamond. Diseñaron esta cosa específicamente para ser no-googleable. Para calificar como una pregunta, tenía que ser tan ferozmente específica que solo un PhD en ese subcampo exacto pudiera resolverla; un PhD de un campo vecino con acceso completo a internet aún fracasaría.

GPT-4 obtuvo un 39%. Respetable, pero humano.

A principios de 2026, Gemini 3.1 Pro alcanzó el 94.1%. Los PhD humanos promedian alrededor del 65%. En dos años, pasamos de "peor que un estudiante de posgrado" a "avergonzando a los expertos en la materia."

Las personas que escriben los exámenes ya no pueden escribirlos lo suficientemente rápido.

Bienvenido a la Era de Abundancia de Pruebas

El mes pasado, Terence Tao—quien es para las matemáticas lo que Mozart fue para la música—se levantó en Stanford y dijo algo que me conmovió.

Hemos dejado la era de Escasez de Pruebas y hemos entrado en la era de Abundancia de Pruebas .

Antes, una prueba importante era un evento generacional. Los matemáticos sacrificaban sus vidas, llenando sacos con papel de borrador, solo para mover una conjetura de "quizás" a "verdadero." Era sagrado. Era escaso .

¿Ahora? El sitio web del Problema de Erdős tiene un retraso de más de veinte pruebas generadas por IA que simplemente están ahí, esperando a que los humanos las verifiquen. Las máquinas están superando nuestra capacidad de incluso leerlas.

Tao admitió que ha puesto pausa. No puede seguir el ritmo. Y utilizó una analogía que se quedará conmigo para siempre:

La IA es como un helicóptero que te deja en la cima. Obtienes la vista al instante. Pero te pierdes la subida. Y aquí está la cosa: la subida es donde reside el valor.

El Dilema Corporativo: ¿Cómo Mides la "Competencia en IA"?

¿Entonces, qué tiene esto que ver con tu reunión de los lunes por la mañana?

Todo.

En matemáticas, la prueba es binaria. O lo resolviste o no lo hiciste. Verdad objetiva. Hermoso.

Pero en tu oficina? Si le pides a la IA que redacte un plan de marketing, construya una presentación o escriba un script en Python, la salida siempre es...bastante bien . Nunca es embarazoso. Siempre es plausible.

Así que todos en LinkedIn afirman haber "multiplicado por 10 su productividad". Pero un CEO me apartó la semana pasada y me hizo la pregunta que nadie quiere hacer en voz alta:

"James, mi equipo está usando IA en todas partes. Mis facturas de API están por las nubes. Pero, ¿cómo sé quién realmente está dominando esto y quién solo es muy bueno aparentando estar ocupado?"

Es una pregunta contundente. Porque sin una forma real de medir esto, todos somos genios en nuestros propios canales de Slack.

La respuesta no es una herramienta. Es una mentalidad.

Acumulación.

Consumo Horizontal vs. Acumulación Vertical

Observa cómo tu equipo utiliza la IA, y verás emerger dos especies.

El Consumidor (Horizontal)

Vierten sus puntos clave en ChatGPT. Este genera un informe pulido. Lo envían. Ahorraron veinte minutos. "Usaron" IA.

Pero pregúntales qué aprendieron. Pregúntales qué pueden hacer hoy que no podían hacer el mes pasado. Recibirás una mirada en blanco. Construyeron un castillo de arena. La marea subió. Nada se quedó.

El Acumulador (Vertical)

También utilizan la IA para escribir ese informe. Pero luego pasan diez minutos extra en el chat. "Mira lo que logré esta semana. ¿Cuál es una habilidad técnica o marco estratégico que acabo de usar que no tenía en mi caja de herramientas hace 90 días?"

Lo registran. Lo mapean. Lo poseen.

Trois mois plus tard, le Consommateur continue de déléguer des tâches répétitives à une machine. L'Accumulateur est visiblement différent. Ils peuvent pointer des capacités spécifiques qu'ils ont développées. Ils ne sont pas seulement plus rapides—ils sont plus grands.

Alors demandez-vous : Est-ce que vous coulez du béton, ou est-ce que vous construisez des châteaux de sable ?

Les 2,5 % qui comptent

Retour à AlphaProof Nexus. Neuf problèmes résolus. Ça semble incroyable.

Mais DeepMind nous a aussi dit qu'il avait tenté 353.

Su tasa de éxito fue 2.5%.

En cualquier otro contexto, eso es una calificación reprobatoria. Pero en matemáticas, ese 2.5% es permanente. Cada prueba confirmada se convierte en una base. La máquina se sostiene sobre ella para alcanzar mayores alturas. No olvida. No empieza de nuevo. acumula.

Ese es todo el juego.

No estás compitiendo con la IA en inteligencia pura. Nunca lo harás. Tu ventaja es tu profunda experiencia humana en el dominio: las cosas que los algoritmos no pueden tocar (por ahora). Leer la microexpresión de un cliente durante una negociación. Percibir cuándo un equipo está a punto de romperse. Saber qué riesgo asumir cuando los datos están 50/50.

Usas ese juicio para darle a la IA instrucciones precisas y poderosas. La IA te da apalancamiento. Usas ese apalancamiento para agudizar aún más tu juicio.

Ese es el volante. Esa es la acumulación.

Cuando construyes verticalmente, la IA se convierte en tu motor. Cuando te desvías horizontalmente, se convierte en tu muleta.

¿Cuál estás construyendo?

James CEO, Mercury Technology SolutionsAcelera la Digitalidad.

ดำเนินเส้นทางของคุณต่อ

คำแนะนำที่คัดสรรตามบทความนี้