Los modelos de lenguaje grande (LLM) son notablemente versátiles. Pueden resumir documentos, generar código e incluso generar nuevas ideas. Y ahora Google DeepMind ha expandido estas capacidades para abordar problemas fundamentales y altamente complejos en matemáticas y computación moderna.

Hoy presentamos AlphaEvolve, un agente de codificación evolutivo impulsado por modelos de lenguaje grande para el descubrimiento y optimización de algoritmos de propósito general. AlphaEvolve combina las capacidades de resolución creativa de problemas de los modelos Gemini con evaluadores automatizados que verifican respuestas, utilizando un marco evolutivo para mejorar las ideas más prometedoras.

“AlphaEvolve ha mejorado la eficiencia de los centros de datos de Google, el diseño de chips y los procesos de entrenamiento de IA — incluyendo el entrenamiento de los propios modelos de lenguaje que lo impulsan.”

Diseñando Mejores Algoritmos con LLMs

En 2023, DeepMind demostró por primera vez que los LLMs podían generar funciones en código para descubrir conocimiento nuevo y demostrablemente correcto en un problema científico abierto. AlphaEvolve va más allá: puede evolucionar bases de código completas y desarrollar algoritmos mucho más complejos.

AlphaEvolve aprovecha un conjunto de modelos Gemini:

  • Gemini Flash (el más rápido y eficiente): maximiza la amplitud de ideas exploradas
  • Gemini Pro (el más potente): proporciona profundidad crítica con sugerencias inteligentes

Juntos, estos modelos proponen programas informáticos que implementan soluciones algorítmicas como código. AlphaEvolve verifica, ejecuta y puntúa los programas propuestos utilizando métricas de evaluación automatizadas, proporcionando una evaluación objetiva y cuantificable de la precisión y calidad de cada solución.

Optimizando el Ecosistema Informático de Google

En el último año, DeepMind ha desplegado algoritmos descubiertos por AlphaEvolve en todo el ecosistema informático de Google, incluyendo centros de datos, hardware y software.

Mejorando la Programación de Centros de Datos

AlphaEvolve descubrió una heurística simple pero notablemente efectiva para ayudar a Borg (el orquestador de centros de datos de Google) a operar más eficientemente. Esta solución, ya en producción durante más de un año, recupera continuamente, en promedio, el 0.7% de los recursos informáticos mundiales de Google.

Asistiendo en el Diseño de Hardware

AlphaEvolve propuso una reescritura en Verilog que eliminó bits innecesarios en un circuito aritmético clave para la multiplicación de matrices. Esta propuesta fue integrada en una próxima Unidad de Procesamiento Tensorial (TPU) , el acelerador de IA personalizado de Google.

Mejorando el Entrenamiento y la Inferencia de IA

AlphaEvolve aceleró un kernel vital en la arquitectura de Gemini en un 23%, lo que llevó a una reducción del 1% en el tiempo de entrenamiento de Gemini. También logró una aceleración de hasta el 32.5% para la implementación del kernel FlashAttention en modelos basados en Transformer.

Avanzando las Fronteras en Matemáticas

AlphaEvolve también puede proponer nuevos enfoques para problemas matemáticos complejos. Descubrió un algoritmo para multiplicar matrices complejas de 4×4 usando 48 multiplicaciones escalares, mejorando el algoritmo de Strassen de 1969 que era el mejor conocido anteriormente.

El sistema se aplicó a más de 50 problemas abiertos en análisis matemático, geometría, combinatoria y teoría de números. En aproximadamente el 75% de los casos, redescubrió las mejores soluciones conocidas. Y en el 20% de los casos, AlphaEvolve mejoró las mejores soluciones conocidas anteriormente.

Un ejemplo notable: avanzó en el problema del número de besos (kissing number problem) , un desafío geométrico que ha fascinado a los matemáticos durante más de 300 años. AlphaEvolve descubrió una configuración de 593 esferas exteriores y estableció un nuevo límite inferior en 11 dimensiones.

El Camino a Seguir

AlphaEvolve muestra la progresión desde el descubrimiento de algoritmos para dominios específicos hasta el desarrollo de algoritmos más complejos para una amplia gama de desafíos del mundo real. DeepMind planea un Programa de Acceso Temprano para usuarios académicos seleccionados y está explorando posibilidades para hacer AlphaEvolve más ampliamente disponible.

Aunque actualmente se aplica en matemáticas y computación, su naturaleza general significa que puede aplicarse a cualquier problema cuya solución pueda describirse como un algoritmo y verificarse automáticamente — desde ciencia de materiales y descubrimiento de fármacos hasta sostenibilidad y aplicaciones empresariales.

“Creemos que AlphaEvolve podría ser transformador en muchas más áreas, como la ciencia de materiales, el descubrimiento de fármacos, la sostenibilidad y aplicaciones tecnológicas y empresariales más amplias.”