Este 14 de abril de 2025, OpenAI presentó su nueva familia de modelos de inteligencia artificial: GPT-4.1, junto con sus variantes GPT-4.1 mini y GPT-4.1 nano. Estos modelos están disponibles exclusivamente a través de la API(Interfaz de Programación de Aplicaciones) de OpenAI y representan un avance significativo en comparación con versiones anteriores como GPT-4o y GPT-4.5.
Es curioso que no siguieron con la numeración como antes. La última fue la 4.5, así que uno pensaría que la siguiente sería la 4.6, pero no fue así. Otra curiosidad es que solo está disponible para desarrolladores, y me da la impresión de que quizás tienen un poco de miedo a la competencia, como Claude 3.7 Sonnet, que según muchos expertos es el mejor modelo de IA para programar. Y la verdad, estoy totalmente de acuerdo con eso.
Principales Mejoras:
Ventana de contexto ampliada: GPT-4.1 admite hasta 1 millón de tokens, lo que permite manejar entradas de datos mucho más extensas que los 128,000 tokens de GPT-4o.
Rendimiento en codificación: El modelo muestra un rendimiento superior en tareas de programación, con un aumento del 21% en comparación con GPT-4o y del 27% respecto a GPT-4.5 en benchmarks (se refiere a pruebas estandarizadas y comparativas que se usan para medir el rendimiento de modelos de inteligencia artificial en tareas específicas, como programación, comprensión de lenguaje, razonamiento, etc.) especializados.
Seguimiento de instrucciones: GPT-4.1 ha mejorado significativamente en la capacidad de seguir instrucciones complejas, superando a sus predecesores.
Conocimiento actualizado: Los modelos cuentan con información actualizada hasta junio de 2024, lo que mejora la relevancia de sus respuestas.
Costos y Disponibilidad:
Reducción de costos: GPT-4.1 opera a un costo significativamente menor que GPT-4.5, ofreciendo una opción más accesible para desarrolladores y empresas.
Modelos mini y nano: Las versiones GPT-4.1 mini y GPT-4.1 nano están diseñadas para ser más rápidas y económicas, ideales para aplicaciones con recursos limitados o que requieren respuestas en tiempo real.
Concluyendo:
La decisión de OpenAI de lanzar GPT-4.1 con una ventana de contexto similar a la de Gemini 2.5 Pro y Llama4, poco después del anuncio y lanzamiento de estos últimos, no es casualidad. Esto indica un movimiento estratégico para competir directamente en esta característica clave, lo que a su vez sugiere que la industria reconoce la creciente importancia de las ventanas de contexto grandes para habilitar aplicaciones de IA más sofisticadas.
Pero hay que apuntar que en las pruebas estandarizadas y comparativas que se usan para medir el rendimiento de modelos de inteligencia artificial en tareas específicas, como programación, comprensión de lenguaje, razonamiento, etc. Gemini 2.5 Pro aún lleva la delantera.