IBM amplía la familia de modelos Granite con una nueva IA multimodal y de razonamiento diseñada para empresas

IBM amplía la familia de modelos Granite con una nueva IA multimodal y de razonamiento diseñada para empresas

• Granite 3.2 – Modelos de IA compactos que ofrecen capacidades de razonamiento, visión y seguridad, con licencia Apache 2.0 para desarrolladores
• Modelos actualizados de series temporales Granite, que permiten realizar previsiones a largo plazo con menos de 10 millones de parámetros
Feb 27, 2025

La próxima era de la IA se centra en la eficiencia, la integración y su impacto en el mundo real, permitiendo que las empresas logren resultados poderosos sin incurrir en gastos excesivos en computación. Los últimos avances en Granite, enfocados en soluciones abiertas, representan otro paso adelante para hacer que la IA sea más accesible, rentable y valiosa para las empresas modernas.

ARMONK, N.Y., 27 de febrero de 2025 – IBM (NYSE: IBM) ha presentado la siguiente generación de Granite, su familia de grandes modelos de lenguaje (LLM), Granite 3.2, como parte de su compromiso continuo para ofrecer inteligencia artificial empresarial especializada, eficiente y práctica con impacto en el mundo real.

Todos los modelos Granite 3.2 están disponibles bajo la licencia Apache 2.0 en Hugging Face. Algunos de ellos ya se pueden encontrar en IBM watsonx.ai, Ollama, Replicate y LM Studio, y se espera que pronto lleguen a RHEL AI 1.5, brindando capacidades avanzadas tanto a empresas como a la comunidad de código abierto. Entre sus principales características destacan:

  • Un nuevo modelo de lenguaje visual (VLM) diseñado para tareas de comprensión de documentos, con un rendimiento que iguala o supera al de modelos significativamente más grandes, como Llama 3.2 11B y Pixtral 12B, en los principales indicadores de referencia empresariales: DocVQA, ChartQA, AI2D y OCRBench[1]. Para lograrlo, además de contar con datos de entrenamiento robustos, IBM utilizó su propio kit de herramientas de código abierto Docling para procesar 85 millones de archivos PDF, generando 26 millones de pares de preguntas y respuestas sintéticas, mejorando así la capacidad del VLM para gestionar flujos de trabajo complejos con un gran volumen de documentos.
  • ‘Chain of Thought’ (capacidades de razonamiento mejorado) en los modelos 3.2 2B y 8B, con la opción de activar o desactivar el razonamiento según sea necesario para optimizar la eficiencia. Gracias a esta funcionalidad, el modelo 8B logra mejoras de dos dígitos respecto a su predecesor en pruebas de seguimiento de instrucciones como ArenaHard y Alpaca Eval, sin comprometer la seguridad ni el rendimiento en otras áreas[2]. Además, mediante nuevos métodos de escalado de inferencia, el modelo Granite 3.2 8B puede ajustarse para igualar el desempeño de modelos mucho más grandes, como Claude 3.5-Sonnet o GPT-4o, en pruebas de razonamiento matemático como AIME2024 y MATH500.[3]
  • Opciones de tamaño reducido para los modelos de seguridad de Granite Guardian, que reducen su tamaño en un 30% sin comprometer el rendimiento de los modelos Granite 3.1 Guardian. Los modelos 3.2 también incorporan una nueva funcionalidad denominada «verbalized confidence», que permite una evaluación de riesgos más matizada, ofreciendo una interpretación más precisa de posibles riesgos.

La estrategia de IBM para ofrecer modelos de IA más pequeños y especializados para empresas sigue demostrando su eficacia en distintas pruebas. De hecho, el modelo Granite 3.1 8B ha obtenido recientemente altas calificaciones en precisión en el Salesforce LLM Benchmark for CRM.  

La familia de modelos Granite cuenta con el respaldo de un sólido ecosistema de partners, incluidas las principales empresas de software que están integrando estos modelos en sus tecnologías.

«En CrushBank, hemos podido comprobar de primera mano cómo los modelos de IA abiertos y eficientes de IBM aportan un valor real a la inteligencia artificial empresarial, ofreciendo el equilibrio adecuado entre rendimiento, rentabilidad y escalabilidad”, señala David Tan, CTO de CrushBank. «Granite 3.2 amplía aún más estas capacidades con nuevas funciones de razonamiento, y estamos emocionados por explorar su potencial en el desarrollo de soluciones autónomas”.

Granite 3.2 representa un paso clave en la evolución del portfolio y la estrategia de IBM para ofrecer IA especializada y práctica a las empresas. Si bien los enfoques de chain of thought para el razonamiento son poderosos, también requieren un alto poder de computación, algo que no siempre es necesario para todas las tareas. Por ello, IBM ha incorporado la capacidad de activar o desactivar este método de forma programática. Para tareas más simples, el modelo puede operar sin razonamiento, reduciendo el consumo innecesario de recursos. Además, otras técnicas de razonamiento, como inference scaling, han demostrado que el modelo Granite 8B puede igualar o incluso superar el rendimiento de modelos mucho más grandes en pruebas estándar de razonamiento matemático. IBM sigue enfocando su investigación en la evolución de estos métodos, con ‘¡inference scaling como una de sus principales áreas de desarrollo[4].

Junto con los modelos Granite 3.2 para instrucciones, visión y seguridad, IBM también está anunciando el lanzamiento de la nueva generación de modelos TinyTimeMixers (TTM). Con menos de 10 millones de parámetros, estos modelos ofrecen capacidades avanzadas de pronóstico a largo plazo, permitiendo predicciones de hasta dos años en el futuro. Estos modelos son herramientas potentes para el análisis de tendencias a largo plazo, con aplicaciones clave en finanzas y economía, pronóstico de demanda en la cadena de suministro y planificación de inventarios estacionales en el sector retail.

«La próxima era de la IA se centra en la eficiencia, la integración y su impacto en el mundo real, permitiendo que las empresas logren resultados poderosos sin incurrir en gastos excesivos en computación”, declaró Sriram Raghavan, VP, IBM AI Research. “Los últimos avances en Granite, enfocados en soluciones abiertas, representan otro paso adelante para hacer que la IA sea más accesible, rentable y valiosa para las empresas modernas”.

 

Acerca de IBM

IBM es un proveedor líder de nube híbrida global e IA, y de experiencia en consultoría. Ayudamos a clientes de más de 175 países a capitalizar el conocimiento de sus datos, optimizar los procesos de negocio, reducir costes y obtener una ventaja competitiva en sus sectores. Más de 4.000 entidades gubernamentales y corporativas en áreas de infraestructura crítica como servicios financieros, telecomunicaciones y atención médica confían en la plataforma de nube híbrida de IBM y Red Hat OpenShift para abordar sus transformaciones digitales de manera rápida, eficiente y segura. Las revolucionarias innovaciones de IBM en IA, computación cuántica, soluciones de nube específicas del sector y consultoría ofrecen opciones abiertas y flexibles a nuestros clientes. Todo esto está respaldado por el compromiso de larga data de IBM con la confianza, la transparencia, la responsabilidad, la inclusión y el servicio. Visite http://www.ibm.com/ para obtener más información.

 

 


[1] Resultados de las pruebas comparativas del modelo Instruct disponibles en IBM Granite 3.2: Razonamiento, Visión, Pronósticos, y más, publicado el 26 de febrero de 2025. 

[2] Resultados de las pruebas comparativas del modelo Instruct disponibles en IBM Granite 3.2: Razonamiento, Visión, Pronósticosy más, publicado el 26 de febrero de 2025.

[3] Los resultados de referencia del escalado de inferencia están disponibles en el blog de investigación, Reasoning in Granite 3.2 Using Inference Scalingpublicado el 26 de febrero de 2025.

[4] Reasoning in Granite 3.2 Using Inference ScalingIBMpublicado el 26 de febrero de 2025.

For further information: Alfonso Mateos Cadenas. Dpto. Comunicación IBM España, Portugal, Grecia e Israel. alfonso.mateos@ibm.com

Deja un comentario