Ir al contenido principal

Desbloqueando la IA empresarial con innovación open source: cualquier modelo, acelerador o nube

 

Por Chris Wright, director de tecnología y vicepresidente sénior, Ingeniero Global, Red Hat

“Cualquier carga de trabajo, cualquier aplicación, en cualquier lugar” fue el mantra del Red Hat Summit 2023. Es cierto que, en los últimos dos años, hemos visto algunos cambios en TI. Pero la visión de Red Hat no ha cambiado, ha evolucionado. 

“Cualquier modelo, acelerador o nube”.

Ese es el mensaje de la nube híbrida para la era de la IA. Y la mejor parte es que, al igual que la “antigua” nube híbrida, la innovación open source es la que impulsa todo. En el Red Hat Summit mostramos cómo los ecosistemas de IA estructurados en torno al open source y a modelos abiertos pueden generar nuevas opciones para las empresas.

La apertura trae consigo la posibilidad de elegir y esta libertad da paso a una mayor flexibilidad: desde el modelo que mejor responde a las necesidades de la empresa hasta el acelerador subyacente y el lugar donde se ejecutará efectivamente la carga de trabajo. Las estrategias de IA exitosas seguirán a los datos, dondequiera que se encuentren en la nube híbrida.

¿Y qué impulsa a la nube híbrida? El open source.

La inferencia potencia la IA

En mi opinión, debemos empezar a mirar más allá de los modelos. Sí, es verdad que los modelos son muy importantes para las estrategias de IA. Pero sin la inferencia, la faceta "práctica" de la IA, los modelos son simplemente conjuntos de datos que no "hacen" nada. La inferencia se refiere a la rapidez con la que un modelo responde a la información ingresada por el usuario y a la eficiencia con la que se pueden tomar decisiones en recursos informáticos acelerados. En última instancia, las respuestas lentas y la poca eficiencia cuestan dinero y generan desconfianza en el cliente.

Es por eso que me entusiasma mucho que Red Hat priorice la inferencia en nuestro trabajo con la IA open source, comenzando con el lanzamiento de Red Hat AI Inference Server. Esta solución, que surge a partir del proyecto open source vLLM líder y está optimizada con tecnologías Neural Magic, ofrece a las implementaciones de IA un servidor de inferencia con soporte, ciclo de vida completo y listo para producción. Lo mejor de todo es que puede rastrear tus datos dondequiera que se encuentren, ya que la solución funcionará con cualquier plataforma de Linux, cualquier distribución de Kubernetes, Red Hat o de cualquier otro modo.

¿Qué es mejor que la IA empresarial? La IA empresarial a gran escala

La aplicación estrella de la TI empresarial no es una única carga de trabajo unificada ni un nuevo servicio en la nube: es la capacidad de escalar de forma rápida y eficiente. Esto también se aplica a la IA. Sin embargo, la IA presenta una particularidad: los recursos informáticos acelerados que sustentan las cargas de trabajo de IA también deben escalarse. Esta no es una tarea fácil, en vista de los gastos y las habilidades necesarias para implementar este hardware en la forma debida.

Lo que necesitamos no es solo la capacidad de escalar la IA, sino también de distribuir cargas de trabajo masivas de IA entre múltiples clústeres de computación acelerada. Esto se ve agravado por el escalado del tiempo de inferencia que requieren los modelos de razonamiento y la IA agéntica. Al compartir la carga, se pueden reducir los problemas de rendimiento, mejorar la eficiencia y, en última instancia, la experiencia del usuario. Con el proyecto llm-d de código abierto, Red Hat ha tomado medidas para hacer frente a este problema.

El proyecto llm-d, dirigido por Red Hat y respaldado por líderes del sector de la IA en aceleración de hardware, desarrollo de modelos y cloud computing, combina el poder comprobado de la orquestación de Kubernetes con vLLM, uniendo dos referentes del open source para responder a una necesidad muy real. Junto con tecnologías como el enrutamiento de redes con IA y la descarga de caché KV, entre otras, llm-d descentraliza y democratiza la inferencia de IA y, de ese modo, ayuda a las empresas a optimizar sus recursos informáticos y disponer de cargas de trabajo de IA más efectivas y de menor costo.

Abierto a lo que se viene en IA, no solo al código

Llm-d y vLLM, incluidos en Red Hat AI Inference Server, son tecnologías open source preparadas para responder a los desafíos de la IA empresarial de hoy. Sin embargo, las comunidades de desarrollo no se limitan a analizar lo que se necesita hacer ahora. Las tecnologías de IA tienen una forma particular de acortar los plazos: el vértigo de la innovación implica que algo que se creía que no plantearía un desafío en años, de repente debe afrontarse de lleno.

Por ese motivo es que Red Hat está destinando recursos a la fase de desarrollo inicial de Llama Stack, el proyecto liderado por Meta que ofrece componentes básicos y API estandarizados para los ciclos de vida de las aplicaciones de IA generativa. Además, Llama Stack es ideal para crear aplicaciones de IA agénticas, que representan una nueva evolución de las potentes cargas de trabajo de IA generativa que vemos hoy en día. Más allá de su desarrollo inicial, Llama Stack está disponible como versión preliminar para desarrolladores dentro de Red Hat AI, para aquellas empresas que hoy quieran comprometerse con el futuro.

En lo que respecta a los agentes de IA, aún no contamos con un protocolo común para el modo en que otras aplicaciones les proporcionan contexto e información. Aquí es donde entra en juego el protocolo de contexto de modelo (MCP). Desarrollado y convertido en open source por Anthropic a fines de 2024, se trata de un protocolo estandarizado para las interacciones entre agente y aplicación, similar a los protocolos cliente-servidor de la informática tradicional. Pero lo más importante es que las actuales aplicaciones pueden, de improviso, valerse de la IA sin necesidad de una reimplementación a gran escala. Esto es importantísimo y no sería posible si no fuera por el poder del open source. Al igual que Llama Stack, MCP está disponible como versión preliminar para desarrolladores en la plataforma de Red Hat AI.

Los modelos propietarios de IA pueden haber logrado una ventaja inicial, pero no hay duda de que los ecosistemas abiertos los han superado, en especial en cuanto al software que sustenta estos modelos de IA de próxima generación. Gracias a vLLM y llm-d, junto con productos empresariales open source con seguridad reforzada, el futuro de la IA es prometedor, independientemente del modelo, el acelerador o la nube, y está impulsado por el open source y por Red Hat.


Entradas populares de este blog

GRUPO DANEC S.A FUE RECONOCIDO A NIVEL INTERNACIONAL POR PRODUCIR ACEITE DE PALMA SUTENTABLE

Ingeniero Juan Carlos Quevedo, Gerente Grupo Danec; Ing Fernando Naranjo, Director De RSPO para América Latina y El Caribe; Edward Berg, Gerente General Suplente de Grupo Danec y  Patricio Carrasco, Gerente de Proyectos Agrícolas de Grupo Danec Grupo Danec S.A, obtuvo el reconocimiento mundial en referencia a las mejores prácticas sobre el cultivo sostenible de aceite de palma, este reconocimiento fue dado por la Mesa Redonda de Aceite de Palma Sostenible en sus siglas es (RSPO). RSPO es una asociación sin ánimo de lucro que reúne a los diversos actores en torno al cultivo de palma, es a la vez reconocida, a nivel internacional, en materia de sostenibilidad, para los sectores que producen Palma a nivel mundial.  Las unidades de manejo de Grupo Danec S.A certificadas suman un total de 30.221 hectáreas, dentro de las cuales la empresa tiene 24.563 hectáreas de palma certificada, RSPO y 4.907 hectáreas en bosque, de alto valor de conservación,...

CAMECOL celebró su 40 años de integración y cooperación binacional

  La Cámara de Comercio e Industrias Ecuatoriano Colombiana – CAMECOL celebró su 40º aniversario de trabajo ininterrumpido en favor de la integración, la cooperación y el fortalecimiento de los vínculos empresariales entre Ecuador y Colombia. La ceremonia contó con la presencia de la Embajadora de Colombia en Ecuador, María Antonia Velasco, quien ofreció un saludo; así como del Ministro Marco Ponce, Subsecretario de Soberanía y Relaciones Vecinales de la Cancillería Ecuatoriana; que fueron recibidos por Freddy Cevallos, presidente de la Cámara, y Alexandra Mosquera, directora ejecutiva. Uno de los momentos más significativos fue la presentación del documento conmemorativo “Más que Frontera: 40 años de comercio y cooperación entre Ecuador y Colombia”, publicación que recopila información histórica y analiza la evolución de los flujos de comercio bilateral entre 1994 y 2024. El documento puede descargarse en el siguiente enlace: https://n9.cl/qaof8y La jornada incluyó también ...

La transformación de la IA es un viaje, no un destino

  Por Andrea Cavallari, Directora Sr. de Prácticas de Servicios para Latinoamérica en Red Hat La rápida evolución de la inteligencia artificial, el uso cada vez más amplio de chatbots y la creciente automatización de tareas han provocado una rápida transformación del mercado laboral. Esto es un panorama que genera sentimientos encontrados: mientras algunas empresas y profesionales buscan aprovechar esta tendencia positiva creando nuevos modelos de negocio, productos y servicios basados ​​en IA, otros se ven paralizados por el miedo, preguntándose si sus trabajos y organizaciones podrán sobrevivir a la nueva era. El complejo escenario, sin embargo, parece un poco más optimista en América Latina. Un estudio reciente del Thomson Reuters Institute descubrió que el 56% de los encuestados en la región todavía expresan entusiasmo por el futuro de la inteligencia artificial, especialmente la IA generativa, en sus industrias, una cifra que supera significativamente el 27% de los encues...