Los modelos de idiomas grandes como el GPT-4O de ChatGPT parecen tener toda la información en el universo conocido, o al menos lo que los ingenieros podrían escanear en Internet.
Pero, ¿qué pasa si desea utilizar un modelo de idioma grande (LLM) con información patentada de los datos de su propia empresa o información especializada que no está disponible públicamente en Internet, o capacitar de otra manera a un LLM para tener un conocimiento especializado?
¿Construyes un LLM desde cero? ¿Utiliza un modelo pequeño, de código abierto y autohospedado que contenga solo su información?
Resulta que puede comenzar con un LLM como GPT-4O, y luego acumularlo sobre eso. Eso se llama una IA personalizada.
En este artículo, Eric Boyd, vicepresidente corporativo de Microsoft para plataformas de IA, comparte con ZDNET sobre cómo Microsoft hace posible la IA personalizada para sus clientes, lo que entra en un modelo personalizado, qué implica todo el proceso y algunas mejores prácticas.
Comencemos.
ZDNET: ¿Puede presentarse y proporcionar una visión general de su papel en Microsoft y con su plataforma AI?
Eric Boyd: Lidero el equipo de la plataforma AI en Microsoft. Han sido un par de años loco en el espacio de IA.
Comencé a trabajar en Microsoft en 2009 en la organización Bing, y ha sido fenomenal ver que las cosas evolucionarán desde allí, porque gran parte de la innovación de IA de Microsoft comenzó con Bing. Construimos la infraestructura para entrenar modelos de IA, para iterar y experimentar para ver qué modelo de IA funcionaba mejor. Y toda esa infraestructura se convirtió en pedazos y componentes de cosas que ahora servimos a través de la fundición de Azure Ai.
A través de Azure AI Foundry, ayudamos a las empresas a acceder a todo, desde miles de GPU para construir y capacitar a sus propios modelos de IA, hasta las herramientas necesarias para administrar eso, a un catálogo de modelos de IA, grandes y pequeños, abiertos y fronterizos, que ofrecemos a través de nuestra asociación con OpenAI y otros proveedores.
También proporcionamos herramientas para crear aplicaciones en la parte superior de estos modelos de IA, incluida una amplia gama de capacidades que nuestros clientes necesitan para asegurarse de que puedan hacerlo de manera responsable.
En última instancia, mi equipo se centra en construir Azure Ai Foundry para que incluya todo lo que un cliente o desarrollador podría necesitar para construir sus soluciones de IA y pasar fácilmente de una idea a otra de una manera segura y confiable.
AI generativa vs. AI personalizada
ZDNET: Entonces, el año pasado tuvimos una IA generativa. Ahora tenemos AI personalizado. ¿Qué es y por qué no es suficiente IA generativa?
EB: A medida que las empresas han comenzado a implementar aplicaciones, los modelos generativos de IA y los modelos Base Foundation las han llegado bastante lejos. Pero muchos encuentran casos de esquina en los que los modelos de base base no responden súper bien.
Por lo tanto, la IA personalizada es la capacidad de una empresa para usar sus propios datos para personalizar su modelo principal para obtener respuestas de mejor calidad a las preguntas, y en algunos casos pueden usar un modelo de menor costo.
ZDNET: ¿Cuáles son las ventajas clave de la IA personalizada sobre las soluciones generativas de IA generativas para usar?
EB: La calidad y el costo son las dos ventajas principales. Con la IA personalizada, puede mejorar la calidad de las respuestas de su aplicación al encontrar dónde el modelo de base es débil y luego ajustar la respuesta. El ajuste fino también le permite, en algunos casos, usar un modelo de menor costo para lograr una calidad de modelo de mayor costo.
ZDNET: ¿Puede compartir ejemplos de cómo las empresas han implementado con éxito las soluciones de IA personalizadas?
EB: Microsoft aplica ampliamente esta técnica en nuestra pila tecnológica, ya que a menudo actuamos como nuestro propio «cliente cero», lo que nos ha permitido experimentar, aprender y perfeccionar las mejores prácticas de vanguardia. GitHub Copilot y Nuance Dax fueron ampliamente ajustados y personalizados con producción de codificación especializada y conocimiento de salud. A medida que aumenta la calidad de la salida, también lo hace la adopción.
DAX Copilot ha superado dos millones de encuentros médicos mensuales para el médico, el 54% del trimestre a trimestre, y están siendo utilizados por los principales proveedores como el general Mass Brigham, Michigan Medicine y Vanderbilt University Medical Center. Al ajustar a estos datos específicos, la solución hace un mejor trabajo que produce un registro médico en lugar de resumir una conversación médico-paciente.
Estamos en una posición única con muchas aplicaciones de IA en el conjunto de productos de Microsoft, y en la construcción de ellos, hemos aprendido mucho sobre lo que la gente quiere hacer a continuación. Al comprender cómo varias técnicas han ayudado a nuestras propias aplicaciones, tenemos una visión sólida de cómo esto va a ayudar a las aplicaciones de nuestros clientes.
ZDNET: ¿Qué consejo darías a las empresas que recién comienzan su viaje de personalización de IA?
EB: Generalmente aliento a las empresas a demostrar que su caso de uso funciona utilizando el modelo de base más potente posible, y luego busque pasos para mejorar la calidad o reducir el costo.
La personalización sería una técnica para ambos. Para esto, necesitarán haber usado su aplicación lo suficiente como para conocer sus debilidades potenciales, donde el modelo y los datos no responden las preguntas como quieren, y comenzar a recopilar esos datos y construir el repositorio de lo que quieren que haga el modelo. Finalmente, esos serán los datos que usamos para personalizar el modelo.
En la era de la IA, los datos son un marcador de cambios, ya que estos sistemas requieren datos de alta calidad, accesibles y seguros para funcionar correctamente. Asegurarse de que tengan esos datos es una parte clave para personalizar el modelo. Estamos trabajando para ayudar a los clientes a modernizar sus datos en la nube y unificar sus propiedades de datos para construir la próxima generación de aplicaciones inteligentes.
Optimizar su inversión de IA
ZDNET: ¿Cuáles son las implicaciones de costos de desarrollar y mantener soluciones de IA personalizadas, y cómo pueden las empresas optimizar sus inversiones?
EB: El costo de ajustar el modelo a menudo es relativamente modesto, pero una inversión importante, ya que también hay costos para recopilar los datos y luego capacitar al modelo. Los clientes también deben considerar la vida útil del modelo.
Al ajustar, sugerimos comenzar con un modelo fundamental (GPT-4O o similar) para personalizar. Cuando salga el modelo de próxima generación, puede elegir «Voy a mantener mi modelo personalizado» o «Voy a volver a instomizar el modelo de próxima generación».
Mantener su conjunto de datos facilitará la personalización posterior, pero tendrá que hacerlo nuevamente. Aunque eso es algo a considerar, no se preocupe porque el impacto depende del ritmo de la innovación del modelo.
No podemos decir lo que depara el futuro para las nuevas capacidades de modelo, pero los clientes que ajustaban GPT-4O hace un año probablemente estarían contentos con su solución hoy, a pesar de los avances en modelos de razonamiento como la serie O1.
ZDNET: ¿Cuáles son los obstáculos más comunes que enfrentan las organizaciones al implementar la IA personalizada y cómo pueden superarlas?
EB: Para personalizar los modelos, necesita datos que aborde en qué parte de su aplicación desea mejorar. Tener datos generales en su modelo probablemente no lo llevará al siguiente nivel. Necesita datos donde su aplicación no funcione como desee, para que pueda determinar cómo mejorarla.
En el pasado, la mayoría de las empresas no se han acostumbrado a hacer esto, por lo que es un nuevo músculo para construir. Aunque existen herramientas y técnicas para automatizar eso, muchas compañías no tienen a las personas que saben cómo hacerlo, por lo que necesitan invertir en desarrollar esas habilidades en primer lugar, y luego trabajar en aplicarlas
ZDNET: ¿Qué consideraciones éticas deben tener en cuenta las organizaciones al implementar la IA personalizada?
EB: No creo que la IA personalizada traiga nuevas consideraciones éticas. Es el mismo conjunto de cosas que debes considerar ampliamente con la IA generativa. Es «Aquí está esta aplicación que he desarrollado. ¿Cómo voy a asegurarme de que se comporte de manera responsable para mi marca, para mis aplicaciones y para las posibles implicaciones de cómo se utilizará esta aplicación?»
Todas las cosas que cubrimos en nuestro estándar de IA responsable de cómo creemos que las personas deberían comportarse aún deben considerarse. Uno de los beneficios de usar nuestra plataforma para desarrollar e implementar sus aplicaciones de IA es que Microsoft ofrece herramientas como la seguridad de contenido de AI AI que funcionan con los modelos personalizados, para que los clientes puedan estar seguros de que sus sistemas son responsables por diseño.
Sesgo, justicia y transparencia
ZDNET: ¿Cómo aborda Microsoft las preocupaciones sobre el sesgo, la justicia y la transparencia en los modelos de IA personalizados?
EB: Hoy, ofrecemos más de 30 herramientas y 100 características para ayudar a nuestros clientes, desarrolladores e investigadores a construir responsablemente con IA. Aunque la seguridad del contenido de AI Azure está integrada de forma predeterminada en todos los modelos en el catálogo de Foundry Azure AI, prevenir el mal uso y el abuso en el nivel del modelo solo es casi imposible. Es por eso que es imperativo tener sistemas y herramientas que lo ayuden a probar y monitorear cada paso del camino, antes, durante y después de la implementación.
Microsoft tiene como objetivo ayudar a los clientes a través de cada capa de mitigación generativa de riesgos de IA. Tenemos herramientas para ayudar a los usuarios a mapear, medir, mitigar, monitorear, responder y gobernar. Estamos viendo esto desde el nivel del sistema, el nivel de usuario y el nivel del modelo. Continuamos invirtiendo en investigaciones sobre la identificación, medición y mitigación de diferentes tipos de daños relacionados con la equidad, y estamos innovando en nuevas formas de probar de manera proactiva nuestros sistemas de IA, como se describe en nuestro estándar de IA responsable.
ZDNET: ¿Cómo admite Microsoft Azure a las empresas para adaptar a los modelos de IA a sus necesidades específicas?
EB: Hemos estado construyendo sistemas en Azure Ai Foundry para simplificar este proceso. Existe el servicio de ajuste fino y los servicios de observabilidad que facilitan la recopilación de datos sobre aplicaciones, que a su vez se pueden usar para ajustar.
ZDNET: ¿Qué papel juega la IA de código abierto en la personalización y escalabilidad de las soluciones de IA?
EB: Hemos visto mucha innovación en el espacio modelo de código abierto, principalmente a precios más bajos (y, por lo tanto, puntos de calidad más bajos). Pero esos modelos de menor costo a menudo son buenos lugares para comenzar porque puede probar y experimentar para ver si puede lograr la calidad que obtendrá con un modelo de mayor precio.
En general, la innovación en este espacio ha traído una gran variedad de modelos al catálogo de modelos Azure AI Foundry, que los clientes pueden evaluar y elegir el mejor modelo para su caso de uso.
ZDNET: ¿Cuáles son las diferencias clave entre el ajuste de los modelos de IA existentes y la construcción de soluciones de IA desde cero?
EB: Es enormemente costoso construir su propio modelo desde cero, mientras que el ajuste fino es bastante razonable para la mayoría de las aplicaciones. El costo sería la diferencia principal. Pero si solo está construyendo una solución de IA estándar utilizando un modelo de base tradicional (no un modelo personalizado), la diferencia principal es que puede sacrificar la calidad y/o el precio, las dos palancas principales para las que está optimizando.
Los agentes son las aplicaciones de la era de Ai
ZDNET: ¿Qué impacto prevé que los copilotos de IA tengan en las estrategias empresariales de IA?
EB: Los modelos de idiomas grandes han cambiado la forma en que se hacen los negocios en las empresas, y vemos que solo continúa acelerando. Con nuestros clientes, los vemos cada vez más construir aplicaciones que realicen tareas para las personas y el trabajo completo, y lo hagan por ellos, en lugar de simplemente responder una pregunta.
Este es el cambio hacia los agentes de IA que se están discutiendo. Los agentes son las aplicaciones de la era AI. Cada línea de sistema comercial hoy se reinventará como un agente que se encuentra encima de un copiloto. Eso va a transformar grandes franjas de diferentes procesos comerciales.
ZDNET: ¿Cómo deben equilibrar las organizaciones la automatización de IA con la supervisión humana para garantizar resultados óptimos?
EB: Esta es una pregunta clave. Estos modelos hacen muchas cosas, pero no todo bien. Asegurar que comprendamos sus capacidades y que las personas finalmente sean responsables del trabajo que se realiza debe ser una parte clave de las políticas de IA responsables, y una parte clave de cómo recomendamos que se construyan aplicaciones.
El espíritu de las herramientas de IA de Microsoft se trata de avanzar en la agencia humana, poner al humano en el centro y estar basado en su contexto. Estamos creando plataformas y herramientas que, en lugar de actuar como un sustituto del esfuerzo humano, pueden ayudar a los humanos con el trabajo cognitivo.
ZDNET: Si pudiera ofrecer una conclusión clave a los líderes empresariales que exploran la IA personalizada, ¿cuál sería?
EB: A medida que las aplicaciones de IA se convierten en una parte más grande de la cartera de cada empresa, se perderán si no piensan en su estrategia de personalización para garantizar las aplicaciones de mejor rendimiento y mejor rendimiento al mejor precio.
Para las empresas que desean comenzar hoy con AI personalizada, digo: mire su aplicación generativa de IA, apunte en la que en esa aplicación desea mejorar, recopilar algunos datos y prestarle una oportunidad.
ZDNET: ¿Cómo ves el futuro de la IA evolucionando más allá de la IA personalizada, y cuál es el próximo cambio principal en el horizonte?
EB: Hemos pasado los últimos dos años construyendo aplicaciones que saben cómo usar sus datos para ayudarlo a responder una pregunta y luego darle una respuesta de texto. Creo que vamos a pasar los próximos dos años construyendo aplicaciones que realizan parte del trabajo para usted.
En este escenario, puede asignar tareas y esperar que se realicen, a veces de forma autónoma a través de agentes, en comparación con una conversación de chat sincrónica. Pero los agentes son solo una aplicación de modelo de lenguaje grande que puede pedir que trabaje y realice acciones.
Dentro de esas aplicaciones, aún encontrará lugares donde los modelos personalizados mejorarán la calidad del sistema, incluso cuando el cómputo ocurra detrás de escena.
¿Has explorado la IA personalizada?
¿Qué pasa con tu organización? ¿Has explorado la personalización de IA de grado empresarial ya? ¿Qué desafíos u oportunidades ve en la adaptación de los modelos de base a sus propios datos? ¿Está considerando modelos de ajuste como GPT-4O o trabajando con alternativas de código abierto? ¿Qué papel cree que desempeñarán los agentes y los copilotos en su estrategia comercial? Háganos saber en los comentarios a continuación.
Puede seguir mis actualizaciones de proyecto diarias en las redes sociales. Asegúrese de suscribirse a mi boletín de actualizaciones semanales y sígueme en Twitter/X en @Davidgewirtzen Facebook en Facebook.com/davidgewirtz, en Instagram en Instagram.com/davidgewirtz, en bluesky en @davidgewirtz.com, y en YouTube en youtube.com/davidgewirtztv.
¿Quieres más historias sobre AI? Regístrese para la innovaciónnuestro boletín semanal.