Cómo el desbordamiento de la pila está agregando valor a las respuestas humanas en la era de la IA

Publicado el:

spot_img
- Advertisment -spot_img

El sitio del sitio de preguntas y respuestas se fundó hace 17 años para permitir a los programadores, humano Programadores: publicar preguntas sobre problemas de programación y obtener respuestas de una comunidad de personas de ideas afines.

Desde su fundación, el mundo se ha enamorado de cómo ChatGPT y otros programas de IA generativos no solo pueden proporcionar respuestas, sino que incluso realizar el trabajo en sí, entregándole su propio código personalizado.

- Advertisement -[wpcode id="699"]

¿Cómo debería responder una comunidad de personas que comparten conocimiento al atractivo repentino de la automatización de la IA?

El CEO de Stack Overflow, Prashanth Chandrasekar, ha dirigido la compañía durante casi seis años, y tiene un plan. Me senté con él este mes para aprender cómo se está uniendo ese plan.

«Las cosas han cambiado; queremos cambiar con los tiempos», me dijo Chandrasekar. «Queríamos ir con la dirección del flujo del río».

El surgimiento de chatgpt

Realmente no tenía otra opción. A partir de 2022, el aumento de ChatGPT tuvo un impacto inmediato en el tráfico del sitio público de Stack Overflow, que ofrece la publicidad que representa una gran parte de sus ingresos.

- Advertisement -[wpcode id="699"]

Una forma principal en la que las personas llegaron al desbordamiento de Stack siempre fue una búsqueda en Google. La búsqueda pagada en Google fue la «interfaz de usuario para el desbordamiento de la pila», como dice Chandrasekar.

Poder preguntarle a un chatbot en lugar de buscar rápidamente las consultas de Google, y el tráfico comenzó a disminuir.

Chandrasekar llegó a una amplia conclusión filosófica no solo sobre IA y automatización, sino también por Internet.

«Nuestra opinión es que la naturaleza de Internet ha cambiado», dijo. Ya no se trata principalmente de la búsqueda pagada del tráfico del sitio de manejo de consultas humanas. «La interfaz de usuario ha cambiado para ser herramientas Gen AI», observó.

«Y, por lo tanto, tenemos que ser lo más receptivos posible a ese cambio de la industria. Necesitamos también diversificarnos» como una propiedad.

Chandrasekar y el equipo se dieron cuenta de que hay mucho valor en las 60 millones de respuestas de Stack Overflow para abordar las deficiencias de la IA generativa. Una opción era demandar a Openai y otros fabricantes de modelos de la Fundación AI. Los modelos de lenguaje grande «previamente capacitados» incluyen conversaciones de desbordamiento de pila, que son legalmente propiedad del desbordamiento de pila.

- Advertisement -[wpcode id="699"]

«Dijimos, OK, podríamos hacer eso, o podríamos hacer algo un poco más, digamos, novela, en relación con lo que todos los demás estaban haciendo».

En lugar de presentar una demanda, Stack Overflow instaló código para bloquear el raspado del sitio web público «, y luego dijimos:» Si está construyendo un bot de chat o lo que sea, tiene que trabajar con nosotros. Tengamos un acuerdo comercial justo «.

Conocimiento como servicio

Además de la publicidad y la versión empresarial pagada de Stack Overflow, llamada equipo, Chandrasekar está desarrollando una tercera fuente de ingresos conocida como soluciones de conocimiento, o conocimiento como servicio.

Chandrasekar ha estado firmando acuerdos para licenciar el contenido de Stack Overflow, primero con Google y OpenAI.

En los últimos 18 meses, también ha estado ocupado firmando «todos los hiperscalers de la nube, no puedo nombrarlos, pero los conoces», dijo. «Estamos en el proceso de hacer muchos más».

Esos acuerdos incluyen la integración con la herramienta de código Visual Studio de Microsoft, el copiloto de GitHub y la asistencia de código de Google Gemini, para obtener respuestas directamente dentro del entorno de programación.

Leer  A pesar de los temores de pérdida de empleo relacionados con la IA, la contratación tecnológica se mantiene estable, y aquí están las habilidades más demandadas

«Todas estas compañías están tomando, están aprovechando una versión oficial con licencia de nuestro conjunto de datos para capacitar a sus modelos para la capacitación previa para hacer cosas como el trapo y la indexación en algunos casos».

Aparecen las respuestas en ChatGPT u otros LLM, con un crédito y un enlace de regreso al desbordamiento de pila. «El objetivo es recuperar el tráfico que la gente dio a nuestro sitio web directamente», dijo. «Nos estamos convirtiendo en un sitio web sin cabeza: si las personas pasan todo su tiempo en los bots de Gen AI, eso también está bien».

Por supuesto, existe el riesgo de no tener relaciones directas con el usuario final si en realidad no están en el sitio de Overflow de Stack. Chandrasekar dijo que la compañía tiene varios acuerdos para obtener información pertinente de Operai y otros sobre cosas como el mensaje que el usuario de ChatBot está utilizando.

«Hay muchas sutilezas en el compromiso entre el compañero y nosotros», me dijo. «Estamos trabajando en cada escenario», dijo, como cuánto de la «ventana de contexto» de un LLM (el reciente recuerdo de los chats) se comparte con el desbordamiento de pila.

Las deficiencias de AI

Chandrasekar dijo que Stack Overflow está arreglando tres deficiencias principales de la tecnología para OpenAI y los otros gigantes.

Una deficiencia es lo que él llama el punto de confianza. «No confías en lo que sale de eso», aludiendo a las infame alucinaciones y confabulaciones de LLM.

La segunda deficiencia es LLM Brain Wrain. «Si no genera nueva información, estos LLM no van a progresar en su nivel de inteligencia», como está claro en las controversias sobre los llamados datos sintéticos que pueden contaminar LLM.

Por último, y quizás lo más importante, «las respuestas que salen de la Generación AI en realidad no son conocimiento», dijo Chandrasekar. «Puede haber una respuesta, pero pueden aprovecharse en la complejidad porque esto es demasiado complicado de un conjunto de circunstancias» y, por lo tanto, realmente necesita tener el rico contexto del desbordamiento de la pila, dijo.

Integración de equipos

Al mismo tiempo que ha firmado acuerdos con los Gigantes para el desbordamiento de la pila pública, Chandrasekar ha comenzado una segunda parte del negocio de soluciones de conocimiento. Stack Overflow está integrando su contenido público en el producto de equipos para corporaciones que desean expandir sus recursos de conocimiento interno con el propósito de AI de agente.

El producto del equipo se introdujo porque las compañías dijeron que querían su propia versión de Stack Overflow como un repositorio no para el conocimiento general de la programación sino para sus procesos corporativos particulares. Ahora, dijo Chandrasekar, las mismas compañías quieren expandir ese grupo de información porque quieren desarrollar agentes de IA que hacen mucho más que programación.

«Tenemos compañías como Uber que ya han hecho esto con nosotros, donde han construido un chatbot de IA que se llama asistente o, en un sentido muy generoso, agente porque se trata de realizar la acción. Pero ese agente está aprovechando los datos de los equipos para algo así como,» ¿Cómo hacemos este «? Tiempo adecuado «.

En otras palabras, la IA de agente automatiza lo que los empleados tradicionalmente hacen con los equipos. «Notamos esto porque nuestras API son al rojo vivo; nuestras API están siendo golpeadas constantemente por el bot».

Leer  Codificando con IA? Mis 5 mejores consejos para examinar su salida y mantenerse fuera de los problemas

Dada esa tendencia, Chandrasekar está agregando un nuevo elemento a los equipos, licenciando todos los datos del sitio público de Overflow de Stack a los mismos clientes.

«Dijimos: ‘¿Por qué no tomamos nuestro producto de soluciones de conocimiento, nuestros datos de plataforma pública y también lo presentamos a las empresas junto con los datos de los equipos?’ Un agente puede tener el conocimiento de 60 millones de preguntas y respuestas, y también todo el conocimiento específico de la empresa, y luego está aún más armado con la respuesta correcta en el momento correcto «.

El producto de los equipos, como las grandes ofertas de licencias, está integrado en varios productos, como el sistema de boletos JIRA IT de Atlassian.

Stack Overflow está negociando los términos de licencias con los usuarios de equipos empresariales. Chandrasekar se negó a discutir los detalles de los precios que no sea decir: «Es un modelo de precios basado en el valor».

«Son las primeras etapas», dijo, al determinar qué permitirá el mercado tales licencias de contenido.

Mejoras del sitio web

Al mismo tiempo que se están desarrollando soluciones de conocimiento, el sitio de desbordamiento de pila pública está recibiendo algunas mejoras bastante significativas.

La compañía todavía está «trabajando para regresar» al nivel de tráfico antes de ChatGPT, dijo Chandrasekar, sin revelar los números de tráfico, y agregar el sitio «aún no ha vuelto completamente al nivel previo a ChatGPT.

Chandrasekar está construyendo la funcionalidad del sitio público para hacerlo más en tiempo real.

El modo tradicional de desbordamiento de pila es una persona que publica una pregunta y luego otras publican sus respuestas sugeridas.

Otras dos formas de intercambio están enterradas en el sitio: chats y discusiones. Chandrasekar describe estos como modos de interacción de «carril de natación» que no proporcionan la perfección de la pila principal, las respuestas de desbordamiento, pero pueden obtener una respuesta a alguien mucho más rápidamente.

La filosofía de Chandrasekar es que «queremos proporcionar múltiples factores de forma y tipos de proyectos para tecnólogos de diferentes tipos».

La compañía también está pensando en agregar contenido de video instructivo de los usuarios. «Hay mucho contenido excelente», observó. «Imagínese si alguien está probando Deepseek y podemos, digamos, transmitirlo en vivo y capturarlo y alguien más puede aprender de esa experiencia. Realmente queremos pasar de ser una base de conocimiento en un sitio comunitario mucho más».

Si esto te suena como Reddit, Chandrasekar dijo que lo consigue mucho. La diferencia, señaló, es que «obviamente somos una audiencia muy especializada; no estamos tratando de ser todo para todas las personas». Admira el sitio social más grande. «Los conozco muy bien, y han sido geniales. Son primos cercanos para nosotros o, tal vez, un hermano más grande».

Observó que los acuerdos de licencia de Reddit con OpenAI ayudaron a allanar el camino para el negocio de soluciones de conocimiento.

Siempre existe el peligro de expandir una propiedad exitosa de que uno puede difundir los esfuerzos demasiado delgados. ¿Cómo coloca sus apuestas Stack Overflow?

«Queremos elegir los que más resuenan con nuestros usuarios», dijo. «Hablo mucho con la comunidad, básicamente interactúa con ellos para comprender cuáles duplicar. Literalmente estamos haciendo y ejecutando pruebas sobre cuáles realmente marcan la diferencia».

La relación internamente con Gen AI también ha cambiado. Al principio, cuando ChatGPT se hizo público, algunos usuarios de Stack Overflow obtuvieron respuestas preparadas del bot. El sitio respondió prohibiendo las respuestas de corte y pasta.

Leer  Este monitor de juegos Samsung Oled de 49 pulgadas está a la venta por más de $ 200 de descuento: cómo calificar

«Pero luego, dijimos, hablemos con la comunidad y veamos cómo querían hacer las cosas», dijo. «Una cosa que se hizo evidente es que las personas todavía les pareció bastante difícil involucrar a los humanos a los humanos en hacer preguntas».

Tradicionalmente, la moderación humana en el sitio podría llevar a que los moderadores regañen preguntas repetitivas o novatas. «Si está haciendo una pregunta sobre un tema técnico, si alguien hubiera respondido antes, alguien le diría que es una pregunta incorrecta. Ve a buscar antes de preguntar».

Llegó «una gran oportunidad para usar IA».

El sitio recientemente se puso en vivo con respuestas de «Géminis a motor». Ahora, «Géminis le está dando una solicitud, todo se le ha pedido y respondido» y llevándolo a la lista relevante «, todo en una ventana privada de usted y la IA,» así que no hay vergüenza en su consulta de novatos.

Los cambios en el sitio público de Stack Overflow son la iniciativa más reciente, pero las ofertas de licencias y las adiciones a los equipos ya parecen estar ayudando al negocio.

En el futuro

«Estamos creciendo como empresa», dijo Chandrasekar, mientras declinamos revelar finanzas. Stack Overflow es propiedad del gigante europeo de inversiones Prosus NV de los Países Bajos, que lo adquirió hace cuatro años por $ 1.8 mil millones.

Prosus figura enumerada públicamente, por lo que la compañía puede divulgar información financiera real sobre el desbordamiento de la pila cuando anuncia su informe completo del año fiscal, lo que generalmente hace a fines de junio cada año.

La parte de las soluciones de conocimiento del negocio se ha convertido en el negocio de más rápido crecimiento de Stack Overflow, seguido por las ventas de equipos y el negocio de publicidad, que es un negocio «muy estable» debido a la constante demanda de anunciar a los programadores donde pasan tiempo. Cada uno de los tres es un tercio de los ingresos, aproximadamente, dijo Chandrasekar.

Quizás la parte más pegajosa de esto es cómo la comunidad lo maneja. Hubo un retroceso cuando la compañía se acercó por primera vez a Google y OpenAI sobre la licencia de datos, no es sorprendente, ya que la comunidad considera las 60 millones de preguntas de su propiedad de la comunidad en cierto sentido, incluso si es legalmente propiedad de la corporación STACK Overflow.

Hubo tanto retroceso que algunos usuarios dijeron que fueron expulsados ​​del sitio si causaban revuelo por los acuerdos de licencia.

Sin entrar en los detalles de los conflictos pasados, dijo Chandrasekar, en este momento, los usuarios de Overflow se han dado cuenta de que la compañía no es una sin fines de lucro y que necesita obtener ingresos para cumplir con su propósito.

«Hice un AMA hace dos semanas», recordó un «preguntarme cualquier cosa» con los usuarios en Stack Overflow. «Dije, mira, no somos como cualquier otro sitio, pero no tomamos donaciones. Tiene un negocio que apoya el sitio, y una forma de impulsar un negocio es aprovechar lo que tiene que es útil para agregar valor en el ecosistema».

El resultado, dijo, es que «se dieron cuenta de que esto es algo bueno para la pila, y para ellos, porque al no hacer esto, en realidad no estamos capturando los ingresos que necesitamos para poder invertir nuevamente en la comunidad, para construir las herramientas moderador que necesitan. Entonces, la comunidad lo entiende ahora, lentamente».

¿Quieres más historias sobre AI? Regístrese para la innovaciónnuestro boletín semanal.

spot_img

Relacionada

Leave a Reply

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_img