Cómo probamos la IA en ZDNET

Publicado el:

spot_img
- Advertisment -spot_img

Siga ZDNET: Agréganos como fuente preferida en Google.


Conclusiones clave de ZDNET

  • ZDNET prueba la IA con un uso práctico en el mundo real.
  • Sin influencia del proveedor, sin acceso a revisión previa a la publicación.
  • Las pruebas estandarizadas generan comparaciones justas de «lo mejor de».

Aquí en ZDNET sabemos que tenemos una gran responsabilidad. Sabemos que a menudo usted toma decisiones de compra basándose en parte en nuestras reseñas. Es importante que obtenga reseñas claras, imparciales y bien consideradas para tener un punto de partida confiable para decidir dónde gastar su dinero y/o tiempo.

- Advertisement -[wpcode id="699"]

Y sí, nos tomamos esa responsabilidad con la misma seriedad en el caso de los productos gratuitos, porque hoy en día el tiempo es un recurso tan escaso como el dinero en efectivo. No queremos que pierda su tiempo más de lo que queremos que pierda su dinero.

A veces trabajamos con proveedores para obtener acceso a sus productos y servicios para poder revisarlos. Pero nunca llegan a ver las reseñas antes de que las publiquemos. Nunca llegan a influir en lo que decimos en nuestras reseñas. Nuestras reseñas siempre son justas y se centran en evaluar los productos según su utilidad para nuestros lectores.

Cómo probamos la IA en 2026

Entonces, hablemos de cómo probamos la IA aquí en ZDNET. Tenga en cuenta que la IA se está infiltrando en casi todo, por lo que es una cartera bastante grande. Observamos grandes modelos de lenguaje, herramientas de desarrollo, generadores de imágenes, aplicaciones habilitadas para IA e incluso algún dispositivo de IA ocasional como aspiradoras (buen uso de la IA) y pines de IA (no tanto).

Probamos productos y servicios en función de una amplia gama de factores. Nuestra directiva principal es que todas las revisiones requieren experiencia práctica y pruebas en el mundo real. En la práctica, eso significa que, si bien podemos informar sobre un resultado de referencia a partir de un comunicado de prensa, no lo consideramos en las revisiones.

- Advertisement -[wpcode id="699"]

Cuando analizamos productos y servicios, tendemos a presentar dos tipos diferentes de reseñas. Cuando buscamos a los mejores en una categoría, elaboramos nuestras listas de «Lo mejor de». Cuando profundizamos en un producto o servicio, a menudo contamos historias personales sobre nuestras experiencias a largo plazo con ese producto. Estos diferentes enfoques nos permiten explorar productos y servicios desde múltiples perspectivas.

Leer  Adiós, Wi-Fi: cómo agregar una red cableada a tu hogar sin ejecutar Ethernet

Cómo hacemos revisiones comparativas

Elaborar nuestras reseñas comparativas (también llamadas «listas de los mejores») es en realidad un proceso de tres etapas. La primera etapa es construir criterios de evaluación que nos ayuden a comparar objetivamente los productos. La segunda etapa es elegir los productos a comparar. Y la tercera etapa es la comparación de productos prueba por prueba.

Cuando empezamos, siempre preguntamos: «¿Cómo vamos a evaluar esta categoría?» Normalmente construyo una serie de pruebas, que luego documento en el mejor artículo de la lista. Las pruebas nos ayudan a evaluar el rendimiento, el valor, la utilidad, la precisión, la seguridad, la privacidad y más. Nos gusta estandarizar las pruebas para que cuando llegue el momento de comparar productos, sepamos que estamos siendo objetivos.

Por ejemplo, en la revisión de los mejores chatbots, hay una metodología de prueba completa documentada al final del producto. Échale un vistazo. Lo mismo ocurre con la mejor comparación de generadores de imágenes con IA.

Cuando se trata de elegir productos candidatos, a menudo hay productos obvios que se agregan a nuestra lista de selección de candidatos. Por ejemplo, cuando se analizan los chatbots, ChatGPT, Gemini y Claude son candidatos obvios.

Luego profundizamos más. Revisamos productos o servicios que los lectores nos han pedido que evaluemos. Agregamos candidatos en función del rumor general sobre una categoría en lugares como foros, grupos de usuarios y redes sociales. Y a veces (pero no siempre), agregaremos un producto como candidato cuando un proveedor nos llama la atención sobre un producto relevante y se adapta bien a la categoría.

Normalmente terminamos con una lista de candidatos de cinco a diez productos. A menudo, un vistazo rápido a la metodología de prueba eliminará algunos productos. Algunos son demasiado caros en comparación con otros. Algunos simplemente no encajan.

- Advertisement -[wpcode id="699"]

Por ejemplo, constantemente me critican proveedores con clases de pago que piensan que su material educativo es tan bueno que debería incluirse en nuestra lista de las mejores clases gratuitas. A pesar de su fervor, sus cursos de pago nunca se incluirán en una lista de ofertas gratuitas.

Leer  La FCC prohíbe los drones DJI a partir de hoy: esto es lo que significa para usted

El proceso de elegir a los candidatos para las pruebas, organizar el acceso a los productos y servicios y asegurarse de que todo esté listo para la realización de las pruebas puede variar con el tiempo. Cuando eché un vistazo por primera vez a los creadores de sitios web de IA el año pasado, me llevó 231 correos electrónicos de ida y vuelta con los proveedores y más de seis meses tener todo en su lugar para poder probar sus productos. Este año, actualizar el proyecto tomó solo dos meses y menos de 50 correos electrónicos en total.

Eso me lleva a otros dos elementos: la prueba real y la nueva prueba. Las pruebas reales son sencillas, aunque requieren mucho tiempo. Debido a que ya tenemos una metodología de prueba y un conjunto estándar de pruebas cuando tenemos los productos en mano o las cuentas de servicio configuradas, podemos simplemente ejecutar las pruebas. Registramos los resultados prueba por prueba, pantalla por pantalla.

Más tarde, intentamos normalizar los resultados, a menudo haciendo un poco de cálculo para dar a los productos un valor de rendimiento y una ponderación comparativos. Los criterios para esas métricas también están documentados.

Y luego, se publica la lista. Pero ese no es el final de la historia.

En un campo que cambia tan rápidamente como la IA, los productos y servicios no se detienen. Algunos productos colapsarán y se quemarán, algunos proveedores se quedarán sin financiación o algo más saldrá terriblemente mal. Para otros, seguirán mejorando. En cualquier caso, después de seis meses a un año, las mejores listas están prácticamente desactualizadas. Sin duda, ese fue el caso de las revisiones del creador de sitios web de IA. El año pasado, todos ellos fueron bastante terribles. Este año, hay algunos que son realmente geniales.

Algunas de mis revisiones comparativas favoritas para la categoría de IA incluyen:

Viviendo con los productos

Otra forma de revisar los productos de IA es viviendo con ellos y realizando proyectos con ellos. Estas van más allá de las revisiones tradicionales porque sometemos los productos y servicios a días y semanas (a veces meses y años) de trabajo.

Los ejemplos más destacados de esto son mis artículos relacionados con la codificación. Es muy difícil comparar objetivamente las herramientas de codificación de IA sin construir algo. Pero codificar una tarea de clase es muy diferente a crear un producto o depurar un problema activo de un cliente.

Leer  Bot sofisticado utiliza OpenAI para evitar filtros, inundando más de 80,000 sitios web con spam

A menudo, estos proyectos están en curso. Ese trabajo continuo genera un montón de cosas geniales de qué hablar. Las impresiones también cambian.

Cuando miré por primera vez la codificación AI del Codex de OpenAI, era muy temprano y no me gustó en absoluto. A medida que Codex mejoró, hice otra prueba, esta vez para ver si podía actualizar mi producto de seguridad. Logré codificar 24 días en 12 horas, pero también encontré algunos inconvenientes. A medida que el servicio mejoró aún más, hice otra prueba y me encontré produciendo 4 años de desarrollo de producto en 4 días.

Han aparecido el mismo tipo de artículos de revisión experiencial sobre Gemini, ChatGPT, Claude Code, los distintos generadores de imágenes y más. A medida que las herramientas siguen evolucionando, seguimos encontrando nuevas formas de usarlas y someterlas a más pruebas y análisis profundos.

Es un proceso continuo y podemos acompañarlo en el viaje. Estos son algunos de mis favoritos del mundo de la IA:

Eres una gran parte del proceso.

Recibimos muchos comentarios de los lectores a través del correo electrónico, las redes sociales y los comentarios de artículos. Nos ayudas a entender lo que quieres que veamos. También apreciamos que nos exija un nivel bastante alto.

También apreciamos mucho que comparta sus impresiones sobre los productos que revisamos. Muchos de ustedes son bastante hábiles y conocedores. Entonces, sus perspectivas realmente nos ayudan a mantenernos informados, lo que, a su vez, nos ayuda a aumentar nuestro conocimiento y a mantenerlos aún más informados. Efectivamente, nuestro trabajo aquí en ZDNET es revisado por millones de nuestros compañeros profesionales, usuarios avanzados y entusiastas: ustedes, los lectores de ZDNET.

Somos diligentes con nuestras revisiones porque sabemos lo importantes que son para usted, cuánto las tiene en cuenta al tomar decisiones de compra y que está invirtiendo dinero y tiempo reales en juego, a menudo basándose en parte en lo que compartimos en ZDNET.

No dudes en comunicarte con nosotros si quieres que veamos algo nuevo. ¿En qué categoría, producto o servicio de IA desea que profundicemos a continuación? Háganos saber en los comentarios a continuación.


Puedes seguir las actualizaciones diarias de mi proyecto en las redes sociales. Asegúrate de suscribirte a mi boletín de actualización semanal y sígueme en Twitter/X en @DavidGewirtzen Facebook en Facebook.com/DavidGewirtz, en Instagram en Instagram.com/DavidGewirtz, en Bluesky en @DavidGewirtz.com y en YouTube en YouTube.com/DavidGewirtzTV.

spot_img

Relacionada

Leave a Reply

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_img