Google revela Gemini 2.5 Flash, su "modelo de pensamiento más rentable"

Solo semanas después de presentar Gemini 2.5 Pro, Google está en su próximo modelo de rendimiento superior.

El jueves, la compañía lanzó una «versión temprana» de Gemini 2.5 Flash en vista previa en la API de Gemini, AI Studio y Vertex AI. El modelo tiene un límite de conocimiento de enero de 2025. Puede tomar mensajes de texto, imágenes, videos y indicaciones de audio, y tiene una ventana de contexto de un millón de token.

Google dice que la nueva versión se expande en Flash 2.0 con un razonamiento mejorado, pero «sin comprometer su velocidad o costo de renombre». Los modelos de razonamiento pasan más tiempo «pensando», o interpretando una consulta, antes de responder, lo que resulta en una salida más exhaustiva y directa que, idealmente, se alinea mejor con las necesidades de un usuario, en comparación con los modelos anteriores que priorizan la velocidad. Los modelos que razonan también están mejor equipados para entregar con precisión problemas o tareas de varios pasos.

- Advertisement -[wpcode id="699"]

«Gemini 2.5 Flash se desempeña fuertemente en las indicaciones difíciles en el chatbot Arena, en segundo lugar solo a 2.5 Pro», señala Google en el anuncio.

Refiriéndose al nuevo modelo como el más rentable, Google señala que 2.5 Flash «permite a los desarrolladores configurar la cantidad de pensamiento que hace para maximizar el rendimiento». Esto les da a los desarrolladores un «presupuesto de pensamiento» o el poder de pagar el razonamiento solo cuando más lo necesitan. Con el razonamiento encendido, el precio de salida salta de 60 centavos por un millón de tokens a $ 3.50.

Si los desarrolladores no le dan al modelo un presupuesto, determina las necesidades de pensamiento de la consulta al evaluar la solicitud de complejidad. Por ejemplo, identificará indicaciones con necesidades de razonamiento mínimas, como «¿Cuántos estados hay en los Estados Unidos?» -Por separado de los problemas matemáticos de varios pasos. Google señala que para replicar la latencia y el costo de Flash 2.0, los desarrolladores deben establecer el presupuesto en 0.

- Advertisement -[wpcode id="699"]

Leer Google Chrome incluye WebMCP en versión preliminar, convirtiendo cada sitio web en una herramienta estructurada para agentes de IA

Gemini 2.5 Flash obtuvo un 12% en el último examen de la humanidad (HLE), un nuevo punto de referencia alternativo para las pruebas de la industria que se han vuelto demasiado fácil para los modelos en rápida evolución. Este puntaje superó a los modelos de competidores, incluidos Claude 3.7 Sonnet y Deepseek R1, pero no el O4-Mini recién listado de OpenAI, que llegó al 14% en la prueba.

Puede probar Gemini 2.5 Flash en la vista previa a través de la API Gemini en Google AI Studio y Vertex AI.

¿Quieres más historias sobre AI? Regístrese para la innovaciónnuestro boletín semanal.

Google revela Gemini 2.5 Flash, su «modelo de pensamiento más rentable»

Relacionada

Alerta de oferta: Lenovo todavía vende una tableta Android...

¿Qué pasa si el riesgo real de la IA...

ImageDetector vs Hive: comparación de la precisión de la...

Los últimos auriculares económicos de Soundcore solucionan mis mayores...

Samsung Galaxy S26 Ultra vs. Google Pixel 10 Pro...

Leave a Reply Cancelar respuesta