Claude Sonnet 4.5 podría ser su próxima herramienta de codificación de avance: cómo acceder a ella hoy

Publicado el:

spot_img
- Advertisment -spot_img

Sigue a ZDNET: Agréganos como fuente preferida en Google.


Takeaways de llave de ZDNET

  • El último modelo de Anthrope, Claude Sonnet 4.5, está aquí.
  • Obtuvo un puntaje muy alto en los puntos de referencia de codificación.
  • El código Claude también recibió actualizaciones tan esperadas.

Las herramientas de codificación de Anthrope se han considerado bien entre los desarrolladores, con su modelo de soneto Claude 4, lanzado en mayo, sirviendo como un asistente de codificación gratuito y confiable para muchos. Solo unos meses después, Anthrope ha lanzado su modelo de próxima generación, con actualizaciones de su rendimiento en todos los ámbitos.

- Advertisement -[wpcode id="699"]

Claude Sonnet 4.5 ya está disponible, dijo la compañía el miércoles, alegando que es el «mejor modelo de codificación del mundo», así como el mejor modelo para construir agentes complejos, utilizar computadoras y obtener razonamiento y capacidades matemáticas. Anthrope también lanzó actualizaciones a través de su oferta de código Claude, Claude for Chrome Extension y más.

¿Qué hay de nuevo en el soneto de Claude 4.5?

Si ha estado rastreando de cerca los lanzamientos de Anthrope, puede recordar que en mayo, Claude Opus 4 y Sonnet 4 obtuvieron puntajes más altos entre los modelos fronterizos en las pruebas de referencia de ingeniería de software estándar de la industria (SWE-Bench), que evalúa las habilidades de LLMS para resolver tareas de ingeniería de software del mundo real obtenidas de Github. Claude Opus 4.1, lanzado en agosto, lo superó.

Leer  Cómo Highmark Health y Google Cloud están utilizando Gen AI para optimizar las afirmaciones médicas y mejorar la atención: 6 lecciones clave

Ahora, Claude Sonnet 4.5 ha lamido ese último modelo, superando a la evaluación verificada de SWE-Bench, un subconjunto filtrado por humanos del banco SWE. Claude Sonnet 4.5 también superó a los modelos líderes de competidores, incluidos GPT-5 Codex, GPT-5 y Gemini 2.5 Pro.

Anthrope dijo que en el banco SWE verificado, el soneto 4.5 mantuvo su enfoque durante más de 30 horas en tareas complejas de múltiples pasos. Esta capacidad es específicamente útil para tareas de agente, que a menudo requieren un trabajo en solitario en segundo plano durante períodos prolongados de tiempo.

- Advertisement -[wpcode id="699"]

Otras mejoras incluyen su rendimiento en las computadoras, como lo indican su puntaje en el punto de referencia OSWorld, que prueba el rendimiento de los modelos de IA en las tareas de computadora del mundo real:

«El soneto 4.5 ahora lidera al 61.4%. Hace solo cuatro meses, Sonnet 4 mantuvo la ventaja en 42.2%», señaló Anthrope en el comunicado.

El Claude para Chrome Extension, ahora se implementó para todos los que se unieron a la lista de espera el mes pasado, usa estas capacidades. Anthrope también vio mejoras en matemáticas y razonamiento.

Claude Sonnet 4.5 también es el modelo de frontera «más alineado» de Anthrope hasta ahora, según la compañía. Esto significa que es el modelo el que se adhiere más a las instrucciones de los humanos y los casos de uso previsto, y eso ha reducido las instancias de comportamientos como la sycofancia y el engaño. El modelo también es mejor para resistir los ataques de inyección rápidos y tiene protecciones de nivel de seguridad de IA (ASL-3) en el marco modelo de Anthrope.

Leer  Google cree que la IA puede desenredar la burocracia de la red eléctrica

Cómo acceder

Claude Sonnet 4.5 está disponible en todas partes, incluso en el chatbot Claude.ai. Por supuesto, los desarrolladores y profesionales pueden acceder al nuevo modelo en el código API y Claude, y por el mismo precio que Sonnet 4.

Otras actualizaciones

Anthrope también actualizó sus otras ofertas de codificación, comenzando con el código Claude, que ahora tiene puntos de control que permiten a los usuarios guardar el progreso y volver a visitar un estado anterior. También tiene lo que Anthrope está llamando a una interfaz terminal «renovada» y una extensión de código VS nativo.

Anthrope también lanzó el Claude Agent SDK, que es la misma infraestructura que impulsa el código Claude, que permite a los desarrolladores construir sus propios agentes con él.

- Advertisement -[wpcode id="699"]

La API del código de Claude ha introducido una nueva función de edición de contexto y una herramienta de memoria que permite a los agentes trabajar de manera más eficiente y abordar problemas más complejos, según la compañía. La compañía también actualizó las aplicaciones de Claude para que puedan ejecutar código y crear archivos en el chat.

spot_img

Relacionada

Leave a Reply

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_img