Anthropic lanza Claude 4.6 Sonnet: ahora programa mejor y puede usar un ordenador como tú

Anthropic lanza Claude 4.6 Sonnet: ahora programa mejor y puede usar un ordenador como tú

Anthropic ha presentado Claude 4.6 Sonnet, la nueva versión de su modelo de IA. A unas semanas de anunciar Opus 4.6, ahora toca el turno del modelo que utilizará la mayoría de las personas en la app de Claude. La actualización incluye mejoras en sus capacidades de razonamiento, conocimiento, diseño y una actualización completa de las habilidades de programación.

De acuerdo con una publicación en su web, Claude Sonnet 4.6 debuta con una ventana de contexto de 1 millón de tokens. Esto no solo le permite llevar a cabo razonamiento extendido, sino que también lo pone a competir frente a modelos más grandes. Anthropic menciona que el rendimiento que antes habría requerido a una IA como Opus, ahora está disponible a un menor coste para todos los usuarios, incluyendo a quienes tienen una cuenta gratuita.

La compañía francesa ha optimizado la arquitectura para que el modelo pueda gestionar tareas complejas de programación y análisis de datos con una latencia mínima. Anthropic señala que Claude Sonnet 4.6 puede usar un ordenador tal como lo hace una persona, escribiendo en un teclado y haciendo clic con un ratón virtual dentro del benchmark de OSWorld.

En las primeras pruebas, Sonnet 4.6 puede navegar en hojas de cálculo complejas o rellenar formularios web de varios pasos casi al nivel de un humano. Esto le permite llevar a cabo tareas de oficina en aplicaciones como Chrome, LibreOffice, Visual Studio Code y más. Aunque la nueva IA de Anthropic todavía no alcanza un nivel suficiente como para sustituir a un empleado, es útil para delegar tareas por medio de agentes.

Claude Sonnet 4.6: más inteligente, rápido y puede usar el ordenador casi como tú

Otro campo donde registró un avance notable es en el desarrollo de software. En la prueba de SWE-Bench Verified, Sonnet 4.6 está casi al nivel de Opus 4.5 y GPT-5.2. Anthropic mencionó que los usuarios prefieren esta versión frente a Claude Opus 4.5, puesto que es mejor en el seguimiento de instrucciones y lee el contexto con mayor eficacia antes de modificar el código. Además, el nuevo modelo puede interpretar problemas matemáticos y lógicos de alta dificultad.

Benchmark Claude Sonnet 4.6

La visión por computador es otro de los puntos donde Sonnet 4.6 ha recibido ajustes. Ahora es capaz de procesar imágenes, gráficos y tablas, así como de extraer información de PDFs o capturas de pantalla de forma más precisa. Mientras tanto, la ventana de contexto de 1 millón de tokens le permite analizar bases de código completas y decenas de artículos en una sola petición.

Este es uno de los agregados más interesantes que vimos en el debut de Claude Opus 4.6. Al contar con una ventana de contexto de ese tamaño, la IA puede manejar más datos sin sufrir una caída de rendimiento. “Sonnet 4.6 razona eficazmente en todo ese contexto. Esto puede mejorar considerablemente la planificación a largo plazo”, dijo la compañía.

Anthropic mencionó que Sonnet 4.6 es “cálido, honesto y prosocial”, aunque en ocasiones puede ser divertido. Esta personalidad no compromete la seguridad (como GPT-4o), ya que en las evaluaciones demuestra ser tan seguro como otros modelos de Claude y no existen indicios de desalineaciones y otros problemas de alto riesgo.

A diferencia de Opus 4.6, Claude Sonnet 4.6 estará disponible para los usuarios gratuitos a partir de hoy. El nuevo modelo se convertirá en el predeterminado de Claude en la app y la web. Los usuarios con cuenta Pro podrán usarlo en Cowork y Claude Code, así como acceder a otras funciones como investigación o la implementación de Excel.


Fuente original

Comments

No comments yet. Why don’t you start the discussion?

Deja un comentario