
Anthropic ha annunciato Opus 4.5, l’ultimo e più avanzato modello della serie Claude 4.5, completando la lineup dopo i rilasci di Sonnet 4.5 e Haiku 4.5. L’obiettivo dell’azienda è chiaro: competere direttamente con i modelli più avanzati sul mercato — tra cui OpenAI GPT 5.1 e Google Gemini 3 — offrendo un approccio più solido a reasoning, gestione della memoria e capacità agentiche. Per le startup e le imprese data-driven, l’aggiornamento rappresenta un salto tecnologico con implicazioni concrete nella produttività quotidiana e nei workflow tecnici.
Performance da primato: Opus 4.5 supera l’80% su SWE-Bench verified
Uno dei risultati più significativi riguarda il benchmark di riferimento nel coding avanzato: SWE-Bench verified. Opus 4.5 è il primo modello a superare l’80% di accuratezza, un traguardo che segna un nuovo record per gli LLM orientati al software engineering.
SWE-Bench è strutturato per valutare la capacità dei modelli di navigare codebase complesse, comprendere bug reali e proporre patch funzionanti, simulando condizioni di lavoro dei repository open-source.
Oltre al coding, Opus 4.5 mostra miglioramenti consistenti in benchmark per tool use (tau2-bench, MCP Atlas) e reasoning avanzato (ARC-AGI 2, GPQA Diamond). Questo posiziona il modello come una soluzione adatta a processi ad alta intensità cognitiva, come debugging, QA automatizzato e assistenza alla scrittura di codice critico.
Focus su computer use e produttività: arrivano Claude for Chrome e Claude for Excel
Una delle strategie chiave del rilascio è il rafforzamento delle capacità di computer use, area nella quale Anthropic investe per permettere all’AI di eseguire task operativi complessi su browser e applicazioni.
In parallelo all’annuncio del modello, l’azienda estende la disponibilità di due strumenti finora in fase pilota:
Claude for Chrome – Ora disponibile per tutti gli utenti Max. L’estensione consente al modello di navigare il web, estrarre dati, automatizzare compilazioni di form e assistere in operazioni multistep direttamente nel browser.
Claude for Excel – Disponibile per utenti Max, Team ed Enterprise. Pensato per analisi dati, scrittura automatica di formule, gestione di spreadsheet complessi e automazione di modelli finanziari.
Queste integrazioni evidenziano come Anthropic voglia andare oltre la chat, puntando su uno scenario di utilizzo operativo in cui l’AI diventa un vero co-worker digitale.
Long-context più intelligente: nuova architettura di memoria e funzione “endless chat”
L’evoluzione più profonda di Opus 4.5 riguarda il modo in cui il modello gestisce la memoria. Anthropic ha introdotto aggiornamenti significativi alla long-context quality, ma — come sottolineato da Dianne Na Penn, Head of Product Management for Research — la capacità non si limita a un contesto più ampio: la chiave è ricordare le informazioni giuste.
Il nuovo sistema di gestione della memoria permette:
• migliore retention su conversazioni lunghe
• più precisione nel recupero di dettagli rilevanti
• maggiore robustezza nei task multi-step
Da questa nuova logica deriva anche la funzione “endless chat”, una delle più richieste dagli utenti. Quando il modello raggiunge il limite del contesto, non interrompe più la conversazione: comprime internamente i contenuti meno rilevanti e prosegue senza notifica.
Per chi usa l’AI come assistente continuativo — in task di ricerca, document analysis o gestione progetti — l’eliminazione delle interruzioni rappresenta un miglioramento sostanziale della user experience.
Progettato per agenti complessi: Opus 4.5 come lead agent
Anthropic ha costruito Opus 4.5 con un obiettivo esplicito: potenziare gli use case agentici, in cui il modello agisce come coordinatore di una rete di sub-agent (spesso basati su Haiku). Questi flussi richiedono solidità nella working memory, capacità di backtracking e navigazione di documenti o codebase articolate.
Secondo Penn, la memoria è fondamentale perché l’agente deve:
• esplorare e analizzare ampie codebase
• mantenere stato e contesto su task prolungati
• sapere quando tornare sui propri passi per verifiche
• orchestrare azioni parallele di altri agenti
Questa visione “multi-agent architecture ready” posiziona Opus 4.5 nel cuore dell’evoluzione dell’AI verso ecosistemi autonomi, capaci di portare avanti processi complessi end-to-end.
Una corsa tra giganti: Opus 4.5 contro GPT 5.1 e Gemini 3
La pubblicazione di Opus 4.5 avviene in una finestra temporale estremamente competitiva: OpenAI ha rilasciato GPT 5.1 il 12 novembre, mentre Google ha debuttato con Gemini 3 il 18 novembre.
In questo contesto, Anthropic punta su differenziazione tecnica: sicurezza, agentic workflows, gestione della memoria e integrazioni operative sono i pilastri con cui l’azienda intende conquistare developer, team enterprise e realtà che necessitano di assistenti altamente autonomi.
Per startup early-stage e scaleup innovative, l’arrivo di Opus 4.5 rappresenta un’occasione di upgrade immediato nei flussi di lavoro: più automazione, coding più rapido, analisi dati più robuste e un modello in grado di agire come vero team mate digitale.





