GPT-5.5, AI al lavoro

OpenAI ha annunciato GPT-5.5, il nuovo modello per ChatGPT e Codex pensato per attività professionali complesse: sviluppo software, analisi dati, ricerca online, creazione di documenti, fogli di calcolo e gestione di workflow multi-tool. Il rilascio è partito per gli utenti Plus, Pro, Business ed Enterprise in ChatGPT e Codex, mentre l’arrivo tramite API è previsto “molto presto”, secondo quanto comunicato dalla società il 23 aprile 2026.
La promessa è chiara: meno micro-management da parte dell’utente e più capacità del modello di interpretare l’obiettivo, pianificare i passaggi, usare strumenti, verificare l’output e proseguire anche davanti ad attività ambigue o poco strutturate. È un’evoluzione importante per chi usa l’AI non come semplice chatbot, ma come layer operativo dentro processi aziendali, tecnici e creativi.
Un modello più forte nel coding agentico
Il terreno su cui GPT-5.5 mostra il salto più evidente è il coding. OpenAI lo definisce il suo modello di agentic coding più potente finora. Nel benchmark Terminal-Bench 2.0, che misura workflow complessi da riga di comando con pianificazione, iterazione e coordinamento tra strumenti, GPT-5.5 raggiunge l’82,7% di accuratezza, contro il 75,1% di GPT-5.4. Su SWE-Bench Pro arriva invece al 58,6%, valutazione che riguarda la risoluzione di issue reali su GitHub.
Il dato più interessante, però, non è solo il punteggio. OpenAI sostiene che il modello migliori rispetto a GPT-5.4 usando meno token nelle attività Codex. Per team di sviluppo, startup SaaS e software house, questo significa potenzialmente meno iterazioni, minore costo operativo per task completato e una capacità più solida di mantenere contesto su codebase estese.
Dal codice al lavoro d’ufficio
Le stesse capacità che servono a correggere bug, eseguire test e ragionare su architetture software vengono applicate anche al knowledge work. In Codex, GPT-5.5 è descritto come più efficace di GPT-5.4 nella produzione di documenti, spreadsheet e presentazioni a partire da input incompleti o disordinati. In ChatGPT, la variante GPT-5.5 Thinking è orientata a ricerca, sintesi, analisi, scrittura e attività con molti documenti.
OpenAI cita anche casi interni: oltre l’85% dell’azienda usa Codex ogni settimana in funzioni come engineering, finance, marketing, comunicazione, data science e product management. In ambito finance, Codex è stato usato per revisionare 24.771 moduli fiscali K-1, pari a 71.637 pagine, con un workflow progettato per escludere informazioni personali.
Codex diventa un ambiente operativo
Il lancio di GPT-5.5 si innesta sugli aggiornamenti recenti di Codex. L’app ora può lavorare con più strumenti, gestire file, terminali, revisioni di pull request, devbox remote via SSH e anteprime avanzate di PDF, fogli di calcolo, presentazioni e documenti. OpenAI ha introdotto anche un browser integrato e oltre 90 plugin, inclusi strumenti come JIRA, CircleCI, GitLab Issues, Microsoft Suite e Render.
Un altro tassello è il computer use: Codex può operare sul computer dell’utente, vedere lo schermo, cliccare e digitare con un proprio cursore. Più agenti possono lavorare in parallelo su Mac, senza bloccare le altre attività dell’utente. Per ora alcune funzioni hanno limiti geografici e di disponibilità, soprattutto in UE e Regno Unito.
API, sicurezza e costo per le imprese
Sul fronte API, OpenAI prevede di rendere disponibile gpt-5.5 nelle Responses API e Chat Completions API a 5 dollari per milione di token in input e 30 dollari per milione di token in output. GPT-5.5 Pro arriverà con prezzi più alti: 30 dollari per milione di token in input e 180 dollari per milione di token in output.
La società insiste anche sulle misure di sicurezza, con test specifici su cybersecurity e biologia, red teaming interno ed esterno e controlli più stretti sulle richieste cyber ad alto rischio. Per il mercato enterprise, il messaggio è netto: GPT-5.5 non vuole essere solo un modello più intelligente, ma un agente capace di completare pezzi di lavoro reali. La differenza, per startup e aziende, si misurerà meno nelle demo e più nei workflow che riuscirà davvero a chiudere senza intervento continuo umano.



