Anthropic ha appena pubblicato ufficialmente Claude Sonetto 4.5, e i risultati sono sbalorditivi.
A proposito, se si desidera utilizzare ChatGPT con Gemelli e altri modelli AI di punta a un prezzo estremamente ridotto, GPT globale offre un'esperienza integrata all-in-one.

Claude Sonnet 4.5 in cima alla classifica di SWE-bench Verified
Sul SWE-bench Verificato Claude Sonnet 4.5 ha vinto il test che valuta la capacità di programmazione nel mondo reale. #1 spot nel settore.
Ancora più folle? Può rimanere concentrato e lavorare ininterrottamente per oltre 30 ore di fila.
Sì, l'intelligenza artificiale ha appena aggiunto un altro vantaggio rispetto agli esseri umani.

Potenza di codifica ineguagliabile: costruire applicazioni come respirare
Per esempio, quando è stato incaricato di costruire un'app di chat simile a Slack o Teams, ha prodotto 11.000 righe di codice in una sola seduta. In confronto, i vecchi Claude Opus 4 e Codex potevano gestire solo circa 7 ore di lavoro prolungato.
Secondo l'Antropica, Sonetto di Claude 4.5 è ora il modello di codifica più potente al mondo - con enormi miglioramenti nella costruzione di agenti complessi, nelle operazioni al computer, nel ragionamento e nella matematica.

Su OSWorld, un benchmark progettato per testare le attività reali del computer, ha ottenuto un punteggio di 61.4%, ancora una volta al primo posto. Solo quattro mesi fa, Sonnet 4 era in testa con 42,2%, quindi il salto di prestazioni è sbalorditivo.

Nuove funzionalità e aggiornamenti degli strumenti di Claude Sonetto 4.5
Insieme al nuovo modello, Anthropic ha introdotto diversi aggiornamenti importanti:
- Supporto per i checkpoint è finalmente disponibile, consentendo di salvare i progressi e di tornare agli stati precedenti in qualsiasi momento.
- Informazioni sull'uso può ora essere interrogato direttamente all'interno di Claude Code, utilizzando il metodo
/uso. - Plugin nativo VS Code è disponibile, simile al plugin Codex di OpenAI.
- Codice Claude SDK è stato ufficialmente rinominato in Agente Claude SDK, migliorando le capacità di costruzione degli agenti.
- Interfaccia del terminale è stato notevolmente ridisegnato, consentendo agli utenti di visualizzare la cronologia delle sessioni precedenti e gli elenchi delle nuove funzioni in un colpo d'occhio all'avvio.

Anthropic ha anche aperto l'infrastruttura di base che utilizza per costruire Claude Code, denominata Agente Claude SDK.
La gestione della memoria per gli agenti durante le attività di lunga durata, la progettazione di sistemi di autorizzazione che bilanciano l'autonomia e il controllo dell'utente e il coordinamento di più subagenti per raggiungere gli obiettivi sono tutti aspetti impegnativi della costruzione e della progettazione di agenti di intelligenza artificiale.
Con il Agente Claude SDK, Ora potete sfruttare questa infrastruttura per creare i vostri prodotti.
Le prime reazioni degli utenti: Un rapporto di amore-odio
A partire da oggi, gli sviluppatori possono chiamare claude-sonnet-4-5 tramite l'API Claude. I prezzi sono invariati rispetto a Sonnet 4: $3/$15 per milione di gettoni.
I primi tester sono già impressionati:
Uno sviluppatore ha condiviso la propria esperienza subito dopo averla provata:
“Claude 4.5 Sonnet ha appena rifattorizzato la mia intera base di codice in un'unica operazione: 25 invocazioni di strumenti, oltre 3.000 nuove righe di codice e 12 file nuovi di zecca. Ha modularizzato tutto, ha abbattuto la struttura monolitica e ha ripulito il codice spaghetti. Il risultato non ha funzionato, ma è stato davvero elegante”. Questa recensione è un misto di amore e frustrazione.
Cursor ha dichiarato di aver osservato prestazioni di programmazione all'avanguardia con Claude Sonnet 4.5, in particolare con miglioramenti nella gestione di compiti di lunga durata. Questo spiega ulteriormente perché molti utenti Cursor scelgono Claude per affrontare i problemi più complessi.
Il noto recensore blogger di tecnologia Dan Shipper ha osservato che Claude 4.5 si sente più veloce, più controllabile e più stabile.

Sicurezza migliorata: L'allineamento più alto mai raggiunto
Le prestazioni sono una cosa, ma la sicurezza deve tenere il passo.
Claude Sonnet 4.5 è, secondo Anthropic, il modello all'avanguardia più allineato finora.
Grazie alle capacità potenziate di Claude, combinate con un rigoroso addestramento alla sicurezza, Anthropic ha ottenuto miglioramenti significativi nel comportamento del modello, riducendo tendenze come la sicofania, l'inganno, la ricerca di potere e l'incoraggiamento delle illusioni. Inoltre, Anthropic ha raggiunto importanti risultati nella difesa dagli attacchi di tipo prompt injection e nella minimizzazione degli errori di classificazione dei contenuti.

Claude Sonnet 4.5 Funzione sperimentale: Immagina con Claude
Allo stesso tempo, Anthropic ha lanciato una anteprima di ricerca temporanea chiamato Immaginate con Claude. In questa modalità, Claude genera il software in tempo reale: nessuna funzione o codice è pre-scritto. Tutto viene creato e regolato in modo interattivo sul posto.
Questa anteprima è disponibile solo per Claude Max abbonati nei prossimi 5 giorni.
Accedete qui:https://claude.ai/imagine/

Concorrenza di mercato e significato strategico di Claude Sonnet 4.5
Anthropic è attualmente valutata a $183 miliardi, con un fatturato annuo di $5 miliardi ad agosto, in gran parte alimentato dagli strumenti di codifica. Ma la concorrenza è agguerrita: OpenAI e Google Gemini sono in corsa per dominare il mercato degli sviluppatori.
In particolare, manca solo una settimana alla conferenza annuale degli sviluppatori di OpenAI. L'abbandono di Claude 4.5 da parte di Anthropic è una chiara mossa per fare pressione.
Il cofondatore e scienziato capo di Anthropic, Jared Kaplan, ha già lasciato intendere che una soluzione ancora più avanzata Modello Claude Opus sarà lanciato nel corso dell'anno.
Problemi passati e ripristino della fiducia degli utenti
Non è stato tutto liscio come l'olio. Negli ultimi due mesi, gli utenti hanno accusato la serie Claude di essere “scemata”. Molti hanno segnalato un netto calo della qualità del ragionamento, della codifica, della formattazione e dell'uso degli strumenti, persino gli abbonati a Max.
Anthropic ha ammesso la presenza di due bug indipendenti e ha ritirato l'aggiornamento Opus 4.1, negando motivi di riduzione dei costi. Ma senza risarcimenti o rimborsi, le reazioni si sono diffuse su GitHub e X, con alcuni utenti che sono passati a concorrenti come Codex.
Il rilascio di Claude Sonetto 4.5 è l'occasione per Anthropic di riconquistarli. Il successo dipenderà da come il modello si comporterà nell'uso reale nelle prossime settimane.

