Vedevo «GLM 5.2» ovunque—thread su Reddit, benchmark su X, perfino la chat del mio team—prima di fermarmi davvero a chiedermi cosa fosse. Così ho approfondito, ho letto la documentazione ufficiale e l'ho messo alla prova su lavoro reale. Ecco la versione breve: GLM 5.2 è l'ultimo large language model open-weight di Z.AI (ex Zhipu AI), pensato per il coding e i compiti agentici, con una finestra di contesto da 1M token. Qui sotto ti spiego cos'è davvero, in cosa è bravo e il modo più rapido per provarlo di persona.
Cos'è GLM 5.2?
GLM 5.2 è un large language model open-weight di frontiera della famiglia GLM («General Language Model»), rilasciato da Z.AI, il laboratorio di IA cinese precedentemente noto come Zhipu AI. È un modello testo-in, testo-out ottimizzato con decisione per coding, uso di strumenti e lavoro agentico a lungo orizzonte—quel tipo di compiti multi-step in cui un'IA deve pianificare, richiamare strumenti e restare in carreggiata per un'intera sessione lunga.
Il titolo che ha fatto rizzare le orecchie a tutti: GLM 5.2 è salito in cima alle classifiche dei modelli open-weight e ha iniziato a duellare con i modelli closed di frontiera di OpenAI e Anthropic—rilasciando però i suoi pesi pubblicamente. È quella combinazione (qualità da frontiera + pesi aperti) la ragione per cui cos'è GLM 5.2 è diventata una ricerca di tendenza praticamente da un giorno all'altro.
Le specifiche di GLM 5.2 in breve
La maggior parte degli articoli su «cos'è GLM 5.2» salta i numeri concreti, quindi ecco cosa riportano i documenti ufficiali di Z.AI:
| GLM 5.2 | |
|---|---|
| Produttore | Z.AI (ex Zhipu AI) |
| Tipo | LLM testuale open-weight |
| Finestra di contesto | ~1M token |
| Output massimo | ~128K token |
| Ragionamento | Più modalità di pensiero |
| Uso strumenti | Function calling + integrazione MCP |
| Formati di output | Streaming, JSON strutturato |
| Modalità | Testo in / testo out (non multimodale) |
| Pensato per | Coding, agenti, compiti a lungo orizzonte |
Una precisazione onesta: Z.AI non ha pubblicato un conteggio esatto dei parametri di GLM 5.2. Considera ogni numero specifico che trovi altrove come una stima e verifica le specifiche sulla documentazione ufficiale prima di costruirci sopra.
Cosa significa davvero «pesi aperti»
È la parte che manda in confusione, quindi lasciamela semplificare. Pesi aperti (open weights) significa che il file del modello addestrato—il «cervello» vero e proprio—è pubblicato, così puoi scaricarlo, eseguirlo sul tuo hardware e farne il fine-tuning. Non significa necessariamente che i dati o il codice di addestramento siano pubblici (quello sarebbe «open source» a tutti gli effetti).
Perché conta per GLM 5.2:
- Niente lock-in. Puoi fare self-hosting con strumenti come Ollama, Hugging Face o vLLM, oppure raggiungerlo tramite API—a tua scelta.
- Controllo dei dati. Eseguilo nel tuo ambiente quando le regole sulla privacy lo richiedono.
- È testabile gratis. Poiché i pesi sono aperti ed esistono piani gratuiti, alla domanda GLM 5.2 è gratis si risponde facile: sì, puoi provarlo a costo zero prima di pagare per l'accesso ospitato.
Per cosa è pensato GLM 5.2
GLM 5.2 è uno specialista, non un tuttofare. Il suo punto forte è il coding agentico.
- Coding — risultati solidi su benchmark di programmazione come FrontierSWE, SWE-bench Pro e Terminal-Bench 2.1. Genera, rifattorizza e fa debug su molti linguaggi.
- Agenti e uso di strumenti — function calling affidabile e integrazione MCP, così si inserisce nei loop degli agenti senza saltare passaggi.
- Compiti a lungo orizzonte — la finestra di contesto da ~1M token più un meccanismo di caching intelligente lo tengono concentrato lungo sessioni lunghe e multi-file.
Per renderlo concreto: gli ho dato in mano un repository di medie dimensioni e gli ho chiesto di rintracciare un bug su più file e proporre una correzione. Ha caricato l'intero codebase nel contesto, ha seguito la catena di chiamate senza che dovessi stargli dietro ed è tornato con una patch più una breve spiegazione del perché il bug si era verificato. Quel comportamento del «mantiene la lucidità lungo un compito esteso» è la vera ragione per cui la gente sta spostando i propri flussi di lavoro agentici verso di lui—i benchmark fanno piacere, ma è l'affidabilità sul tuo codice ciò che senti davvero giorno per giorno.
Cosa non è: GLM 5.2 è solo testo. Niente visione, niente audio, niente generazione di immagini. Se ti serve input multimodale, non è questo il modello—e se hai visto sostenere che GLM 5.2 è multimodale, la documentazione ufficiale dice il contrario.
Come si inserisce GLM 5.2 nella famiglia GLM
GLM 5.2 è un'iterazione della linea GLM 5.x—un passo avanti rispetto a GLM 5.1 su coding e affidabilità agentica, più che un'architettura completamente nuova. Se hai usato un GLM precedente, ti sentirai a casa: stessa famiglia, tool calling più affilato, contesto più ampio, maggiore costanza sui compiti lunghi. Per la maggior parte del lavoro di coding quotidiano, è la versione a cui ti rivolgeresti per impostazione predefinita. Se stai valutando un upgrade, la domanda pratica non è «è nuovo» ma «salta meno passaggi sui miei compiti più lunghi»—ed è lì che 5.2 prende il largo.
Il modo più rapido per provare GLM 5.2
Leggere le specifiche è una cosa—sentire come un modello gestisce il tuo prompt è un'altra. Il problema con un modello open-weight è che il modo «corretto» di eseguirlo di solito implica scaricare i pesi o configurare prima una chiave API, e la maggior parte delle persone si arena lì.
Puoi saltare tutto questo. glm5.app ti permette di chattare con GLM 5.2 direttamente nel browser—niente installazione, niente chiave, niente setup. Incolla un compito reale, osserva come programma o pianifica e decidi tu. È il modo più rapido per trasformare «cos'è GLM 5.2» in «ah, questo è ciò che fa».
Quando usare GLM 5.2 — e quando no
- Usalo se fai coding ad alto volume, costruisci agenti o ti serve una finestra di contesto enorme e la libertà di fare self-hosting. Per la maggior parte degli sviluppatori nel 2026 è un'ottima scelta predefinita.
- Lascialo perdere se ti serve input multimodale (immagini/audio) o stai affrontando i rompicapo di ragionamento più ardui, dove un top modello closed mantiene ancora un leggero vantaggio.
- Prova entrambi se puoi: indirizza il coding quotidiano a GLM 5.2 e riserva un modello closed premium per il raro 10% davvero difficile.
Domande frequenti
Chi ha creato GLM 5.2? Z.AI, il laboratorio di IA cinese precedentemente noto come Zhipu AI.
GLM 5.2 è open source? È open-weight—i pesi del modello sono pubblici, così puoi fare self-hosting e fine-tuning con Ollama, Hugging Face o vLLM. I dati/il codice di addestramento non sono necessariamente pubblicati: è questa la differenza tra «pesi aperti» e «open source» a tutti gli effetti.
GLM 5.2 è gratis? Puoi eseguire i pesi aperti da solo e usare i piani gratuiti per iniziare, quindi sì—puoi testarlo gratis prima di passare all'accesso API ospitato.
Qual è la finestra di contesto di GLM 5.2? Circa 1M token, con fino a ~128K token di output—solida per il lavoro su interi codebase e per i compiti agentici a lungo orizzonte.
GLM 5.2 è multimodale? No. Secondo la documentazione ufficiale è testo in, testo out—niente visione né audio.
Come provo GLM 5.2 senza setup? Chatta con lui gratis nel browser su glm5.app—niente chiave API, niente installazione.
In conclusione
Quindi, cos'è GLM 5.2? È l'LLM open-weight di Z.AI focalizzato su coding e agenti, con una finestra di contesto da 1M token—qualità di classe frontiera che puoi davvero eseguire a modo tuo. Non gestisce le immagini e non fa miracoli sul ragionamento più arduo, ma per il coding quotidiano e il lavoro agentico è una delle migliori opzioni aperte in circolazione.
Il modo migliore per capirlo è usarlo. Fai passare il tuo prompt attraverso di lui—niente chiavi, niente setup—proprio qui: prova GLM 5.2 gratis su glm5.app.


