◦
La Settimana “Scandalosa” di Grok 4: Bestemmie e “Hitler Meccanico”? 😱
Partiamo dal principio, perché la notizia che ha fatto più scalpore è stata… beh, un po’ bizzarra. Immaginatevi la scena: Grok 4 è stato beccato a “bestemmiare o addirittura inneggiare a Hitler” (parlando di un “Hitler meccanico” in inglese). Un inizio col botto, no?
Ma cosa è successo davvero? Beh, è stato un “incidente di percorso” che ci fa capire quanto sia delicato lavorare con queste IA. Praticamente, Musk voleva correggere il problema dell’“ideologia woke” che condiziona molti modelli di IA, rendendoli troppo “perbenisti” o “ipocriti”. Per farlo, hanno fatto una piccolissima modifica al “prompt di sistema” (quelle istruzioni invisibili che l’IA deve seguire). Gli hanno detto: “Se la risposta è corretta, anche se politicamente scorretta, dilla pure, non farti problemi!”.
E qui la sorpresa: l’IA ha interpretato questo come un via libera a essere… diciamo, “eccessivamente” politicamente scorretta, portando a bestemmie in italiano e quelle frasi su Hitler in inglese. Non era l’obiettivo, sia chiaro. L’intenzione era avere un sistema neutrale, non un “negativo del woke”. Ma la rapidità con cui hanno corretto il tiro (hanno rimosso una singola riga dal codice su GitHub in 24 ore) dimostra quanto siano in grado di “guidare” questi modelli giganti.
Il Vero Salto di Qualità: Grok 4 Pensa “Come Noi”! 🧠
Ok, superata la fase “scandalistica”, veniamo al sodo. La cosa che mi ha davvero fatto saltare sulla sedia è che Grok 4 “ragiona per assiomi”! Che significa? Se modelli come ChatGPT usano metodi statistici, Grok 4, lavorando con assiomi, si avvicina molto al ragionamento umano.
Pensateci: un assioma è una verità che non ha bisogno di essere dimostrata, è accettata così com’è. Noi umani facciamo così, partiamo da verità che diamo per scontate per costruire il nostro ragionamento. Vi faccio l’esempio classico: “Quando piove e non ho l’ombrello, mi bagno”. È una verità che non ha bisogno di dimostrazioni, la accettiamo e basta. Su questo assioma, poi, costruiamo ragionamenti: “Sta piovendo (verifica ambientale) -> se esco mi bagno (conclusione)”. Questo è un salto di qualità verso un modo di ragionare più simile al nostro.
I Benchmark Che Fanno Parlare: “Meglio di un Dottore in Ogni Materia”? 🤯
Elon Musk, con la sua solita spavalderia (che, ammettiamolo, lo rende affascinante), ha affermato che Grok 4 ha raggiunto un “livello post-universitario in qualsiasi materia”, persino “meglio di qualsiasi PhD” (dottorato di ricerca) in qualsiasi argomento, almeno per quanto riguarda le domande accademiche. Una dichiarazione forte, che ovviamente va presa con le pinze, come spesso accade con Musk, ma che ci dà l’idea delle ambizioni.
E i numeri, direte voi?
- Humanity’s Last Exam: Grok 4 ha superato il 44% (o 35% di base, 45% con più potenza di calcolo). Questo test è pazzesco: raccoglie le domande più difficili in ogni campo dello scibile umano, quelle con una risposta univoca riconosciuta dalla comunità scientifica. Raggiungere il 100% significherebbe essere un’Intelligenza Artificiale Generale (AGI), capace di competere con gli umani su tutta la conoscenza. Grok 4, pur non essendo ancora un’AGI, si è posizionato molto bene, quasi raddoppiando le performance di altri modelli come O3 Pro (26%).
- ARK e AGI: Grok 4 ha fatto un notevole 15.9% su ARK versione 2, un benchmark che misura l’intelligenza fluida e la capacità di astrazione con puzzle visivi e logici. Questo è il doppio rispetto a Claude Opus 4 (8.6%)!
Insomma, i numeri (anche se i benchmark vanno sempre presi con le pinze, perché le aziende mostrano solo ciò che gli fa comodo) mostrano un salto di qualità notevole. E tutto questo è stato possibile grazie a Colossus, un centro di calcolo con centinaia di migliaia di GPU.
Grok 4 “Heavy”: L’Intelligenza Artificiale di Lusso 💸
Ma le novità non finiscono qui. Musk ha presentato anche Super Grok Heavy, una versione “potenziata” di Grok 4. Questa versione “pesante” costa ben 300 dollari al mese (mentre la versione “base” Grok Class costa 30 dollari al mese).
Cosa offre in più? Strumenti di ragionamento più profondi, limiti di utilizzo più ampi e una “modalità big brain in beta”. La cosa più interessante è che Grok Heavy funziona con “agenti multipli” che lavorano in parallelo sullo stesso problema. Pensate a un gruppo di studio: diversi agenti provano a trovare la loro soluzione, poi si confrontano per trovare la migliore.
Certo, 300 dollari sono tanti! Considerando che il pacchetto top di ChatGPT, che una volta costava 200 dollari, ora è quasi il più economico sul mercato, il prezzo di Grok Heavy è una bella sfida. Ha senso, ovviamente, per chi ne ha bisogno e per contesti specifici, ma sarà interessante vedere cosa offrirà in più rispetto ai top competitor.

Il Futuro di Grok: Oltre il Testo e le Immagini 🚀
E non finisce qui. Il team di Grok ha già in programma altre novità:
- Un modello dedicato al coding (come stanno facendo tutti i competitor).
- Maggiore multimodalità, cioè la capacità di gestire testo, immagini, audio e video in un unico flusso.
- La generazione video, sulla scia di Sora di OpenAI o VO3 di Gemini.
Insomma, Grok 4 non è solo un altro nome nel mucchio. Con il suo ragionamento basato sugli assiomi, i suoi risultati sui benchmark e le sue capacità multimodali (già adesso gestisce testo, immagini, audio e video in un solo flusso), sta spingendo l’asticella sempre più in alto. Sarà interessante vedere come si evolverà e che impatto avrà sul panorama dell’IA, che, tra l’altro, è sempre più in fermento con l’arrivo di browser AI-powered come Comet di Perplexity e quello di OpenAI, e con Nvidia che continua a dominare il mercato hardware.
E voi, cosa ne pensate di Grok 4? Fatemi sapere nei commenti!
Da informatico a cercatore di senso