Hai bisogno di una versione PDF dell’articolo per una lettura più comoda o per conservarne una copia? Clicca sul link sottostante per scaricare il PDF direttamente sul tuo dispositivo.
Scarica l’articolo in PDF (ITA)Do you need a PDF version of the article for easier reading or to keep a copy? Click the link below to download the PDF directly to your device.
Download Article as PDF (ENG)Potenza di calcolo e infrastrutture
Il settore dei data center sta vivendo un’espansione senza precedenti. Si stima che le aziende tecnologiche investiranno circa 1 trilione di dollari in nuovi data center nei prossimi cinque anni, in risposta a un aumento previsto del 21% nella creazione di dati nel 2024[4]. Negli Stati Uniti, i data center hanno assorbito il 4% dell’elettricità consumata nel 2022, con proiezioni che indicano un aumento al 6% entro il 2026[4]. Questo incremento è attribuibile all’adozione di configurazioni AI ad alta intensità energetica, che richiedono fino a sette volte più energia rispetto alle configurazioni tradizionali.
Le richieste di potenza sono aumentate esponenzialmente: ad esempio, in Italia, la potenza richiesta dai data center è passata da 50 MW nel 2013 a 1,82 GW nel 2022, con un incremento di oltre il 1080%[6]. Questo trend evidenzia la necessità di investimenti massicci non solo in hardware, ma anche in fonti energetiche sostenibili per alimentare queste strutture sempre più grandi.
La sfida dei dati per l’addestramento AI
La disponibilità di dati per l’addestramento dei modelli AI è un’altra questione cruciale. Con l’aumento delle applicazioni AI, i dataset attuali sembrano esaurirsi. Le soluzioni proposte per affrontare questa crisi includono:
- Riutilizzo dei dataset esistenti in modi innovativi.
- Accesso a dati non pubblici attraverso accordi commerciali tra grandi aziende, per ampliare le fonti di dati disponibili.
- Generazione di dati sintetici tramite algoritmi AI, sebbene questa metodologia presenti limitazioni significative in termini di qualità e rappresentatività.
I dati sintetici, pur offrendo vantaggi come la scalabilità e la rapidità di generazione, possono risultare di bassa qualità se non prodotti con attenzione. La loro utilità è compromessa se non riescono a replicare le proprietà statistiche dei dati reali o se introducono bias[3][5].
Il progetto Strawberry di OpenAI
In questo contesto, il progetto Strawberry di OpenAI emerge come una potenziale soluzione innovativa. Secondo le informazioni trapelate, Strawberry è progettato per migliorare le capacità di ragionamento dei modelli AI, consentendo loro di pianificare autonomamente le ricerche su Internet, simile a come un essere umano potrebbe farlo. Questo approccio, definito “deep research”, mira a rendere i modelli AI più flessibili e capaci di generare risposte più accurate e contestualizzate[1][2].
Strawberry potrebbe rappresentare una risposta alle limitazioni dei dati attuali, poiché si propone di migliorare l’efficacia dei modelli AI attraverso un uso più intelligente delle informazioni disponibili. Inoltre, il progetto è in fase di sviluppo e ha già dimostrato di ottenere punteggi superiori al 90% su benchmark matematici, suggerendo un potenziale significativo per affrontare problemi complessi[1].
Come funziona il progetto Strawberry di OpenAI
L’obiettivo principale è consentire ai modelli AI di pianificare autonomamente le ricerche su Internet, in modo simile a come farebbe un essere umano.Questa nuova funzionalità, definita da OpenAI come “deep research“, prevede l’utilizzo di un “computer-using agent” (CUA) in grado di navigare in modo affidabile sul web per eseguire ricerche approfondite.
In questo modo, i modelli AI non si limiterebbero a generare risposte alle domande degli utenti, ma pianificherebbero in anticipo le ricerche successive per fornire risultati più accurati e contestualizzati.Secondo alcune fonti, il progetto Strawberry sarebbe una evoluzione di un precedente progetto top secret di OpenAI chiamato Q*.
Questo modello AI avrebbe già dimostrato di poter ottenere punteggi superiori al 90% su benchmark matematici complessi, suggerendo un potenziale significativo per affrontare problemi scientifici e matematici avanzati.Inoltre, durante una recente riunione interna, OpenAI avrebbe mostrato ai dipendenti una demo di un nuovo progetto di ricerca dotato di capacità di ragionamento simili a quelle umane, sebbene non sia stato confermato se si trattasse specificamente di Strawberry.
In sintesi, il progetto Strawberry mira a rendere i modelli AI più flessibili e capaci di generare risposte più accurate attraverso l’utilizzo di un CUA in grado di condurre ricerche approfondite su Internet. Questo approccio innovativo potrebbe rappresentare un passo avanti significativo verso lo sviluppo di una intelligenza artificiale generale (AGI) in grado di ragionare in modo simile agli esseri umani.
Come si differenzia Strawberry dagli altri progetti di intelligenza artificiale di OpenAI
Il progetto Strawberry di OpenAI si differenzia significativamente dagli altri modelli di intelligenza artificiale sviluppati dall’azienda, come ChatGPT e DALL-E, per diverse ragioni chiave.
Capacità di Ragionamento Avanzato
A differenza dei modelli precedenti, Strawberry è progettato per pianificare autonomamente le ricerche su Internet e condurre quella che OpenAI definisce “deep research”. Questo approccio consente al modello di non limitarsi a generare risposte basate su conoscenze preesistenti, ma di formulare query complesse e sintetizzare informazioni da più fonti per trarre conclusioni logiche.
Autonomia nella Navigazione
Strawberry si distingue per la sua capacità di cercare attivamente informazioni online, il che rappresenta un’evoluzione rispetto ai modelli attuali che operano principalmente su dati di addestramento statici. Questa autonomia nella navigazione consente al modello di affrontare compiti complessi e di gestire attività che richiedono un ragionamento più profondo, avvicinandosi a un’intelligenza artificiale generale (AGI) che può operare in modo simile a un essere umano.
Evoluzione da Q*
Strawberry è considerato un’evoluzione di un progetto precedente noto come Q*, che aveva già mostrato potenzialità significative nel risolvere problemi matematici complessi e nel rispondere a quesiti scientifici difficili. Mentre Q* era più focalizzato su compiti specifici, Strawberry amplia queste capacità permettendo una maggiore flessibilità e un approccio più integrato alla ricerca e al ragionamento.
Obiettivi di Sviluppo
OpenAI ha dichiarato che l’obiettivo di Strawberry è quello di migliorare le capacità di ragionamento dei modelli di AI, consentendo loro di “vedere e comprendere il mondo” in modo più simile agli esseri umani. Questa ambizione si traduce in un modello che non solo genera testo, ma è anche in grado di eseguire analisi approfondite post-addestramento per fornire risposte più pertinenti e contestualizzate.In sintesi, Strawberry rappresenta un passo avanti significativo nel campo dell’intelligenza artificiale, puntando a superare le limitazioni dei modelli precedenti attraverso un approccio più autonomo e avanzato nel ragionamento e nella ricerca.
Conclusioni
La corsa all’ottimizzazione delle piattaforme AI è caratterizzata da sfide significative legate alla potenza di calcolo e alla disponibilità di dati. Mentre le aziende investono enormemente in infrastrutture per sostenere la crescente domanda, il progetto Strawberry di OpenAI offre una prospettiva interessante per affrontare le limitazioni dei dati attuali. La combinazione di hardware avanzato, accesso a dati non pubblici e innovazioni come i dati sintetici potrebbe fornire un panorama più sostenibile e produttivo per il futuro dell’intelligenza artificiale.
Citations:
[1] https://www.geopop.it/openai-al-lavoro-su-strawberry-lintelligenza-artificiale-che-ragiona-come-un-umano/
[2] https://www.repubblica.it/tecnologia/2024/07/16/news/il_nuovo_progetto_di_openai_strawberry_lintelligenza_artificiale_che_ragiona_come_un_essere_umano-423397625/
[3] https://www.agendadigitale.eu/sicurezza/dati-sintetici-come-migliorare-laddestramento-ai-e-affrontare-le-sfide-normative/
[4] https://www.janushenderson.com/it-it/investor/article/data-center-boom-navigating-the-power-crunch/
[5] https://it.shaip.com/blog/synthetic-data-uses-risk-applications/
[6] https://www.econopoly.ilsole24ore.com/2024/06/04/data-center-ai-generativa-energia-potenza-tariffe/
[7] https://www.mordorintelligence.it/industry-reports/ai-computing-hardware-market/market-size
[8] https://www.insic.it/edilizia-e-progettazione/decreto-infrastrutture-2024-tutte-le-misure-ed-i-finanziamenti-per-le-opere-pubbliche/
Video in Italiano
L’Era dei Big Data e dell’AI: Sfide e Opportunità – FAQ
Le aziende tecnologiche investono massicciamente in nuove infrastrutture, come data center più grandi ed efficienti, e nello sviluppo di hardware specializzato per l’IA.
- Riutilizzo dei dataset esistenti in modi innovativi.
- Accordi tra aziende per l’accesso a dati privati, ampliando le fonti disponibili.
- Generazione di dati sintetici tramite algoritmi AI, pur con i limiti di qualità e rappresentatività.
I dati sintetici sono creati artificialmente da algoritmi per mimare i dati reali. Pur essendo utili per aumentare i dataset, possono essere di bassa qualità se non prodotti con attenzione. I limiti principali sono:
- Mancata replica accurata delle proprietà statistiche dei dati reali.
- Possibile introduzione di bias se gli algoritmi che li generano non sono imparziali.
Strawberry è un progetto di OpenAI che mira a migliorare le capacità di ragionamento dei modelli AI. Invece di basarsi solo su dataset esistenti, Strawberry punta a insegnare alle AI a “fare ricerca” autonomamente su internet, similarmente agli umani. Questo approccio, definito “deep research”, potrebbe rendere i modelli AI più flessibili e capaci di generare risposte più accurate e contestualizzate, sfruttando al meglio le informazioni disponibili online.
La combinazione di hardware avanzato, accesso a più dati e innovazioni come Strawberry e i dati sintetici potrebbe portare a un panorama AI più sostenibile e produttivo. Tuttavia, restano aperte questioni etiche sull’utilizzo dei dati, la sostenibilità ambientale e il potenziale impatto sul mondo del lavoro.
Video in Inglese
Argomenti Correlati Umanesimo Digitale ed Intelligenza Artificiale
Da informatico a cercatore di senso