16.01.2024 Mauro Morra

Google Gemini: nasce l'Intelligenza Artificiale Multimodale

Google ha recentemente annunciato ed introdotto il suo modello di intelligenza artificiale più avanzato: Google Gemini è un modello multimodale, con capacità di comprensione degli input da fantascienza.

Infatti, riesce a interpretare una fonte multimediale, come ad esempio un video e punta a sbaragliare la concorrenza di ChatGPT. Anzi, stando a Google, Gemini ha già superato il GPT-4 sviluppato da OpenAI. La differenza principale rispetto agli altri è data appunto dal fatto che il set di dati con cui il tool è stato addestrato non si limita al testo, ma contiene anche altri media.

Sottoponendo Google Gemini al test MMLU (massive multitask language understanding), i risultati ottenuti sono spaventosi, ci dicono che per la prima volta nella storia un modello ha superato l’essere umano, oltre che GPT-4, in varie attività quali la comprensione, la conoscenza e la risoluzione di problemi. Con uno score complessivo dell’89,8% di risposte esatte su oltre 50 materie: dalla storia alla medicina, dalla matematica all’etica alla fisica e al diritto.

Come se non bastasse, questo innovativo modello di IA è capace di generare codici per siti e interfacce utente che si codificano dinamicamente e autonomamente. Cosa vuol dire? Che le pagine e i contenuti possono cambiano aspetto in tempo reale, in base alle necessità dell’utente che le visita.
Il sistema di offerta di Gemini è composto sostanzialmente da tre varianti: Gemini Ultra, il più grande della famiglia, utilizza 1,6 trilioni di parametri, garantendo la capacità di apprendere una vasta quantità di informazioni e generare risultati altamente accurati e creativi. Con i suoi 100 miliardi di parametri Gemini Pro, offre un ottimo equilibrio tra potenza e risorse, rendendolo ideale per una varietà di applicazioni. Gemini Nano, infine, con i suoi 10 miliardi di parametri, si presenta come una scelta più compatta e meno costosa, adatta a situazioni in cui la massima precisione potrebbe non essere essenziale.

Google ha effettuato test di sicurezza approfonditi per cercare di capire fin dove riesce ad arrivare Gemini, spingendolo a comportarsi in maniera scorretta e a esporre le proprie vulnerabilità.

E servirà un controllo puntuale e preciso per evitare problemi: a livello normativo, soprattutto in previsione dell’AI ACT, un regolamento che proverà a definire diritti e doveri di chi usa o sviluppa soluzioni di AI. Sono già stati stabiliti alcuni paletti importanti: il divieto di utilizzo dell’AI per il riconoscimento biometrico e la classificazione degli individui sulla base di dati sensibili, ma anche per riconoscere le emozioni o per valutare le persone in base a caratteristiche personali od orientamenti politici, religiosi e sessuali.

Leggi anche

Dove ci porta l’AI? Verso il “sorpasso”

La vera natura dell’odio online

Rivoluzione Digitale in Parlamento: L'AI entra in aula

Con Llama 3 Meta rilancia sull’AI con servizi su WhatsApp e Instagram