Google Gemini: nasce l'Intelligenza Artificiale Multimodale
Google ha recentemente annunciato ed introdotto il suo modello di intelligenza artificiale più avanzato: Google Gemini è un modello multimodale, con capacità di comprensione degli input da fantascienza.
Infatti, riesce a interpretare una fonte multimediale, come ad esempio un video e punta a sbaragliare la concorrenza di ChatGPT. Anzi, stando a Google, Gemini ha già superato il GPT-4 sviluppato da OpenAI. La differenza principale rispetto agli altri è data appunto dal fatto che il set di dati con cui il tool è stato addestrato non si limita al testo, ma contiene anche altri media.
Sottoponendo Google Gemini al test MMLU (massive multitask language understanding), i risultati ottenuti sono spaventosi, ci dicono che per la prima volta nella storia un modello ha superato l’essere umano, oltre che GPT-4, in varie attività quali la comprensione, la conoscenza e la risoluzione di problemi. Con uno score complessivo dell’89,8% di risposte esatte su oltre 50 materie: dalla storia alla medicina, dalla matematica all’etica alla fisica e al diritto.
Come se non bastasse, questo innovativo modello di IA è capace di generare codici per siti e interfacce utente che si codificano dinamicamente e autonomamente. Cosa vuol dire? Che le pagine e i contenuti possono cambiano aspetto in tempo reale, in base alle necessità dell’utente che le visita.
Il sistema di offerta di Gemini è composto sostanzialmente da tre varianti: Gemini Ultra, il più grande della famiglia, utilizza 1,6 trilioni di parametri, garantendo la capacità di apprendere una vasta quantità di informazioni e generare risultati altamente accurati e creativi. Con i suoi 100 miliardi di parametri Gemini Pro, offre un ottimo equilibrio tra potenza e risorse, rendendolo ideale per una varietà di applicazioni. Gemini Nano, infine, con i suoi 10 miliardi di parametri, si presenta come una scelta più compatta e meno costosa, adatta a situazioni in cui la massima precisione potrebbe non essere essenziale.
Google ha effettuato test di sicurezza approfonditi per cercare di capire fin dove riesce ad arrivare Gemini, spingendolo a comportarsi in maniera scorretta e a esporre le proprie vulnerabilità.
E servirà un controllo puntuale e preciso per evitare problemi: a livello normativo, soprattutto in previsione dell’AI ACT, un regolamento che proverà a definire diritti e doveri di chi usa o sviluppa soluzioni di AI. Sono già stati stabiliti alcuni paletti importanti: il divieto di utilizzo dell’AI per il riconoscimento biometrico e la classificazione degli individui sulla base di dati sensibili, ma anche per riconoscere le emozioni o per valutare le persone in base a caratteristiche personali od orientamenti politici, religiosi e sessuali.
Leggi anche
Dove ci porta l’AI? Verso il “sorpasso”
Stando all'AI Index Report 2024 della Stanford University, il 2024 sarà un anno di rapidi progressi per l’AI generativa
La vera natura dell’odio online
Studio italiano pubblicato su "Nature", condotto su mezzo miliardo di messaggi, mette in dubbio la tossicità dei social e spiega l'origine della polarizzazione. Il tutto partendo da una strana legge formulata negli anni Novanta da un avvocato americano che in realtà voleva solo fare dell'ironia
Rivoluzione Digitale in Parlamento: L'AI entra in aula
L'intelligenza Artificiale sbarca a Montecitorio attraverso un progetto innovativo di Google Cloud per indicizzare i provvedimenti di Camera e Senato
Con Llama 3 Meta rilancia sull’AI con servizi su WhatsApp e Instagram
Zuckemberg ha lanciato l'intelligent assistant di Meta che integrerà l'intelligenza artificiale sulle sue piattaforme e rivoluzionerà le capacità di processione degli LLMs. Ma in Italia bisognerà aspettare