Google ha ufficializzato Gemini 1.0, il suo nuovo modello di intelligenza artificiale multimodale e offerto in 3 versioni differenti in base alla complessità dei compiti che dovrà svolgere e anche in base al dispositivo su cui sarà utilizzato.
Cosa significa che Gemini è Multimodale
Per Multimodale si intende un modello di deep learning capace di comprendere più modalità di input per elaborare le informazioni e generare una risposta.
Le modalità di input fino ad ora più analizzate dai modelli di intelligenza artificiale sono: immagini, testo, audio e video ma a giudicare dai primi video sembra che Gemini ad esempio riesca ad interagire con quanto registrato da una webcam in tempo reale.
Lo scopo quindi di un modello multimodale è quello di poter analizzare la informazioni che gli giungono da tutte queste fonti per arrivare ad una comprensione più completa del test a cui è sottoposto.
Attualmente Gemini 1.0 può ricevere input quali testo, audio, video e codice di programmazione.
3 versioni di Gemini
Le 3 varianti sono:
- Gemini Ultra, il più completo e potente pensato per ambiti di utilizzo complessi;
- Gemini Pro, capace di adattarsi ad un’ampia gamma di attività;
- Gemini Nano, il quale a sua volta si suddivide in Nano-1 e Nano-2, ovvero la variante maggiormente efficiente a disposizione per i dispositivi mobile.
Google Gemini VS Chat GPT
Dal risultato del test a cui si è sottoposto Google Gemini, denominato MMLU e volto specificatamente a valutare le capacità dei modelli IA, traspare come Gemini Ultra abbia superato i migliori modelli oggi disponibili ottenendo un punteggio del 90% nel test di combinazione tra 57 materie.
In quasi tutti i test Gemini Ultra è risultato superiore, seppur a volte con un margine risicato, rispetto a Chat GPT ovvero il modello IA di riferimento fino ad oggi realizzato da OpenAI.
Questa superiorità però la dice lunga anche di come sia avanti Chat GPT la cui ultima versione è arrivata ormai qualche mese fa.
Come provare Google Gemini
Gemini Pro verrà integrato all’interno del chatbot di Google Bard andando a sostituire Palm-2, e già da oggi è infatti disponibile in 170 Paesi (trovi la lista QUI) ma almeno per il momento solo in lingua inglese.
Per l’Europa, con le varie lingue di cui è composta, bisognerà attendere il prossimo futuro.