Google Gemini AI non è altro che la nuova Intelligenza Artificiale lanciata dal colosso Google per contrastare i competitor in questo settore. Si tratta di un tool lanciato lo scorso dicembre che sembra garantire risposte superiori rispetto alla concorrenza e che in prospettiva potrebbe davvero rivoluzionare l’user experience sul web.
È un modello multimodale che offre una comprensione degli input mai conosciuta prima, specialmente quando viene interpellato per interpretare un elemento multimediale. Le reali capacità di Google Gemini sono ancora da scoprire del tutto, ma le premesse sono incoraggianti.
Cos’è Google Gemini e come agisce
Google Gemini AI è il nuovo strumento di Intelligenza Artificiale generativa che vuole sbarrare la strada a ChatGPT. Anzi, secondo Google Gemini avrebbe già sopravanzato il GPT-4 di OpenAI. A tal proposito è bene fare un passo indietro per capire la genesi del progetto.
Alcuni mesi prima del lancio del tool, Google aveva introdotto Bard, una sorta di prova di AI conversazionale per dare l’opportunità di sperimentare i modelli AI targati Google attraverso un’interfaccia semplice come quella di un chatbot.
Con l’avvento di Gemini Google ha sentito il bisogno di rinominare Bard, così che questo componente potesse rispecchiare adeguatamente la tecnologia di cui è portatore. Ecco allora che da febbraio 2024 il chatbot è stato ribattezzato Gemini.
All’interno dell’ombrello Gemini non è stato inglobato soltanto Bard, ma anche tutto il gruppo di tecnologie e tool basati sull’AI di Google. Infatti, con Gemini c’è stato una specie di rebranding più ampio che ha raggruppato Bard e altri prodotti, tra cui Duet AI che si è tramutato in Gemini Code Assist.
L’Intelligenza Artificiale di Google è dunque capace di comprendere svariate tipologie di input, tra cui testi, immagini, video e audio, senza dimenticare i codici e alcuni nuovi “sensi” che sarebbero in via di sviluppo.
La caratteristica principale di Google Gemini è il fatto di essere multimodale da zero. Ciò significa che il set di dati con il quale il tool è stato addestrato non si ferma al testo, ma racchiude altri media. Questo ha permesso una comprensione più completa e fluida poiché le altre AI agiscono soprattutto in termini testuali.
I primi test diffusi su Google Gemini sono sorprendenti e a questo si aggiungono gli esiti del test MMLU inerente al massive multitask language understanding. Per la prima volta un modello AI ha superato l’essere umano per quanto riguarda attività di conoscenza, comprensione e risoluzione dei problemi. L’AI di Google è stata testata su più di 50 materie, raggiungendo un punteggio dell’89,8% di risposte esatte.
Cosa può fare Google Gemini
Al di là degli usi più classici offerti da un chatbot, Gemini è già integrato in moltissimi servizi Google e può attingere a tutti i dati presenti sul web, sfruttandoli per dare risposta a qualunque richiesta dell’utente. Le opportunità sono tante e con l’arrivo di Gemini le potenzialità si amplificano notevolmente, mettendo nelle mani degli utenti un sistema capace di rispondere a qualsiasi desiderio. Ecco quali sono le ulteriori applicazioni possibili con Gemini.
- Comprensione della SEO: Google Gemini è un valido aiuto per migliorare il posizionamento su Google e può diventare un ottimo strumento per il lavoro dei copywriter e gli esperti SEO. In continuo collegamento con Google Search, il chatbot è ben addestrato sulla SEO e può dare una mano nel rendere i contenuti editoriali più appetibili. Gemini può aiutare a trovare keywords, analizzare i competitor e individuare spunti sui temi da trattare;
- Pianificare viaggi: tra le funzionalità di Gemini c’è anche quella per pianificare un itinerario di viaggio, tenendo conto di durata, budget e destinazione della vacanza. Quale che sia la meta, è importante specificare ogni dettaglio. Nel tempo le capacità dell’AI Google si affineranno e potrebbe anche costruire itinerari personalizzati secondo le preferenze dell’utente in relazione a recensioni, clima e altro;
- Imparare a programmare: le competenze di Gemini includono anche la programmazione, tanto che il chatbot AI è impiegato dagli ingegneri della multinazionale americana per le attività di debugging. Nello specifico, è utile per capire i concetti base della programmazione con differenti linguaggi quali Python, C++ e Java, nonché trovare soluzione a problemi di coding;
- Analizzare le immagini: Gemini può riconoscere i contenuti di un’immagine, compresi oggetti, testi e persone. L’AI di Google può essere usato per la trascrizione delle immagini, interpretando istantaneamente il testo presente nelle foto. Tale applicazione può risultare utile per ricerca, marketing e sicurezza;
- Scrivere testi creativi: con Gemini è possibile migliorare sintesi, chiarezza e fluidità dei testi scritti, ma per farlo deve comprendere lo scopo dell’autore per dare consigli in grado di ottimizzare lo stile di scrittura. Diversamente da ChatGPT, il tool di Google dà accesso libero ai dati di Internet e questo vuol dire che può pescare da un database più aggiornato e ad un ventaglio di fonti più ampio;
- Tradurre testi: Gemini riesce a tradurre testi in più di 100 lingue diverse, anche se la precisione può non essere ancora ai livelli di DeepL, altro strumento basato sull’AI. Ovviamente possono esserci delle lacune dovute a cattiva comprensione del contesto o ambiguità legate a termini gergali, ma il tool può rivelarsi un alleato per i compiti scolastici e molto altro.
Tre diverse dimensioni con Google Gemini
La famiglia di Google Gemini è altamente flessibile poiché riesce a funzionare con efficienza dappertutto, dai data center agli smartphone. Tutto questo è reso possibile per il fatto che il modello è ottimizzato per tre specifiche dimensioni:
- Gemini Ultra: questo è il modello AI più potente che riesce a svolgere compiti più complessi;
- Gemini Pro: è una versione che può essere impiegata per un elevato numero di attività ed è già presente su differenti prodotti Google;
- Gemini Nano: tale modello è adatto a compiti da eseguire su un singolo dispositivo. Questa AI è definita “on-device” e può essere installato su PC, cellulari e tablet senza occupare troppo spazio e consentendo l’uso dell’AI anche offline.
Come si può accedere a Google Gemini?
La web app di Gemini è quella che attualmente consente l’uso dell’AI di Google accessibile alla gran parte delle persone e dispositivi su iOS e Android. Oggi disponibile in oltre 40 lingue, incluso l’italiano, il tool dispone di una versione specifica di Gemini Pro.
Google ha anche diffuso un’app mobile di Google Gemini che installata sul cellulare andrà a sostituire l’Assistente Google come assistente principale dello smartphone. Invece Gemini Advanced propone un’esperienza diversa di chat, ideale soprattutto per le aziende in quanto dà accesso a Gemini 1.0 Ultra.
Google offre poi l’opportunità a clienti aziendali e sviluppatori di accedere a Gemini Pro attraverso l’API di Gemini su Google AI Studio oppure su Google Cloud Vertex AI. Per finire, Gemini Nano è disponibile per i proprietari degli smartphone Google Pixel 8 Pro e Pixel 8.