17 May, 2024 - 14:45

Cos'è Project Astra e cosa sa fare la nuova intelligenza artificiale multimodale di Google

Cos'è Project Astra e cosa sa fare la nuova intelligenza artificiale multimodale di Google

Cos'è Project Astra?  Durante l'ultima conferenza annuale, Google ha presentato in anteprima il suo nuovo modello di intelligenza artificiale che verrà implementato su Gemini. 

Si tratta di una applicazione innovativa definita dagli stessi sviluppatori un vero e proprio "agente reattivo vedente e parlante avanzato. La particolarità di questo assistente digitale è infatti quella di avere capacità sensoriale e di riconoscimento del tutto simili a quelle umane.

Ecco quali sono le sue funzioni e come potrebbe rivoluzionare il campo delle intelligenze artificiali.

Cos'è Project Astra: come riconosce gli oggetti intorno a sé

Google ha presentato le principali funzioni  di Project Astra attraverso un video applicativo.

Innanzitutto Project Astra riesce a guardare e comprendere la natura degli oggetti che lo circondano. Per fare ciò si serve della camera dello smartphone sul quale è installato. In pochi istanti scannerizzare e riconosce ciò che la camera ha inquadrato e immediatamente elabora i dati in modo da rispondere ai quesiti dell'utente o dare le più precise informazioni di fruizione.

Ad una prima vista la grafica dell'interfaccia è davvero minimale e intuitiva. Il simbolo del mirino sullo schermo indicherà il punto in cui inquadrare perfettamente ciò che si vuole analizzare.

Cosa riesce a fare

Per capire cos'è Project Astra si può osservare il video di presentazione, dove l'utente si muove in un ufficio di lavoro permettendo così alla nuova intelligenza artificiale di familiarizzare con l'ambiente circostante. Il primo test è stato quello di chiedere all'assistente di individuare un oggetto capace di riprodurre suoni all'interno della stanza.

Quasi istantaneamente Project Astra fornisce subito un risultato esatto: un altoparlante posizionato su una scrivania accanto ad un monitor PC, accompagnando la risposta con una comunicazione vocale. 

A questo punto si è passati a mostrare una seconda funzione, ovvero la descrizione del funzionamento di uno specifico oggetto. L'utente intanto ha disegnato una freccia sul display dello smartphone indicando chiaramente una determinata componente dell'altoparlante audio. Project Astra ha subito capito che di cosa si trattasse e ha fornito esaustive indicazioni su come azionare il dispositivo.

La dimostrazione si sposta poi in ambito più lavorativo. L'utente inquadra una porzione di monitor sulla quale è stato elaborato un codice informatico. Il servizio di assistenza digitale non solo capisce che il testo alfanumerico è specifico di una attività di programmazione informatica ma fornisce anche spiegazioni approfondite.

È questa una delle principale applicazioni in campo aziendale. L'analisi dell'intelligenza artificiale può infatti diventare un valido strumento per accelerare le procedure di progettazione informatica e per controllare eventuali errori.

Come passo successivo l'utilizzatore nella dimostrazione direziona il dispositivo verso il panorama al di fuori della finestra. La app non solo riconosce chiaramente in quale città si trova ma addirittura mostra informazioni precise del quartiere.

L'utente ora dal nulla chiede al suo assistente se avesse visto il suo paio di occhiali poiché non riesce più a trovarli. Project Astra ha tenuto memoria delle ultime informazione acquisite attraverso la panoramica ambientale e in pochi istanti risponde sull'esatta ubicazione degli occhiali che si rivelano essere di tipo smart.

L'utilizzo su occhiali smart

Project Astra può essere supportato anche dai Ray-Ban smart di Meta. Guardando attraverso gli occhiali, l'intelligenza artificiale riesce a palesare le informazioni richieste direttamente davanti ai nostri occhi. Inoltre l'app vede esattamente ciò che vediamo noi e pertanto l'analisi è ancor più fluida ed istantanea.

Viene dunque mostrata la capacità della ia di individuare e risolvere problemi di calcolo, di logica o grafici. Arriva a capire cosa gli stiamo chiedendo se gli formuliamo una sorta di rebus oppure può distinguere la razza specifica del cane che poco dopo ci si palesa davanti.

L'azienda produttrice inoltre ha spiegato come tutto il video dimostrativo sia stato registrato senza pause. Ciò dimostra come Project Astra possa passare a rispondere a quesiti di argomenti completamente differenti in una frazione di secondo.

Quando sarà disponibile

Al momento Project Astra è ancora un prototipo. La sua presentazione dunque non implica un immediato rilascio sul mercato anche se i produttori sono convinti che tra non poco ogni utente potrà installarlo sul proprio dispositivo.

Demis Hassabis, attuale Ceo di Google DeepMind, ha spiegato come il progetto sia il frutto del desiderio di realizzare un assistente digitale che possa semplificare ogni attività quotidiana.

E di fatto Project Astra riesce a pensare in anticipo, elaborare risposte a quesiti complessi e pianificare strategie. In pratica può agire come agirebbe una persona vera.

La potenza di Project Astra risiede nella velocità di configurare i fotogrammi acquisiti. Il programma arriva quindi a combinare i dati foto e video con le richieste audio del suo fruitore. Traduce questi passaggi in una sequenza temporale di eventi e memorizza queste informazioni nella cache per un riutilizzo più efficiente.

Non basta però questa rapidità di elaborazione perché sia effettivamente utile nella vita di tutti i giorni. Per questo motivo Google ha incrementato le funzioni che permettono all'applicazione di essere proattiva e personalizzabile. Solo in questo modo infatti la comunicazione potrà essere fluida e naturale.

AUTORE
foto autore
Valentina Todaro
condividi sui social
condividi su facebook condividi su x condividi su linkedin condividi su whatsapp
adv
ARTICOLI RECENTI
LEGGI ANCHE