Dopo l'annuncio della disponibilità generale del supporto all'IA generativa per Vertex AI, la piattaforma di modelli e applicazioni di machine learning e intelligenza artificiale, Google ha arricchito la sua offerta con quattro modelli per la generazione di immagini e codice e supporto chat multilingua.
Imagen, PaLM 2 for Chat, Codey e Chirp sono ora disponibili sulla piattaforma: le organizzazioni possono accedere alle API su Model Garden ed effettuare il design e il tuning dei prompt su Generative AI Studio.
Imagen consente di generare immagini e modificarne di esistenti tramite prompt testuali e permette anche di creare didascalie per grandi volumi di immagini. Un'altra feature molto importante del modello è la possibilità di effettuare un Q&A visivo, ovvero interagire e analizzare le singole immagini.
PaLM 2 for Chat è la seconda versione di PaLM con capacità di ragionamento e coding, usato anche in Bard, mentre Codey supporta la generazione e completamento del codice; infine, Chirp è l'ultima versione del modello speech-to-text di Google con supporto multilingua.
Google accelera l'innovazione
L'introduzione dei nuovi modelli sulla piattaforma, spiega Google, vuole facilitare l'accesso delle organizzazioni alle capacità dell'IA generativa per creare applicazioni production-ready a costi contenuti.
Le aziende non dovranno più preoccuparsi di mantenere un'infrastruttura adeguata per i carichi di lavoro dell'IA e potranno affidarsi a Vertex AI per trarre il massimo vantaggio dai propri dati, in tutta sicurezza.
Con Imagen gli utenti potranno creare immagini personalizzate e professionali per i brand in pochi minuti, migliorandole con un semplice input testuale.
PaLM 2, già in uso su Bard e Duet AI, consentirà alle organizzazioni di migliorare le proprie applicazioni di chat multi-turno quali gli assistenti virtuali per lo shopping o agenti del supporto clienti. Il modello può essere usato inoltre per analizzare grafici e individuare anomalie nei dati.
Con Codey gli sviluppatori potranno velocizzare il proprio lavoro automatizzando diversi task di programmazione. Codey non è solo in grado di generare e completare il codice, ma anche di aiutare gli sviluppatori durante il debugging o la stesura della documentazione, oltre a facilitare l'apprendimento di nuovi concetti.
Chirp supporta più di 100 lingue per realizzare la comunicazione con qualsiasi cliente, creando applicazioni di trascrizione e controllo vocale estremamente precise.
Google ha inoltre annunciato l'anteprima di Multimodal Embeddings API, una serie di API che consente alle imprese di combinare la potenza dei modelli presenti su Vertex AI coi dati proprietari per generare rappresentazioni di testi e immagini.
Ciò consente ai team di data science di eseguire più velocemente task quali la classificazione di immagini, la ricerca visiva e il suggerimento di contenuti simili.
L'ambizione di Google rimane quella di fornire alle imprese una piattaforma di servizi di IA completa, rendendo disponibili tutte le funzionalità necessarie a sviluppare applicazioni innovative.