Google ha scelto il palco del Women in ML Symposium per presentare Simple ML for Sheets, un componente aggiuntivo beta per Fogli Google che mira a rendere l'apprendimento automatico accessibile a chiunque, anche senza esperienza di programmazione o ML.
Simple ML permette di sperimentare e applicare il machine learning ai dati contenuti in Fogli Google con pochi clic, rendendolo utile per diverse figure professionali, come proprietari di piccole imprese, ricercatori, studenti, analisti aziendali di grandi aziende e chiunque abbia familiarità con Fogli Google.
Simple ML for Sheets è distribuito come add-on in versione beta ed è pensato per rendere l'apprendimento automatico accessibile a chiunque, indipendentemente dalle precedenti conoscenze di machine learning o programmazione.
Offre modelli ML pre addestrati e funzioni no code per supportare due attività principali di machine learning: la previsione dei valori mancanti e l'identificazione dei valori anomali. Tuttavia, può anche essere utilizzato per casi d'uso più avanzati come la formazione, la valutazione e l'analisi dei modelli ML.
Machine learning semplice
Simple ML for Sheets è stato progettato per essere facile da usare per tutti gli utenti di Fogli Google, ma può essere sfruttato anche da data scientist e utenti più avanzati per eseguire previsioni avanzate.
Per prevedere i valori mancanti, Simple ML esegue il training di un modello basandosi sui valori forniti in un set di dati. Per identificare valori anomali, Simple ML addestra un set di modelli con convalida incrociata per prevedere i valori attualmente presenti.
Quindi, in base alle differenze tra i dati effettivi e i dati previsti, Simple ML identificherà parti anomale del set di dati e fornirà un punteggio di probabilità di anomalia compreso tra 0% e 100%. Gli utenti possono quindi rivedere il modello generato da ML e utilizzarlo come guida per eventuali modifiche che devono apportare al proprio set di dati.
Simple ML è può essere utile anche per gli utenti di Google BigQuery, poiché è in grado di analizzare i dati nelle istanze di questo data warehouse cloud. Inoltre, il componente è abbastanza veloce da gestire set di dati di grandi dimensioni, consentendo agli utenti di eseguire modelli per milioni di linee di dati senza query SQL.
Tuttavia, come nel caso di molti strumenti scalabili, potrebbero sorgere problemi con dati molto corposi. Ad esempio, set di dati grandi possono richiedere più minuti anziché pochi secondi per il training di un modello o la generazione di stime.
Il tempo di elaborazione cresce ulteriormente nel caso di set di dati che contengono testo o altre informazioni non strutturate.