Durante la conferenza AWS re:Invent, Amazon Web Services ha annunciato otto nuove funzioni per il servizio di machine learning end-to-end SageMaker. Questo tool è utilizzato da sviluppatori, data scientist e analisti aziendali per creare, addestrare e distribuire modelli di machine learning in modo rapido e semplice utilizzando infrastruttura, strumenti e flussi di lavoro completamente gestiti.
L’annuncio include nuove funzioni di gestione che forniscono visibilità sulle prestazioni dei modelli durante l'intero ciclo di vita; Studio Notebook consente ai clienti di ispezionare e risolvere i problemi di qualità dei dati in pochi clic, facilita la collaborazione in tempo reale tra i team di data science e velocizza il passaggio dalla sperimentazione alla produzione convertendo il codice del notebook in processi automatizzati.
Infine, sono state introdotte anche funzioni per automatizzare la convalida dei modelli e semplificare il lavoro con i dati geospaziali.
Bratin Saha, Vice President of Artificial Intelligence and Machine Learning di AWS, ha dichiarato: “Le nuove funzioni di Amazon SageMaker annunciate oggi rendono ancora più facile per i team accelerare lo sviluppo end-to-end e la distribuzione di modelli ML”.
Database e Analytics
SageMaker non è l’unico prodotto dell’azienda ad aver ricevuto aggiornamenti importanti: Aws ha infatti annunciato cinque novità importanti nel portfolio di prodotti Aws for data che rendono più veloce e semplice per i clienti gestire e analizzare i dati.
Nuove funzioni sono inserite in Amazon DocumentDB (compatibile con MongoDB), OpenSearch Service e Athena; semplificano l'esecuzione di carichi di lavoro di database e analisi ad alte prestazioni su larga scala.
Inoltre, Aws ha annunciato una novità per AWS Glue per gestire automaticamente la data quality tra data lake e pipeline. Infine, Amazon Redshift supporta ora una configurazione high availability estesa a più Aws Availability zones.
L'annuncio di oggi aiuta i clienti a ottenere il massimo dai loro dati su Aws, consentendo loro di accedere agli strumenti giusti per i loro workload basati sui dati, operare su larga scala e aumentare l’availabillity.