▾ G11 Media: | ChannelCity | ImpresaCity | SecurityOpenLab | Italian Channel Awards | Italian Project Awards | Italian Security Awards | ...
Homepage > Notizia

Dataocean AI ha partecipato alla creazione del set di dati open source GigaSpeech 2, un corpus ASR multidominio su grande scala per lingue con ridotte risorse

Dataocean AI ha collaborato con l’Università Jiao Tong di Shanghai, l’Università cinese di Hong Kong, l’Università di Tsinghua, il laboratorio di Pengcheng, AISpeech, Birch AI e Seasalt AI pe...

Autore: Business Wire

Pubblicato il: 25/09/2024

IRVINE, California: Dataocean AI ha collaborato con l’Università Jiao Tong di Shanghai, l’Università cinese di Hong Kong, l’Università di Tsinghua, il laboratorio di Pengcheng, AISpeech, Birch AI e Seasalt AI per sviluppare GigaSpeech 2, un’iniziativa coronata dal successo. I set di sviluppo e test di GigaSpeech 2 vengono etichettati da un’équipe di professionisti Dataocean AI.

Panoramica su GigaSpeech 2

GigaSpeech 2 è un corpus di riconoscimento del discorso multilingue e multidominio, su grande scala, in continua espansione, progettato per promuovere la ricerca e lo sviluppo nel riconoscimento del discorso in lingue a ridotte risorse. La versione grezza di GigaSpeech 2 contiene 30.000 ore di audio trascritto automaticamente per le lingue della Thailandia, dell’Indonesia e del Vietnam.

Fonte: Business Wire



Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con le notizie di BitCity.it iscriviti alla nostra Newsletter gratuita.

Tag:

Notizie che potrebbero interessarti: