Common Voice (la suite)

Il y a quelques mois, nous relayions l’appel de Mozilla pour contribuer au projet “Common Voice” : Êtes-vous prête à donner de votre voix ?

On peut désormais dire qu’avant cette initiative de Mozilla, la plupart des données vocales utilisées par les grandes entreprises étaient propriétaires. Le pari de la fondation était donc de mettre à disposition de tous et toutes, une base de données multilingues afin de faciliter la recherche, l’innovation en assistants vocaux ou bien encore de favoriser l’émergence de projets comme DeepSpeech, capables de convertir la parole avec une précision humaine et en direct.

Il y a quelques jours Mozilla annonçait dans cet article la mise à disposition du public du plus grand jeu de données humaines disponibles en 18 langues différentes : 1400 heures de données vocales enregistrées par plus de 42OOO contributeurs.trices !

Cette base de données (qui reste évidemment à enrichir) est désormais disponible en téléchargement sous la licence CC0 équivalente au Domaine Public (aucun droit réservé), c’est un bien commun.

Il nous faut continuer à contribuer ici. Quelques chiffres concernant la partie langue française : 79 heures d’enregistrements pour 1697 voix. Seulement 2% de ces voix sont féminines !

Encore un effort donc, et contribuons à faire connaître cette initiative, particulièrement auprès des femmes. Ça serait dommage que cette base de données ouverte reproduise des inégalités contre lesquelles on se bat au quotidien !

Pour marque-pages : Permaliens.

Les commentaires sont fermés.