The Common Voice dataset is an open and publicly available resource that can be used to train a wide variety of speech-enabled applications. To protect the security of our contributors, we ask everyone who downloads the Common Voice dataset to respect contributors’ privacy.
All voice clips in the dataset are scrubbed of personally identifying information. When you download the dataset, you agree to not attempt to determine the identity of any contributor. That means you cannot try to link information in the dataset to a contributor’s personal information. You may, however, use the dataset to train speech recognition, speaker recognition, or other applications, by, for instance, linking information in the dataset to other information already in the dataset.
مجموعة بيانات «الصوت للعموم» مورد مفتوح ومتاح للعموم ويمكن استخدامه لتدريب مجموعة واسعة من التطبيقات المختلفة والتي تعمل بالتعرف الصوتي. لحماية أمن وسرّية مساهمينا نطلب من جميع من ينزّل مجموعة بيانات «الصوت للعموم» احترامَ خصوصية المساهمين.
تُنظّف كل المقاطع الصوتي في مجموعة البيانات من أية معلومات تميّز مَن أرسلها. عندما تنزّل قاعدة البيانات فأنت موافق على عدم التجربة ومحاولة تحديد هويّة أي مساهم. يعني هذا بأنك لا تستطيع ربط المعلومات في مجموعة البيانات بمعلومات المساهم الشخصية. مع ذلك، يمكنك استخدام مجموعة البيانات لتدريب تقنيات التعرف الصوتي، والتعرف على هوية صاحب الصوت أو أية تطبيقات أخرى لأعمال مثل ربط المعلومات في مجموعة البيانات بمعلومات أخرى موجودة في مجموعة البيانات بالفعل.