Common Voice: українська мова для сучасних технологій

FacebookMessengerTwitterLinkedInTelegramPinterestPocket
Read in Google News!

Гарна ініціатива для тих, хто хоче допомогти українській мові й зробити так, щоб її ширше використовували у сучасних технологіях. Mozilla створює бібліотеку голосів різних мов світу для використання в машинному навчанні та в сучасних алгоритмах аналізу мови, пишуть texty.org.ua.

Якщо до української частини цього проекту вдасться залучити достатню кількість добровольців, то мовою можуть заговорити комп’ютерні програми [“домашні працівники” тощо]. Тобто, буде вирішена проблема якісного синтезу голосу з написаного тексту.

Також цей проект потрібен для виконання зворотної задачі – перетворення голосових аудіо-записів на текст [для інтерв’ю, стенограм, автоматичного субтитрування тощо].

Є три напрямки роботи:

1. Переклад інтерфейсу для веб-сайту проекту (ця робота вже майже закінчена);
2. Переклад речень, які потрібно озвучити (наразі їх 1134 з 5000 потрібних)
3. Власне, озвучення (“начитка”) речень українською мовою.

Закликаємо наших читачів долучитися й допомогти створити українську частину проекту “Спільний голос”. Всі створені матеріали будуть зберігатися за відкритими ліцензіями.

Інструкція:
1. Для того, щоб додавати речення, які будуть озвучені, зайдіть за цим посиланням і залогіньтеся: https://common-voice.github.io/sentence-collector Після цього оберіть “українську” та почніть додавати або переглядати сентенції (речення), які поширюються за відкритою ліцензією. Наприклад, можна брати речення з розділу “Статті” з сайту “Тексти”.

2. Щоб долучитися до проекту в цілому, потрібно зайти на сторінку за цим посиланням: https://voice.mozilla.org/uk/languages), вибрати на сторінці розділ “В процесі”, та натиснути на кнопку “Долучитися”.

Читай у Google News!