
Автор:
Ковальова Мирослава, слухачка секції «Інформаційно-телекомунікаційні системи та технології», учениця 10 класу комунального закладу «Ліцей «Науковий» Кропивницької міської ради».
Наукові керівники:
Ковальов Сергій, викладач кафедри вищої математики та фізики Центральноукраїнського національного технічного університету, кандидат педагогічних наук;
Волчанський Олег, вчитель фізики і астрономії комунального закладу «Ліцей «Науковий» Кропивницької міської ради», кандидат фізико-математичних наук.
НАВЧАННЯ ШТУЧНИХ НЕЙРОННИХ МЕРЕЖ РОЗПІЗНАВАННЯ ЗВУКІВ УКРАЇНСЬКОЇ МОВИ
У ході роботи було здійснено огляд наукової літератури з питань спектрального аналізу звуків та технологій розпізнавання мовлення. Виявлено, що процес розпізнавання є складним і багатофакторним. Людський мозок здатний ідентифікувати мовні звуки, незважаючи на індивідуальні варіації спектральних характеристик, завдяки складній системі обробки слухових сигналів, адаптації та класифікації мовних одиниць. Функціонування слухової системи можна розглядати як процес, подібний до роботи датчиків, де мозок обробляє дискретні сигнали. Це вказує на наявність суб’єктивної складової та необхідність врахування індивідуальних особливостей сприйняття звуку, що базується переважно на фонемах рідної мови.
Було проведено серію експериментів із розпізнавання окремих фонем української мови, у результаті яких виявлено певні закономірності. Візуальне розпізнавання патернів виявилося складним, але припускається, що аналіз спектрограм у координатах «гучність-частота» або застосування нейронних мереж може спростити цей процес. Також створено графічні зображення часових і частотних характеристик окремих звуків української абетки для чотирьох носіїв мови. Сформовано базу зображень для навчання нейронних мереж, орієнтовану на розпізнавання трьох фонем української мови на основі власного голосу: /і/ (26 зразків), /о/ (24 зразки) та /а/ (27 зразків). Перевірка ефективності розробленої бази даних для навчання моделей розпізнавання українського мовлення показала високі результати. Тестування із використанням нових зразків голосу для кожної з фонем /і/, /о/ та /а/ (по 15 зразків для кожної) дало 100% точність розпізнавання.
Ключові слова: спектральний аналіз, акустичні особливості, українська фонетика, нейронні мережі, обробка природної мови.