PORÓWNANIE ALGORYTMÓW OPTYMALIZACJI KLASYFIKATORA CZASOWEGO DO SYSTEMU ROZPOZNAWANIA MOWY

##plugins.themes.bootstrap3.article.main##

DOI

Yedilkhan Amirgaliyev

amir_ed@mail.ru

http://orcid.org/0000-0002-6528-0619
Kuanyshbay Kuanyshbay

darkhan.kuanyshbay@sdu.edu.kz

http://orcid.org/0000-0001-5952-8609
Aisultan Shoiynbek

aisultan.shoiynbek@sdu.edu.kz

http://orcid.org/0000-0002-9328-8300

Abstrakt

W artykule dokonano oceny i porównania wydajności trzech znanych algorytmów optymalizacyjnych (Adagrad, Adam, Momentum) w celu przyspieszenia treningu sieci neuronowej algorytmu CTC do rozpoznawania mowy. Dla algorytmów CTC wykorzystano rekurencyjną sieć neuronową, w szczególności LSTM, która jest efektywnym i często używanym modelem. Dane zostały pobrane z wydziału VCTK Uniwersytetu w Edynburgu. Wyniki algorytmów optymalizacyjnych zostały ocenione na podstawie wskaźników Label error i CTC loss.

Słowa kluczowe:

rekurencyjna sieć neuronowa, metody wyszukiwania, akustyka, język modelowania systemów

Bibliografia

##plugins.themes.bootstrap3.article.details##

Amirgaliyev, Y., Kuanyshbay, K., & Shoiynbek, A. (2019). PORÓWNANIE ALGORYTMÓW OPTYMALIZACJI KLASYFIKATORA CZASOWEGO DO SYSTEMU ROZPOZNAWANIA MOWY. Informatyka, Automatyka, Pomiary W Gospodarce I Ochronie Środowiska, 9(3), 54–57. https://doi.org/10.35784/iapgos.234