ПІДВИЩЕННЯ ІНФОРМАТИВНОСТІ ОСНОВНОГО ТОНУ ДЛЯ РОЗПІЗНАВАННІ МОВЦІВ ЗГОРТАЛЬНИМИ НЕЙРОМЕРЕЖАМИ
Ключові слова:
автоматизована система розпізнавання мовців критичного застосування, розпізнавання образів, цифрова обробка сигналів, сингулярний аналіз, згортальна нейромережа, вейвлет-перетворенняАнотація
У статті автори розробили метод і алгоритм виділення основного тону мовця із мовного сигналу, який використовує дані вейвлет-перетворення мовного сигналу та його сингулярного аналізу, що дозволяє довільно масштабувати представлення сигналу у частотній області і підвищує достовірність виділення основного тону у випадку присутності шумів у мовному сигналі і використанні для розпізнавання мовця загортальної нейромережі.
Посилання
Биков М. М., Ковтун В. В. Аналіз ефективності ідентифікації мовця за частотою основного тону // Вісник Хмельницького національного університету. – 2004. – № 2. – Ч. 1. – Т. 2(60). – С. 20-23.
Рабинер Л., Шафер Р. Цифровая обработка речевых сигналов. – М.: Радио и связь, 1981.– 496 с.
Новиков Л.В. Основы вейвлет-анализа сигналов. Учебное пособие. – СПб: ООО "МОДУС+", 1999. – 152 с.
Голяндина Н. Э. Метод “Гусеница”-SSA: Аналіз временных рядов: учеб. пособие / Н. Э. Голяндина. – СПб: Изд-во СПбГУ, 2004. – 76 с.
CS231n: Convolutional Neural Networks for Visual Recognition [Електронний ресурс] – Режим доступу: http://cs231n.github.io/convolutional-networks/
Caffe | Deep Learning Framework [Електронний ресурс] – Режим доступу: http://caffe.berkeleyvision.org/.
An overview of gradient descent optimization algorithms [Електронний ресурс] – Режим доступу: http://sebastianruder.com/optimizing-gradient-descent/.
NOIZEUS: Noisy speech corpus – Univ. Texas-Dallas [Електронний ресурс] – Режим доступу: http://ecs.utdallas.edu/loizou/speech/noizeus/.
REFERENCES
Bykov M. M., Kovtun V. V. Analiz efektyvnosti identyfikatsiyi movtsya za chastotoyu osnovnoho tonu // Visnyk Khmelnytskoho natsionalʹnoho universytetu. – 2004. – № 2. – CH. 1. – T. 2(60). – S. 20-23.
Rabyner L., Shafer R. Tsyfrovaya obrabotka rechevykh syhnalov.– M.: Radyo y svyaz, 1981.– 496 s.
Novykov L. V. Osnovy veyvlet-analyza syhnalov. Uchebnoe posobye. – SPb: OOO "MODUS+", 1999. – 152 s.
Holyandyna N. É. Metod “Husenytsa”-SSA: Analiz vremennykh ryadov: ucheb. posobye / N. É. Holyandyna. – SPb: Yzd-vo SPbHU, 2004. – 76 s.
CS231n: Convolutional Neural Networks for Visual Recognition [Електронний ресурс] – Режим доступу: http://cs231n.github.io/convolutional-networks/
Caffe | Deep Learning Framework [Електронний ресурс] – Режим доступу: http://caffe.berkeleyvision.org/.
An overview of gradient descent optimization algorithms [Електронний ресурс] – Режим доступу: http://sebastianruder.com/optimizing-gradient-descent/.
NOIZEUS: Noisy speech corpus – Univ. Texas-Dallas [Електронний ресурс] – Режим доступу: http://ecs.utdallas.edu/loizou/speech/noizeus/.
##submission.downloads##
-
PDF
Завантажень: 172
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).