ПІДВИЩЕННЯ ІНФОРМАТИВНОСТІ ОСНОВНОГО ТОНУ ДЛЯ РОЗПІЗНАВАННІ МОВЦІВ ЗГОРТАЛЬНИМИ НЕЙРОМЕРЕЖАМИ

  • МИКОЛА МАКСИМОВИЧ БИКОВ Вінницький національний технічний університет
  • ВАСИЛЬОВИЧ В’ЯЧЕСЛАВ КОВТУН Вінницький національний технічний університет
Ключові слова: автоматизована система розпізнавання мовців критичного застосування, розпізнавання образів, цифрова обробка сигналів, сингулярний аналіз, згортальна нейромережа, вейвлет-перетворення

Анотація

У статті автори розробили метод і алгоритм виділення основного тону мовця із мовного сигналу, який використовує дані вейвлет-перетворення мовного сигналу та його сингулярного аналізу, що дозволяє довільно масштабувати представлення сигналу у частотній області і підвищує достовірність виділення основного тону у випадку присутності шумів у мовному сигналі і використанні для розпізнавання мовця загортальної нейромережі.

Біографії авторів

МИКОЛА МАКСИМОВИЧ БИКОВ, Вінницький національний технічний університет

к.т.н., доцент, професор кафедри комп’ютерних систем управління

ВАСИЛЬОВИЧ В’ЯЧЕСЛАВ КОВТУН, Вінницький національний технічний університет

к.т.н., доцент, доцент кафедри комп’ютерних систем управління

Посилання

Биков М. М., Ковтун В. В. Аналіз ефективності ідентифікації мовця за частотою основного тону // Вісник Хмельницького національного університету. – 2004. – № 2. – Ч. 1. – Т. 2(60). – С. 20-23.

Рабинер Л., Шафер Р. Цифровая обработка речевых сигналов. – М.: Радио и связь, 1981.– 496 с.

Новиков Л.В. Основы вейвлет-анализа сигналов. Учебное пособие. – СПб: ООО "МОДУС+", 1999. – 152 с.

Голяндина Н. Э. Метод “Гусеница”-SSA: Аналіз временных рядов: учеб. пособие / Н. Э. Голяндина. – СПб: Изд-во СПбГУ, 2004. – 76 с.

CS231n: Convolutional Neural Networks for Visual Recognition [Електронний ресурс] – Режим доступу: http://cs231n.github.io/convolutional-networks/

Caffe | Deep Learning Framework [Електронний ресурс] – Режим доступу: http://caffe.berkeleyvision.org/.

An overview of gradient descent optimization algorithms [Електронний ресурс] – Режим доступу: http://sebastianruder.com/optimizing-gradient-descent/.

NOIZEUS: Noisy speech corpus – Univ. Texas-Dallas [Електронний ресурс] – Режим доступу: http://ecs.utdallas.edu/loizou/speech/noizeus/.

REFERENCES

Bykov M. M., Kovtun V. V. Analiz efektyvnosti identyfikatsiyi movtsya za chastotoyu osnovnoho tonu // Visnyk Khmelnytskoho natsionalʹnoho universytetu. – 2004. – № 2. – CH. 1. – T. 2(60). – S. 20-23.

Rabyner L., Shafer R. Tsyfrovaya obrabotka rechevykh syhnalov.– M.: Radyo y svyaz, 1981.– 496 s.

Novykov L. V. Osnovy veyvlet-analyza syhnalov. Uchebnoe posobye. – SPb: OOO "MODUS+", 1999. – 152 s.

Holyandyna N. É. Metod “Husenytsa”-SSA: Analiz vremennykh ryadov: ucheb. posobye / N. É. Holyandyna. – SPb: Yzd-vo SPbHU, 2004. – 76 s.

CS231n: Convolutional Neural Networks for Visual Recognition [Електронний ресурс] – Режим доступу: http://cs231n.github.io/convolutional-networks/

Caffe | Deep Learning Framework [Електронний ресурс] – Режим доступу: http://caffe.berkeleyvision.org/.

An overview of gradient descent optimization algorithms [Електронний ресурс] – Режим доступу: http://sebastianruder.com/optimizing-gradient-descent/.

NOIZEUS: Noisy speech corpus – Univ. Texas-Dallas [Електронний ресурс] – Режим доступу: http://ecs.utdallas.edu/loizou/speech/noizeus/.

Опубліковано
2018-08-20
Як цитувати
[1]
М. БИКОВ і В. КОВТУН, ПІДВИЩЕННЯ ІНФОРМАТИВНОСТІ ОСНОВНОГО ТОНУ ДЛЯ РОЗПІЗНАВАННІ МОВЦІВ ЗГОРТАЛЬНИМИ НЕЙРОМЕРЕЖАМИ, ОЕІЕТ, vol 34, № 2, Сер 2018.
Розділ
Системи технічного зору і штучного інтелекту з обробкою та розпізнаванням зображень