Speech-based Emotion Recognition and Speaker Identification: Static vs. Dynamic Mode of Speech Representation
Скачать файл:
URI (для ссылок/цитирований):
https://elib.sfu-kras.ru/handle/2311/29999Автор:
Sidorov, Maxim
Minker, Wolfgang
Semenkin, Eugene S.
Сидоров, Максим
Минкер, Вольфганг
Семенкин, Евгений C.
Дата:
2016-12Журнал:
Журнал Сибирского федерального университета. Математика и физика. Journal of Siberian Federal University. Mathematics & Physics;2016 9 (4)Аннотация:
In this paper we present the performance of different machine learning algorithms for the problems of
speech-based Emotion Recognition (ER) and Speaker Identification (SI) in static and dynamic modes
of speech signal representation. We have used a multi-corporal, multi-language approach in the study.
3 databases for the problem of SI and 4 databases for the ER task of 3 different languages (German,
English and Japanese) have been used in our study to evaluate the models. More than 45 machine learning
algorithms were applied to these tasks in both modes and the results alongside discussion are presented
here В статье рассматривается применение различных алгоритмов машинного обучения для задач
распознавания эмоций и идентификации говорящего на основе речевых сигналов. Мы исследуем
статический и динамический режимы представления речевого сигнала. Для проведения числен-
ных экспериментов и апробации рассмотренных подходов мы использовали 7 баз данных на немец-
ком, английском и японском языках. Более 45 алгоритмов машинного обучения были применены
для решения указанных задач в двух режимах представления речевого сигнала. В статье пред-
ставлены результаты численных исследований и проведен их анализ
Коллекции:
Метаданные:
Показать полную информациюСвязанные материалы
Показаны похожие ресурсы по названию, автору или тематике.
-
Automated Recognition of Paralinguistic Signals in Spoken Dialogue Systems: Ways of Improvement
Sidorov, Maxim; Schmitt, Alexander; Semenkin, Eugene S.; Сидоров, Максим; Шмитт, Александр; Семенкин, Евгений C. (Сибирский федеральный университет. Siberian Federal University., 2015-05)The ability of artificial systems to recognize paralinguistic signals, such as emotions, depression, or openness, is useful in various applications. However, the performance of such recognizers is not yet perfect. In ... -
The Influence of Ancient Greek Judicial Speakers on Interpretation of Legal Norms
Nedil’ko, Yulia V.; Недилько, Ю.В. (Сибирский федеральный университет. Siberian Federal University., 2014-07)The article is devoted to the interpretation of law in ancient Greece. There was shown the influence of judicial speakers on perception of law orders sense. There was underlined the significance of legal norm interpretation ... -
О применимости рекуррентных нейронных сетей к задаче статистического моделирования русского языка
Кудинов, М.С.; Kudinov, Mikhail S. (Сибирский федеральный университет. Siberian Federal University, 2016-12)В статье представлены данные экспериментов по использованию рекуррентных нейронных сетей для языкового моделирования русского языка. Ранее уже была продемонстрирована невысокая эффективность стандартной архитектуры ... -
The visualization system of patrol squad coordinates with a voice user interface
Медведев, М. С.; Щуков, С. В. (2019-06)The relevance of the topic is down to the need of developing a remote control system for operational groups of security companies with support for radio data speech recognition and location visualization. The developed ... -
Characterization through Speech in Fiction and Literary Translation
Rodionova, Maria Yu.; Родионова, М.Ю. (Сибирский федеральный университет. Siberian Federal University, 2018-05)Speech portrait of a literary personage is important for characterizing the personality, for distinguishing them from other characters, for helping the reader to compare personages as well as for showing their inner life ...