Show simple item record

Sidorov, Maximen
Schmitt, Alexanderen
Semenkin, Eugene S.en
Сидоров, Максимru_RU
Шмитт, Александрru_RU
Семенкин, Евгений C.ru_RU
2015-05-29T03:11:14Z
2015-05-29T03:11:14Z
2015-05
https://elib.sfu-kras.ru/handle/2311/16808
The ability of artificial systems to recognize paralinguistic signals, such as emotions, depression, or openness, is useful in various applications. However, the performance of such recognizers is not yet perfect. In this study we consider several directions which can significantly improve the performance of such systems. Firstly, we propose building speaker- or gender-specific emotion models. Thus, an emotion recognition (ER) procedure is followed by a gender- or speaker-identifier. Speaker- or gender-specific information is used either for including into the feature vector directly, or for creating separate emotion recognition models for each gender or speaker. Secondly, a feature selection procedure is an important part of any classification problem; therefore, we proposed using a feature selection technique, based on a genetic algorithm or an information gain approach. Both methods result in higher performance than baseline methods without any feature selection algorithms. Finally, we suggest analysing not only audio signals, but also combined audio-visual cues. The early fusion method (or feature-based fusion) has been used in our investigations to combine different modalities into a multimodal approach. The results obtained show that the multimodal approach outperforms single modalities on the considered corpora. The suggested methods have been evaluated on a number of emotional databases of three languages (English, German and Japanese), in both acted and non-acted settings. The results of numerical experiments are also shown in the studyen
Способность искусственных систем распознавать паралингвистические характеристики говоря- щего, такие как эмоциональное состояние, наличие и степень депрессии, открытость человека, является полезной для широкого круга приложений. Однако производительность таких систем далека от идеальных значений. В этой статье мы предлагаем подходы, применение которых позволяет существенно улучшить производительность систем распознавания. В работе описы- вается метод построения адаптивных эмоциональных моделей, позволяющих использовать ха- рактеристики конкретного человека для построения точных моделей. В статье представлены алгоритмы выявления наиболее значимых характеристик речевых сигналов, позволяющие одно- временно максимизировать точность решения поставленной задачи и минимизировать количе- ство используемых характеристик сигнала. Наконец, предлагается использовать комбинирован- ные аудио визуальные сигналы в качестве входов для алгоритма машинного обучения. Указанные подходы были реализованы и проверены на 9 эмоциональных речевых корпусах. Результаты прове- денных экспериментов позволяют утверждать, что предложенные в статье подходы улучшают качество решения поставленных задач с точки зрения выбранных критериевru_RU
enen
Сибирский федеральный университет. Siberian Federal University.en
Журнал Сибирского федерального университета. Математика и физика. Journal of Siberian Federal University. Mathematics & Physics;2015 8 (2)en
recognition of paralinguistic signalsen
machine learning algorithmsen
speaker-adaptive emotion recognitionen
multimodal approachen
распознавание паралингвистических характеристикru_RU
алгоритмы машинного обученияru_RU
адаптивная процедура распознавания эмоцийru_RU
мультимодальностьru_RU
Automated Recognition of Paralinguistic Signals in Spoken Dialogue Systems: Ways of Improvementen
Автоматическое распознавание паралингвистических характеристик говорящего: способы улучшения качества классификацииru_RU
Journal Article
Published Journal Article
Sidorov, Maxim:Institute of Communications Engineering Ulm University Albert Einstein-Allee, 43, Ulm, 89081 Germany; maxim.sidorov@uniulm.deen
Schmitt, Alexander:Institute of Communications Engineering Ulm University Albert Einstein-Allee, 43, Ulm, 89081 Germany;alexander.schmitt@uniulm.deen
Semenkin, Eugene S.:Institute of Computer Science and Telecommunications Siberian State Aerospace University Krasnoyarskiy Rabochiy, 31, Krasnoyarsk, 660014 Russia; eugenesemenkin@yandex.ruen
Сидоров, Максим:maxim.sidorov@uniulm.deru_RU
Шмитт, Александр:alexander.schmitt@uniulm.deru_RU
Семенкин, Евгений C.:eugenesemenkin@yandex.ruru_RU
208–216


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record


DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV