Показать сокращенную информацию
Topic Categorization Based on Collectives of TermWeighting Methods for Natural Language Call Routing
Автор | Sergienko, Roman B. | en |
Автор | Shan, Muhammad | en |
Автор | Minker, Wolfgang | en |
Автор | Semenkin, Eugene S. | en |
Автор | Сергиенко, Роман Б. | ru_RU |
Автор | Шан, Мухаммад | ru_RU |
Автор | Минкер, Вольфганг | ru_RU |
Автор | Семенкин, Евгений С. | ru_RU |
Дата внесения | 2016-05-24T04:49:10Z | |
Дата, когда ресурс стал доступен | 2016-05-24T04:49:10Z | |
Дата публикации | 2016-06 | |
URI (для ссылок/цитирований) | https://elib.sfu-kras.ru/handle/2311/20248 | |
Аннотация | Natural language call routing is an important data analysis problem which can be applied in different do- mains including airspace industry. This paper presents the investigation of collectives of term weighting methods for natural language call routing based on text classification. The main idea is that collectives of different term weighting methods can provide classification effectiveness improvement with the same classification algorithm. Seven different unsupervised and supervised term weighting methods were tested and compared with each other for classification with k-NN. After that different combinations of term weighting methods were formed as collectives. Two approaches for the handling of the collectives were considered: the meta-classifier based on the rule induction and the majority vote procedure. The nu- merical experiments have shown that the best result is provided with the vote of all seven different term weighting methods. This combination provides a significant increasing of classification effectiveness in comparison with the most effective term weighting methods | en |
Аннотация | Маршрутизация вызовов на естественном языке – актуальная задача анализа данных, которая может найти применение в различных областях, включая аэрокосмическую индустрию. В ста- тье представлено исследование коллективов методов взвешивания термов для машрутизации вызовов на естественном языке на основе классификации текста. Основная идея предлагаемого подхода заключается в том, что коллективы методов взвешивания термов могу обеспечить по- вышение эффективности классификации при использовании одного и того же алгоритма класси- фикации. Семь различных методов взвешивания термов были протестированы и сравнены между собой с использованием метода ближайших соседей в качестве алгоритма классификации. После этого были сформированы различные комбинации методов взвешивания термов для дальнейшего использования в коллективных решающих правилах. Рассмотрено два подхода для формирования коллективных решающих правил: мета-классификатор на основе индукции правил и голосование простым большинством. Численные исследования показали, что наилучший результат дости- гается при включении всех семи рассматриваемых методов взвешивания термов в коллективное решающее правило на основе голосования простым большинством. Такая комбинация обеспечи- вает статистически значимое улучшение эффективности классификации в сравнении с лучшим по эффективности отедльным методом взвешивания термов | ru_RU |
Язык | en | en |
Издатель | Сибирский федеральный университет. Siberian Federal University. | en |
Является частью серии | Журнал Сибирского федерального университета. Математика и физика. Journal of Siberian Federal University. Mathematics & Physics;2016 9 (2) | en |
Тема | natural language call routing | en |
Тема | text classification | en |
Тема | term weighting | en |
Тема | маршрутизация вызовов на естественном языке | ru_RU |
Тема | классификация текста | ru_RU |
Тема | взвешивание термов | ru_RU |
Название | Topic Categorization Based on Collectives of TermWeighting Methods for Natural Language Call Routing | en |
Альтернативное название | Определение темы для маршрутизации вызовов на естественном языке на основе коллективов методов взвешивания термов | ru_RU |
Тип | Journal Article | |
Тип | Published Journal Article | |
Контакты автора | Sergienko, Roman B.:Institute of Telecommunication Engineering Ulm University Albert-Einstein-Allee, 43, Ulm, 89081 Germany; roman.sergienko@uni-ulm.de | en |
Контакты автора | Shan, Muhammad:Institute of Telecommunication Engineering Ulm University Albert-Einstein-Allee, 43, Ulm, 89081 Germany; muhammad.shan@uni-ulm.de | en |
Контакты автора | Minker, Wolfgang:Institute of Telecommunication Engineering Ulm University Albert-Einstein-Allee, 43, Ulm, 89081 Germany; wolfgang.minker@uni-ulm.de | en |
Контакты автора | Semenkin, Eugene S.:Informatics and Telecommunications Institute Siberian State Aerospace University Krasnoyarskiy Rabochiy, 31, Krasnoyarsk, 660037 Russia; eugenesemenkin@yandex.ru | en |
Контакты автора | Сергиенко, Роман Б.:Институт телекоммуникации и инжиниринга Университет Ульма Аллея Альберта Эйнштейна, 43, Ульм, 89081 Германия | ru_RU |
Контакты автора | Шан, Мухаммад:Институт телекоммуникации и инжиниринга Университет Ульма Аллея Альберта Эйнштейна, 43, Ульм, 89081 Германия | ru_RU |
Контакты автора | Минкер, Вольфганг:Институт телекоммуникации и инжиниринга Университет Ульма Аллея Альберта Эйнштейна, 43, Ульм, 89081 Германия | ru_RU |
Контакты автора | Семенкин, Евгений С.:Институт информатики и телекоммуникаций Сибирский государственный аэрокосмический университет Красноярский рабочий, 31, Красноярск, 660037 Россия | ru_RU |
Страницы | 235–245 |