Показать сокращенную информацию

Колмогорова, Анастасия Владимировна
Калинин, Александр Андреевич
Маликова, Алина Вячеславовна
2021-08-13T09:30:36Z
2021-08-13T09:30:36Z
2019
Колмогорова, Анастасия Владимировна. Кто и о чем говорит в «радостных» и «грустных» текстах: в поисках дискриминантных черт текстов разных эмоциональных тональностей/ WHO AND ABOUT WHAT SPEAKS IN "CHEERFUL" AND "SAD" TEXTS: IN SEARCH OF DISCRIMINATION FEATURES IN TEXTS OF DIFFERENT EMOTIONAL TONALITIES [Текст] / Анастасия Владимировна Колмогорова, Александр Андреевич Калинин, Алина Вячеславовна Маликова // Известия Уральского федерального университета Гуманитарные науки/IZVESTIYA URALSKOGO FEDERALNOGO UNIVERSITETA-SERIYA 2-GUMANITARNYE NAUKI. — 2019. — Т. 21 (№ 4). — С. 219-234
https://journals.urfu.ru/index.php/Izvestia2/article/view/4311
https://elib.sfu-kras.ru/handle/2311/142499
Статья посвящена рассмотрению специфики лексической сочетаемости и синтаксической комбинаторики глагольной лексемы говорить в русскоязычных Интернет-текстах, принадлежащих различным эмоциональным классам. Целью публикации является обоснование валидности использования выявленных специфических характеристик сочетаемости и комбинаторики лексемы в качестве дискриминантных черт для автоматического определения 8 эмоциональных тональностей в Интернет-текстах на русском языке. В качестве материала исследования выступает коллекция текстов, отобранных из паблика «Подслушано» в социальной сети ВКонтакте Используя восьмичастную классификацию эмоций, предложенную Г. Левхеймом, авторы соотносят каждый из текстов выборки объемом более 1 млн. токенов с определенной эмоцией посредством опоры на соответствующие хештеги и эмоциональную разметку текстов, осуществленную 36 асессорами, носителями русского языка от 19 до 45 лет. Таким образом сформированы 8 эмоциональных подкорпусов текстов. Применение метода TF / IDF взвешивания, а также учет значений относительной частотности лексем в эмоциональных подкорпусах текстов показали, что статус лексемы говорить неравноценен в разных подкорпусах : в 4 из них она имеет высокие относительную частотность и показатели статистической специфичности, а в оставшихся 4 подкорпусах – нет. С помощью использования инструментов корпусной лингвистики доказано, что значимыми для автоматической атрибуции текстов к тому или иному эмоциональному классу оказываются следующие особенности лексической сочетаемости и синтаксической комбинаторики глагола говорить: высокий процент субъектных синтаксических связей; частотность конкретных лексем (например, врач для класса Страх / Ужас) и суммарная частотность лексем одной конкретной лексико-семантической группы в позиции субъекта при глаголе говорить; частотность отдельной коллокации (например, когда люди говорят для Злость / Гнев); частотность отдельных синтаксем (например, «с собой/ себе lemma [говорить]» – для Страдания / Тоска); частотность конкурирующих синтаксем «lemma [говорить], что» и «lemma [говорить]: (прямая речь)», маркирующая склонность автора текста фокусироваться на содержании говоримого в форме прямой или косвенной речи. Будучи применены в качестве параметров, подаваемых на вход компьютерному классификатору текстов, данные дискриминантные черты позволили повысить точность атрибуции текстов к тому или иному эмоциональному классу.
сентимент-анализ
эмоциональная тональность
Интернет-тексты
машинное обучение
лексическая сочетаемость
синтаксическая комбинаторика
дискриминантная черта класса текстов
Кто и о чем говорит в «радостных» и «грустных» текстах: в поисках дискриминантных черт текстов разных эмоциональных тональностей/ WHO AND ABOUT WHAT SPEAKS IN "CHEERFUL" AND "SAD" TEXTS: IN SEARCH OF DISCRIMINATION FEATURES IN TEXTS OF DIFFERENT EMOTIONAL TONALITIES
Journal Article
Journal Article Preprint
219-234
2021-08-13T09:30:36Z
10.15826/izv2.2019.21.4.078
Институт филологии и языковой коммуникации
Кафедра романских языков и прикладной лингвистики
Известия Уральского федерального университета Гуманитарные науки/IZVESTIYA URALSKOGO FEDERALNOGO UNIVERSITETA-SERIYA 2-GUMANITARNYE NAUKI
без квартиля


Файлы в этом документе

Thumbnail

Данный элемент включен в следующие коллекции

Показать сокращенную информацию