Топиковая зависимость в тематически близких текстах в контексте автоматического анализа оценочной составляющей
Скачать файл:
URI (для ссылок/цитирований):
https://elib.sfu-kras.ru/handle/2311/1809Автор:
Реффин, Д.
Reffin, Jeremy
Загибалов, Т.Е.
Zagibalov, Taras E.
Беляцкая, Е.О.
Belyatskaya, Ekaterina O.
Дата:
2010-10Аннотация:
Sentiment analysis (or opinion mining) is concerned not with the topic of a document, or its factual
content, but rather with the opinion expressed in a document. In this paper we present a number of
experiments on a word-based sentiment analysis on two corpora representing two related domains:
film reviews and book reviews. We find that even close domains are very difficult to process without
utilising in-domain data. We also indicate certain characteristics of features that affect cross-domain
performance of sentiment classifiers. Анализ оценочной составляющей направлен не на анализ тематического или содержательного
контента, а на анализ содержащихся в тексте оценок и субъективных высказываний. В
настоящей публикации мы представляем результаты экспериментов по автоматическому
анализу оценочной составляющей при помощи лексикона на материале двух корпусов жанрово
и тематически близких текстов: ревью фильмов и ревью книг. Мы обнаружили, что даже
для тематически близких текстов эффективная классификация оценки затруднительна без
использования информации из обрабатываемого корпуса. Мы также выявили определённые
характеристики лексикона, которые оказывают влияние на классификацию оценки в тексте.