Corpus Analysis of the Grammatical Categories’ Constituents in Fiction Texts Considering the Linguo-Regional Component
Скачать файл:
URI (для ссылок/цитирований):
https://elib.sfu-kras.ru/handle/2311/137867Автор:
Gorozhanov, Alexey I.
Guseynova, Innara A.
Горожанов, А. И.
Гусейнова, И. А.
Дата:
2020-12Журнал:
Журнал Сибирского федерального университета. Гуманитарные науки. Journal of Siberian Federal University. Humanities & Social Sciences;2020 13 (12)Аннотация:
The problem of insufficient development of professional digital tools in the humanities, including linguistics, is posed. The results of a long-term study on the development of specialized software for corpus analysis of a foreign language text, in which the regional component plays an important role, are described. On the example of Franz Kafka’s novel “Das Schloss” the work of three computer programs is demonstrated, including primary text processing, automatized markup of a small special (grammatical) corpus, a combined search for selected constituents of the grammatical categories of certainty / uncertainty, modality, as well as individual grammatical phenomena by markers of the marked up corpus and by regular expressions in case of the not marked up text, considering the regional characteristics of spelling. It is concluded that the maximum effectiveness of research of this kind can be achieved with the active work of an expert with a specially developed software product. Moreover, the expert’s task includes not only professional software management, but also active participation directly in its development. The described analysis model can be used to analyze the categorical spectrum of a foreign language text, as well as to compile didactic materials for teaching foreign languages and translation. Ставится проблема недостаточного уровня развития профессиональной цифровизации гуманитарных наук, в том числе языкознания. Описываются
результаты многолетнего исследования по разработке авторского программного
обеспечения для корпусного анализа иноязычного текста, важное место в котором занимает региональный компонент. На примере романа Франца Кафки «Замок» демонстрируется работа трех авторских компьютерных программ, включая
первичную обработку текста, автоматизированную разметку малого специального (грамматического) корпуса, комбинированный поиск избранных конституентов грамматических категорий определенности / неопределенности, модальности,
а также отдельных грамматических явлений по маркерам размеченного корпуса
и по регулярным выражениям в рамках неразмеченного текста, учитывая региональные особенности орфографии. Делается вывод о том, что максимальная эффективность исследований такого рода может быть достигнута при активной работе эксперта со специально разработанным программным продуктом. При этом
в задачу эксперта входит не только профессиональное управление программным
обеспечением, но и активное участие непосредственно в его разработке. Разработанная модель анализа может быть применена для анализа категориального спектра иноязычного текста, а также для составления дидактических материалов для
обучения иностранным языкам и переводу