Л. Н. Толстой в сознании человека цифровой эпохи

145 Д. Д. Пронин Московский государственный технический университет им. Н. Э. Баумана (Москва, Россия) факультет информатики и систем управления, студент II курса АНАЛИЗ ЭМОЦИОНАЛЬНОЙ ТОНАЛЬНОСТИ РАССКАЗА Л. Н. ТОЛСТОГО «ПОСЛЕ БАЛА» ЦИФРОВЫМИ МЕТОДАМИ Большинство слов русского языка имеют нейтральный эмоциональный по- тенциал, т. е. малую потенциальную возможность вызывать у читателя позитив- ный или негативный эмоциональный отклик. Примеры таких нейтральных слов: стол, стул, рассказ, идти, я, он, она и подобные. Читая их и предложения, состав- ленные из них, люди, в большинстве своем, не испытывают каких-либо эмоций. Меньшая, но все же значительная, часть слов языка обладают позитивным или негативным потенциалом. Например, читая текст, в котором часто встречаются слова: «радость», «улыбка», «любовь», «счастье» – человек, скорее всего, испы- тает позитивные ощущения: он будет счастлив вместе с героем художественного произведения или будет радоваться хорошим новостям. С другой стороны, встре- чая слова «убийство», «террорист», «страх», «пытка», читатель, с большой долей вероятности, испытает волнение или отвращение. Более того, очевидно то, что для описания негативных событий писатель или журналист скорее воспользуется сло- вами с негативным эмоциональным потенциалом и, наоборот, при описании по- зитивных событий – словами с позитивным эмоциональным потенциалом. Описанная выше закономерность используется специалистами в компа- ниях, разрабатывающих социальные сети, и другими аналитиками для извлече- ния из текста полезной информации. Например, в статье «The emotional arcs of stories are dominated by six basic shapes» исследователи Andrew J. Reagan, Lewis Mitchell, Dilan Kiley, Christopher M. Danforth и Peter Sheridan Dodds [1], пользуясь алгоритмами машинного обучения и анализом тональности текста, выделяют 6 основных сюжетов художественных произведений, среди которых «счастье сва- лилось на голову» («уровень счастья» растет на протяжении всего произведе- ния), «трагедия» («уровень счастья» падает на протяжении всего произведения), «в яме» («уровень счастья» падает, после чего растет), «Икар» («уровень сча- стья» растет, после чего падает), «Золушка» («уровень счастья» растет, после чего падает, после чего снова растет), и «Эдип» («уровень счастья» падает, после чего растет, после чего снова падает). В исследовании «Анализ тональности текста с использованием методов машинного обучения» отечественные ученые А. С. Романов, М. И. Васильева, А. В. Куртукова, Р. В. Мещеряков [2] решают задачи классификации текстов на негативно и позитивно окрашенные. Для этого производится тренировка алгоритмов машинного обучения на корпусах, составленных из комментариев к постам в социальных сетях и рецензиях на фильмы. В результате данного

RkJQdWJsaXNoZXIy ODQ5NTQ=