Время науки - The Times of Science

Федорова С.А. Fedorova S.A. 2023 27 Федорова Софья Александровна feodorowa.sof@yandex.ru Самарский национальный исследовательский университет академика С. П. Королева Институт информатики и кибернетики, 2 курс РАЗРАБОТКА СПАМ-ФИЛЬТРА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ Fedorova Sofya Aleksandrovna feodorowa.sof@yandex.ru Samara National Research University Institute of IT and Cybernatics, the 2 nd year undergraduate student CREATING A SPAM FILTER USING MACHINE LEARNING METHODS Аннотация : в статье представлены все шаги, необходимые для создания рабочей модели, которая способна классифицировать письмо по категориям спам / не спам, основываясь на обучающей выборке. Ключевые слова: спам-фильтр, методы машинного обучения, логистическая регрессия, наивный байесовский классификатор, векторное представление слов, матрица ошибок Abstract: the article presents all the steps required to create a working model that can classify emails into ‘spam/non-spam’ categories based on a training set. Keywords : spam filter, machine learning methods, logistic regression, naive Bayes classifier, word embedding, error matrix, email filtering В настоящее время электронная почта является не только эффективным способом отправки и получения данных, она стала использоваться для регистрации на различных интернет-платформах. В связи с этим, количество самых разных писем на почте сильно увеличилось, и найти нужное письмо в этом огромном потоке информации становится нелегкой задачей. Кроме того, некоторые письма «превращаются» в спам, и нам, обычным пользователям, не понятно, почему. Как работают спам- фильтры? Можно ли адаптировать современные системы под свои потребности? Эти вопросы достаточно актуальны в современном информационном мире, поэтому именно они легли в основу нашего исследования. Итак, цель нашей работы – определить наилучший алгоритм и создать на его основе собственную модель спам-фильтра.

RkJQdWJsaXNoZXIy ODQ5NTQ=