Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Концепция фильтрации электронных писем

Сам факт существования достаточно дорогостоящих массовых рассылок электронных писем рекламного характера свидетельствует о том, что для многих пользователей Интернета спам представляет большой интерес. Очевидно, что этот интерес обусловлен содержанием спам-писем. В то же время пользователи, которые не интересуются предложенной тематикой, относятся к спаму отрицательно. По этим причинам основным критерием фильтрации электронных писем может быть соответствие содержания электронного письма и интересов пользователей:

, (4)

где P - электронное письмо, T - тематика электронного письма, {I} - множество (область) интересов пользователей, C - целевое письмо, S - спам.

Исходя из возможностей потенциальных эксплуатантов системы защиты, формирование области интересов пользователей необходимо реализовать с помощью одного или нескольких фрагментов текста на естественном языке. В качестве указанных фрагментов могут использоваться специальным образом обработанные целевые письма, а также непосредственно введенный текст. Возможной проблемой реализации зависимости (4) является определение эксплуатантами системы защиты, всей области интересов пользователей электронной почты. На практике может оказаться, что даже конечному пользователю четко определить границы этой области достаточно трудно. При этом границы области интересов могут изменяться во времени. Поэтому многие потенциально интересные письма могут быть расценены как спам. Для решения данной проблемы разделим все электронные письма на три группы: целевые письма, спам и нейтральные письма. В группу подозрительных будут попадать те письма, тематика которых не принадлежит ни множеству интересов пользователей, ни множеству тематик спама. Учитывая предложенную классификацию, модифицируем критерий фильтрации (4):

, (5)

где F – нейтральное письмо, {Q } – множество тем спама.

<== предыдущая лекция | следующая лекция ==>
Анализ современных методов распознавания спама | Тематика спама
Поделиться с друзьями:


Дата добавления: 2014-01-14; Просмотров: 476; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.04 сек.