Sciencetext советы И хитрости

Блоги советы, просмотра трюков и компьютерных хаки

Спам или Хам?

13 мая 2009 Дэвид Брэдли>> Просьба прокомментировать

[Отправить щебетать]

Контроль спама в комментариях Предложен новый подход к фильтрации спама может использовать ваш браузер привычек, чтобы помочь вашей почтовой программой отфильтровываем спам и найти ветчиной.

Компьютеры настольные системы, которая соответствует вашей веб-серфинг привычек, а затем использует это поведение отфильтровывать спам из электронной почты в настоящее время разрабатывается исследователями в Японии.

Taiki Takashita, Цуеси Itokawa, Teruaki Kitasuka и Масаеси Aritsugi из Департамента компьютерных наук и инженерных коммуникаций в Кумамото университет, объяснить, каким образом система считает "ветчина" слова основаны на пути пользователь просматривает веб-и различие между этими словами и ветчиной на "спам" слова в пользовательский входящей электронной почты. "Этот метод уменьшает трудный содержание спам-фильтр", исследователи говорят, что обычно предполагает пользователя, подтверждающий ложноотрицательньный или черный конкретного спам, который не фильтруется.

"Наш метод позволяет обнаружить некоторые спама, которые трудно классифицировать правильно использовать существующий фильтр Байеса статистика", команде сказал: "Мы показали, что комбинация из Байесовский фильтр, и наш метод уменьшает количество ложных" минус ".

В 2001 году лишь 5% оборота электронной почте через Интернет маркетинг незапрошенные сообщения, известной как "спам" после гомогенизированный свинины продукт сделали известным британским комедия группы Monty Python в шуточные песни, озаглавленной "Спам, спам, спам ..." Сегодня По оценкам, от 90 до 95% всех электронных писем являются спамом или нести определенную форму злоумышленной нагрузкой. Некоторые наблюдатели указывают на то, что спам в электронной почте, может иметь серьезные экологические последствия учитывая огромное количество пользователей компьютера и время впустую на управлении такой огромный поток Интернет-трафика.

Существуют два основных анти-спам-технологий: на стороне отправителя технологии работают на самой ранней стадии, и предназначены для предотвращения злоумышленников отправку спама в первую очередь. Учитывая массово распространены характер спама и источников существования спам бот-сетей, построены из скомпрометировано компьютеров по всему миру, что можно отправить миллионы сообщений каждый день, это наиболее трудно осуществить.

Таким образом, спам управления, как правило, используя имя получателя стороне технологий, которые работают либо на уровне электронной почты компании (в случае с Google Mail), Интернет-услуг (ISP) или на уровне пользователя почтовой программы. Чтобы обеспечить новый подход к спам-контроль, Takashita и коллеги сосредоточились на последнем: фильтрация.

Существуют многочисленные подходы для фильтра спама. Самый простой предусматривает создание черного спама слов. Если эти слова встречаются в входящее письмо она помечена как спам. Дополнительные фильтры могут посмотреть на веб-адресов встроенных в входящая почта и спам присвоить метку, если Есть более чем пороговый число URL-адресов в электронной почте, или если эти URL, указывают на сайтах "черный список" или obfuscated в некотором роде. Этот URL фильтрацию подход также позволяет отфильтровывать мошеннической фишинг-сообщения тоже.

В любой момент по электронной почте пользователь может вручную флаг письмо как спам или де-флаг ветчиной почты. Байесовский статистика была использована для укрепления и автоматизировать этот фильтрации подхода "обучение", из которых сообщения имеют черный или белый, какие статистические сочетание слов в новые сообщения электронной почты может предложить спам или ветчину.

Одна вещь, большинство пользователей электронной почты также делать свои компьютеры для просмотра в Интернете. Takashita и коллеги использовали этот факт, чтобы помочь разработать алгоритм фильтрации, что экстракты пользователя преференций на основе их привычки просмотра Web и применяет такое поведение для фильтрации спама в электронной почте, сочетая его с обычными Байесу фильтрации электронной почты. Их подход не вызывает вопросов конфиденциальности, как это делается исключительно на стороне клиента и просмотра данных, просто кормили на столе инструмент. При необходимости этот инструмент будет идти, или в течение года веб-браузер и программа электронной почты.

Этот метод состоит из трех этапов: на первом этапе создается ветчина слов из списка просматривать веб-страницы и применяется статистический анализ в этот список, второй этап обеспечивает функциональность фильтрации сообщений электронной почты с ветчиной слова в списке, и третий этап, , который является необязательным, позволяет пользователю вмешиваться и белый или черный список писем, которые были помечены неправильно.

В своих предварительных испытаний подход, им удалось наполовину число ложных негативов фильтрации в несколько тысяч писем по сравнению с фильтрацией испытания, которые используют статистические Байесу одиночку.

Все это звучит довольно умен, но я могу думать о немедленном Проблема этого подхода в том, что интерес к Визит в определенных нишах сайтов особого упоминания частей тела, не обязательно переводить на желание читать письма касаются расширения сказал частей тела. Или более серьезно, просто потому, что вы ищете информацию о конкретной медицинской расстройством, не означает, что вы хотели бы получать бесконечные маркетинговых писем, предлагающих вам лекарства для этого заболевания. Я мог бы подумать о ряде других примеров, когда моя журналистская просмотра привычки, скорее всего, приведет к почти нет спама в фильтрованных на всех!

Исследования блогов Аватар Taiki Takashita, Цуеси Itokawa, Teruaki Kitasuka, И Масайоси Aritsugi (2008). Извлечение из предпочтений пользователей Интернета поведение для фильтрации спама Int. (2), 126-138 J. Расширенный разведки Парадигмы, 1 (2), 126-138

0 ответов до сих пор ↓

  • Что-нибудь добавить? Пожалуйста, оставьте комментарий ниже

Оставить комментарий

Комментарии проверяются на спам, прежде чем появляется, нет необходимости разместить его в два раза.