Jamón o spam?
13 de mayo, 2009 por David Bradley>> Sírvase comentar
Un nuevo enfoque de filtrado de spam podría utilizar su hábitos de navegación web para ayudar a su programa de correo electrónico filtrar spam y encuentra el jamón.
Una computadora de escritorio del sistema que sigue a su hábitos de navegación web y, a continuación, utiliza este comportamiento para filtrar el spam de su correo electrónico está siendo desarrollado por investigadores en Japón.
Taiki Takashita, Tsuyoshi Itokawa, Teruaki Kitasuka, y Masayoshi Aritsugi del Departamento de Ciencias de la Computación y Comunicación Ingeniería en la Universidad de Kumamoto, explicar la forma en que el sistema se encuentra "jamón" palabras sobre la base de la forma en que un usuario navega por la web y la diferencia entre estas palabras y jamón el "spam" palabras en el correo electrónico del usuario. "El método reduce la problemática de mantenimiento de un filtro de spam", dicen los investigadores, que normalmente implica que el usuario confirme un falso negativo o un particular, de listas negras de spam de correo electrónico que no ha sido filtrada.
"Nuestro método puede detectar algunos spam que es difícil de clasificar correctamente utilizando la estadística bayesiana filtros existentes," el equipo dice: "Se demuestra que la combinación de un filtro bayesiano y nuestro método reduce el número de falsos negativos".
En 2001, sólo el 5% del tráfico de correo electrónico a través de Internet se mensajes de marketing no solicitados, conocidos como "spam" después de que el producto homogeneizado cerdo hecha famosa por el equipo de comedia británica Monty Python en una canción de humor titulado "Spam, spam, spam ..." Hoy , se estima que entre el 90 y el 95% de todos los e-mails son spam o llevar algún tipo de carga útil malicioso. Algunos observadores sugieren que podría tener el spam de correo electrónico graves consecuencias para el medio ambiente dada la gran cantidad de equipo y usuario tiempo perdido en la gestión de ese gran flujo de tráfico en Internet.
Hay dos principales tecnologías anti-spam: tecnologías del lado del remitente operar en la fase más temprana y están destinadas a los usuarios evitar el envío de spam malicioso en primer lugar. Dada la naturaleza distribuida de manera masiva las fuentes de spam y la existencia de redes de bots de spam construido a partir de los ordenadores en peligro en todo el mundo que puede enviar millones de mensajes cada día, esto es lo más difícil de aplicar.
Por lo tanto, la gestión de spam suelen abordarse utilizando tecnologías del lado del receptor, que operan ya sea en el nivel de la empresa de correo electrónico (en el caso de Google Mail), el proveedor de servicios de Internet (ISP) o en el programa de correo electrónico del usuario. Proporcionar un enfoque novedoso para el control de spam, Takashita y sus colegas se han centrado en este último: la filtración.
Hay numerosos métodos disponibles para filtrar el spam. La más sencilla consiste en crear una lista negra de spam palabras. Si estas palabras se encuentran en un correo electrónico que se etiqueta como spam. Filtros adicionales podría buscar direcciones web incrustado en un correo electrónico spam y asignar la etiqueta si hay más de un umbral de número de URL en el correo electrónico o si las URL de sitios de la lista negra a punto o obfuscated de alguna manera. De filtrado de URL de este enfoque también ayuda a filtrar los mensajes fraudulentos de phishing también.
En cualquier momento un mensaje de correo electrónico del usuario puede marcar manualmente un mensaje de correo electrónico como spam o de correo electrónico marcar un jamón. Estadística bayesiana se ha utilizado para aumentar y automatizar el filtrado de este enfoque de "aprendizaje" de los correos electrónicos que son lo que la lista blanca o lista negra estadística combinación de palabras en un nuevo correo electrónico es probable que sugieren spam o jamón.
Una cosa que también la mayoría de usuarios de correo electrónico con su ordenador es para navegar por la web. Takashita y sus colegas han utilizado este hecho para ayudar a desarrollar un algoritmo de filtrado que extrae las preferencias de un usuario sobre la base de sus hábitos de navegación web y se aplica a este comportamiento de filtrado de spam de correo electrónico mediante la combinación con correo electrónico filtrado Bayesiano convencionales. Su enfoque no evoca cuestiones de privacidad, ya que se hace enteramente del lado del cliente y los datos de navegación no es más que alimentar a una herramienta de escritorio. Por necesidad de la herramienta se ejecuta, o en el interior, el navegador de Internet y los programas de correo electrónico.
El método consta de tres etapas: la primera etapa de jamón crea una lista de palabras de navegar las páginas web y se aplica un análisis estadístico a esta lista, la segunda etapa prevé la función de filtrado de mensajes de correo electrónico recibidos con jamón lista de palabras, y la tercera fase, que es opcional, permite al usuario intervenir en lista blanca o negra y los correos electrónicos que se han marcado incorrectamente.
En sus ensayos preliminares de este enfoque, se han logrado a la mitad el número de falsos negativos en el filtrado de varios miles de correos electrónicos en comparación con una prueba que utiliza el filtrado Bayesiano estadísticas solo.
Todo suena bastante inteligente, pero puedo pensar en un problema inmediato con este planteamiento en que un interés en visitar determinados sitios nicho citan en particular las partes del cuerpo que no necesariamente se traducen en un deseo de leer correos electrónicos relacionados con la ampliación de dichas partes del cuerpo. O más en serio, sólo porque usted está buscando información acerca de un trastorno médico, no significa que usted desea recibir mensajes de correo electrónico que ofrece un sinfín de comercialización de medicamentos para que usted enfermedad. Podría pensar en otros ejemplos en los que mis hábitos de navegación periodística podría dar lugar a casi ninguna de spam que se filtra en todos!
Taiki Takashita, Tsuyoshi Itokawa, Teruaki Kitasuka, y Masayoshi Aritsugi (2008). Extracción de preferencia de los usuarios de la navegación comportamiento Int. de filtrado de spam. (2), 126-138 J. Paradigmas de Inteligencia Avanzada, 1 (2), 126-138


















0 respuestas hasta ahora ↓
¿Tienes algo que agregar? Por favor, deje un comentario más abajo
Déjanos tu comentario