Spam Analysis Análisis de Spam
June 25th, 2008 · by David Bradley 25 de Junio de 2008 por David Bradley
Anyone who says they have never had a problem with email spam is either my Dad, who has never touched a computer in his life (bless him), or they have staff to read their emails. Cualquier persona que dice que nunca han tenido un problema con el correo electrónico es spam, ya sea mi papá, que nunca ha tocado un ordenador en su vida (le bendiga), o que tienen personal para leer sus mensajes de correo electrónico. Spam is ubiquitous in the online world, it is everywhere, and it is omnipresent. El correo basura es ubicuo en el mundo en línea, es en todas partes, y es omnipresente.
If you’re using Google Mail you may not see much, the spam filters on that system are very good (at least in my experience). Si utilizas Google Mail es posible que no vea mucho, los filtros de spam en este sistema son muy buenas (al menos en mi experiencia). Moreover, if you’re then POP3 downloading your Por otra parte, si usted está entonces su descarga POP3 GMail into a desktop email client with en un escritorio cliente de correo electrónico con Bayesian statistical filtering Estadísticas de filtrado bayesiano then you may see even less. entonces es posible que vea aún menos. Forward to your Linux-based server and employ Spam Assassin and you may well see only very rare spam emails. Adelante a su Linux basado en servidor y emplear Spam Assassin y así usted puede ver sólo muy raras e-mails de spam. However, just take a look at your space-draining spam folders and you will realize that, although you may not see much spam, it’s still a problem. Sin embargo, sólo echa un vistazo a tu espacio de las carpetas de spam de drenaje y te darás cuenta de que, aunque usted no puede ver gran parte del correo basura, es todavía un problema.
Computer scientists in France think they may have come up with a new answer to finding the perfect spam filter. Computación en Francia los científicos piensan que puede haber ideado una nueva respuesta a la búsqueda de la perfecta filtro de spam. Writing in the Escrito en el International Journal of Web and Grid Services International Journal of Web y una red de servicios recently (2008, vol 4, , they describe how they can filter spam very effectively using a process known as Kolmogorov complexity analysis. This approach works, not by analyzing the headers or the body of an incoming email, but by classifying it based on how well it can be compressed (akin to WinZip or Stuffit compression) and then comparing this compression ratio to that of previously whitelisted or blacklisted emails. Recientemente (2008, vol 4,, que describen la forma en que pueden filtrar el spam de manera muy eficaz mediante un proceso conocido como análisis de Kolmogorov complejidad. Esta estrategia funciona, no mediante el análisis de las cabeceras o el cuerpo de un correo electrónico, sino por la clasificación se basa en la forma así que puede ser comprimido (similar a WinZip o Stuffit compresión) y luego comparar esta relación de compresión para antes de que la lista blanca o lista negra los mensajes de correo electrónico.
Andrei Nikolaevich Kolmogorov (1903-1987) was a Soviet mathematician, considered one of the most pre-eminent of the twentieth century. Andrei Nikolaevich Kolmogorov (1903-1987) fue un matemático soviético, considerado uno de los más pre-eminentes del siglo XX. He made major advances in probability theory, topology, intuitionistic logic, turbulence, classical mechanics and computational complexity. Realizó importantes avances en la teoría de la probabilidad, topología, lógica intuitionistic, turbulencia, la mecánica clásica y la complejidad computacional. It is within Kolmogorov’s work on logic that Es dentro de Kolmogorov trabajos en la lógica que Gilles Richard Gilles Richard and Andrei Doncescu of the University of Toulouse hope to find a solution to spam filtering, as they explain: y Andrei Doncescu de la Universidad de Toulouse esperanza de encontrar una solución al filtrado de spam, ya que explicar:
The main idea is to give a formal meaning to the notion of ‘information content’ and to provide a measure of this content. La idea principal es dar un sentido formal a la noción de "contenido de información» y para proporcionar una medida de este contenido. Using such a quantitative approach, it becomes possible to define a distance, which is a major tool for classification purposes. El uso de estos un enfoque cuantitativo, es posible definir una distancia, que es una herramienta fundamental para su clasificación.
The researchers have validated their approach by proceeding in two steps: Los investigadores han validado su enfoque de procedimiento en dos pasos:
First, they used the classical compression distance over a mix of spam and legitimate emails to determine if they can be properly clustered without any supervision. En primer lugar, se utiliza la distancia clásica de compresión más de una combinación de spam y los mensajes de correo electrónico legítimas para determinar si pueden ser debidamente agrupados sin ningún tipo de supervisión. This step could then show whether there is an underlying structure to spam emails that might be exploited in filtering. Este paso podría mostrar si existe una estructura subyacente a los mensajes spam que puede ser explotado en el filtrado.
In the second step, they implemented a simple machine-learning system, a so-called k-nearest neighbors algorithm, which then classifies emails according to how closely they resemble others in the queue. En el segundo paso, se puso en práctica un simple máquina-sistema de aprendizaje, lo que se denomina k-vecinos más cercanos algoritmo, que luego clasifica los mensajes de correo electrónico de acuerdo a cómo se asemejan de cerca otros en la cola. The approach requires no deep analysis of the header or body of the incoming email as is necessary with Spam Assassin type systems and Bayesian filtering. El método no requiere profundo análisis de la cabecera o cuerpo del correo electrónico que sea necesario con el Spam Assassin tipo y sistemas de filtrado bayesiano. Instead, it works by simply measuring how different is the possible compression of known legitimate and spam emails. En lugar de ello, las obras simplemente por la forma de medición diferente es la posible compresión del conocido legítimos mensajes de correo electrónico y spam.
Using this approach, the researchers were able to filter spam with 85% using this approach alone. El uso de este enfoque, los investigadores fueron capaces de filtrar el spam con un 85% utiliza este método por sí solo. However, its real strength will lie in turning to a more powerful classification technique (Support Vector Machines for instance) and in coupling it to another anti-spam technique, such as Bayesian analysis, Richard told me. Sin embargo, su verdadera fuerza residirá en la conversión a una clasificación más poderosa técnica (Máquinas de Vectores Soporte por ejemplo) y en el acoplamiento a otro anti-spam técnica, tales como análisis Bayesiano, Richard me dijo.
Related Posts Puestos relacionados
- Spam Analysis Análisis de Spam
- SQT: Make Friends with Auntie Spam SQT: hacer amigos con Tía spam
- SQT: Ignore Your Spam Folders SQT: No haga caso de sus carpetas de spam
- Send Us Your Spam Envíanos tu spam
- Self Organizing Maps Take Control of Your Email La libre organización de mapas de tomar el control de su correo electrónico

















3 responses so far ↓ 3 respuestas hasta el momento ↓
andrew // Andrew / / Jun 25, 2008 at 4:51 pm 25-jun-2008 a 4:51 pm
I read an article about a new technology called ReceiverNet from Abaca. He leído un artículo sobre una nueva tecnología llamada ReceiverNet de Abaca. ReceiverNet technology characterizes each protected user based on the percentage of spam they receive and then uses those reputations to rate the incoming message flow. ReceiverNet tecnología caracteriza a cada usuario protegidas basado en el porcentaje de spam que reciben y, a continuación, utiliza los reputación a la tasa de flujo de mensajes entrantes. I changed my spam filtering system to Abaca’s Email Protection Gateway and it blocked Replica watches spam mails, Subpoena Phishing mails and many more. He cambiado mi sistema de filtrado de spam a Abaca Correo electrónico de Protección Gateway y bloqueado Replica relojes correos spam, phishing mails Citación y muchos más. I found that Abaca’s ReceiverNet service has 99% efficiency in blocking spam mails and they guarantee their results . Me di cuenta de que Abaca del servicio ReceiverNet tiene el 99% de eficiencia en el bloqueo de correos spam y garantizar sus resultados. For more information, log on to Para obtener más información, acceda a http://abaca.com/ .
David Bradley David Bradley // / / Jun 25, 2008 at 6:18 pm 25-jun-2008 a 6:18 pm
Sounds like an interesting approach that saves on all this mathematical analysis. Se parece un enfoque interesante que guarda en todo este análisis matemático. Anyone else got a good system in place that works as well as Abaca? ¿A alguien más tiene un buen sistema en el lugar que las obras, así como Abaca?
Phil Whelan Phil Whelan // / / Jun 26, 2008 at 8:14 pm 26-jun-2008 a 8:14 pm
Abaca approach sounds like an interesting. Abacá enfoque suena interesante. 99% is quite amazing! 99% es bastante asombroso! I’m going to check it. Voy a comprobarlo.
David, yes, we have an approach that uses even less mathematical analysis, using the idea that spammers are impatient. David, sí, tenemos un enfoque que utiliza mucho menos análisis matemático, utilizando la idea de que los spammers están impacientes. We slow down connections of unknown senders, and in doing so have found that most zombie machines sending the spam disconnect within a few seconds. Estamos ralentizar las conexiones de remitentes desconocidos, y, al hacerlo, han encontrado que la mayoría de máquinas zombi enviar el spam desconectar a los pocos segundos.
Phil Whelans last blog post.. Phil Whelans última entrada del blog .. Sign up for a MailChannels Email System Load Test Regístrese para obtener una MailChannels Email Sistema de prueba de carga
Leave a Comment Déjanos tu comentario