Spam Analysis Análise spam
June 25th, 2008 · by David Bradley 25 de junho de 2008 por David Bradley
Anyone who says they have never had a problem with email spam is either my Dad, who has never touched a computer in his life (bless him), or they have staff to read their emails. Qualquer um que diz que eles nunca tiveram um problema com o e-mail spam ou é meu pai, que nunca tocou um computador em sua vida (ele te abençoe), ou que tenham os seus funcionários para ler e-mails. Spam is ubiquitous in the online world, it is everywhere, and it is omnipresent. Spam é omnipresente no mundo online, está em toda parte, e é onipresente.
If you’re using Google Mail you may not see much, the spam filters on that system are very good (at least in my experience). Se você estiver usando o Google Mail você não pode ver muito mais, os filtros de spam por esse sistema são muito bons (pelo menos na minha experiência). Moreover, if you’re then POP3 downloading your Além disso, se você é então o seu download POP3 GMail into a desktop email client with desktop em um e-mail com o cliente Bayesian statistical filtering Estatística Bayesiana filtragem then you may see even less. então você poderá ver ainda menos. Forward to your Linux-based server and employ Spam Assassin and you may well see only very rare spam emails. Próximo ao seu servidor baseado em Linux e empregam Spam Assassin e assim você poderá ver só muito rara e-mails spam. However, just take a look at your space-draining spam folders and you will realize that, although you may not see much spam, it’s still a problem. No entanto, só dê uma olhada no seu espaço de drenagem e pastas spam você vai perceber que, embora você não pode ver muito spam, é ainda um problema.
Computer scientists in France think they may have come up with a new answer to finding the perfect spam filter. Os engenheiros informáticos, em França pensar que podem chegar a ter uma nova resposta para encontrar o perfeito filtro anti-spam. Writing in the Escrevendo no International Journal of Web and Grid Services International Journal of Web e serviços grid recently (2008, vol 4, , they describe how they can filter spam very effectively using a process known as Kolmogorov complexity analysis. This approach works, not by analyzing the headers or the body of an incoming email, but by classifying it based on how well it can be compressed (akin to WinZip or Stuffit compression) and then comparing this compression ratio to that of previously whitelisted or blacklisted emails. Recentemente (2008, vol 4,, eles descrevem como eles podem filtrar spam de forma muito eficaz utilizando um processo conhecido como Kolmogorov complexidade análise. Esta abordagem funciona, não analisando o cabeçalho ou o corpo de um e-mail recebida, mas por classificando-a com base no modo como assim ele pode ser compactado (semelhante ao WinZip ou Stuffit compressão) e, em seguida, comparando este rácio de compressão do que anteriormente whitelisted lista negra ou e-mails.
Andrei Nikolaevich Kolmogorov (1903-1987) was a Soviet mathematician, considered one of the most pre-eminent of the twentieth century. Andrei Nikolaevich Kolmogorov (1903-1987) foi um matemático soviético, considerado um dos mais pré-eminente do século XX. He made major advances in probability theory, topology, intuitionistic logic, turbulence, classical mechanics and computational complexity. Ele fez grandes avanços na teoria das probabilidades, topologia, intuitionistic lógica, turbulência, mecânica clássica e complexidade computacional. It is within Kolmogorov’s work on logic that É dentro de Kolmogorov de trabalho do que a lógica Gilles Richard Gilles Richard and Andrei Doncescu of the University of Toulouse hope to find a solution to spam filtering, as they explain: e Andrei Doncescu da Universidade de Toulouse esperança de encontrar uma solução para filtrar spam, como eles explicam:
The main idea is to give a formal meaning to the notion of ‘information content’ and to provide a measure of this content. A idéia principal é dar um sentido formal para a noção de informação contentâ â € ~ € ™ e para fornecer uma medida deste teor. Using such a quantitative approach, it becomes possible to define a distance, which is a major tool for classification purposes. Utilizando uma tal abordagem quantitativa, torna-se possível definir uma distância, que é uma importante ferramenta para efeitos de classificação.
The researchers have validated their approach by proceeding in two steps: Os pesquisadores têm validado a sua abordagem ao processo em duas etapas:
First, they used the classical compression distance over a mix of spam and legitimate emails to determine if they can be properly clustered without any supervision. Em primeiro lugar, eles utilizaram a clássica compressão distância, ao longo de um mix de spam e e-mails legítimos para determinar se eles podem ser convenientemente agrupados, sem qualquer controlo. This step could then show whether there is an underlying structure to spam emails that might be exploited in filtering. Este passo poderia então mostrar se há uma estrutura subjacente ao spam e-mails que possam ser explorados em filtragem.
In the second step, they implemented a simple machine-learning system, a so-called k-nearest neighbors algorithm, which then classifies emails according to how closely they resemble others in the queue. Na segunda etapa, eles implementaram um sistema simples máquina de aprendizagem, um chamado k-vizinhos mais próximos algoritmo que, em seguida, classifica e-mails de acordo com a forma como eles lembram estreitamente outros na fila. The approach requires no deep analysis of the header or body of the incoming email as is necessary with Spam Assassin type systems and Bayesian filtering. A abordagem não exige profunda análise do cabeçalho ou corpo do e-mail recebidas como é necessária a Spam Assassin tipo de sistemas de filtragem e Bayesiana. Instead, it works by simply measuring how different is the possible compression of known legitimate and spam emails. Em vez disso, ele funciona como diferentes por simples medição é possível a compressão de spam e-mails legítimos e conhecidos.
Using this approach, the researchers were able to filter spam with 85% using this approach alone. Utilizando esta abordagem, os pesquisadores foram capazes de filtrar spam com 85% utilizam esta abordagem por si só. However, its real strength will lie in turning to a more powerful classification technique (Support Vector Machines for instance) and in coupling it to another anti-spam technique, such as Bayesian analysis, Richard told me. No entanto, a sua verdadeira força reside na vontade de transformar uma classificação mais poderosa técnica (Support Vector Machines, por exemplo) e no acoplamento-se a outra técnica anti-spam, tais como a análise Bayesiana, Richard disse-me.
Related Posts Posts relacionados
- Spam Analysis Análise spam
- SQT: Make Friends with Auntie Spam SQT: fazer amigos com Auntie spam
- SQT: Ignore Your Spam Folders SQT: ignorar o seu pastas spam
- Send Us Your Spam Envie-nos a sua spam
- Self Organizing Maps Take Control of Your Email Auto-Organizadora mapas assumir o controlo do seu e-mail

















3 responses so far ↓ 3 respostas até agora ↓
andrew // Andrew / / Jun 25, 2008 at 4:51 pm Jun 25, 2008, 4:51 pm
I read an article about a new technology called ReceiverNet from Abaca. Eu li um artigo sobre uma nova tecnologia chamada de ReceiverNet Abaca. ReceiverNet technology characterizes each protected user based on the percentage of spam they receive and then uses those reputations to rate the incoming message flow. ReceiverNet tecnologia protegida caracteriza cada usuário com base na porcentagem de spam que recebem e, em seguida, utiliza esses reputações para avaliar o fluxo de mensagens recebidas. I changed my spam filtering system to Abaca’s Email Protection Gateway and it blocked Replica watches spam mails, Subpoena Phishing mails and many more. Eu mudei o meu sistema de filtragem de spam Abacaâ € ™ s Email Protecção Gateway e ele bloqueou Replica relógios spam mails, intimação Phishing mails e muitos mais. I found that Abaca’s ReceiverNet service has 99% efficiency in blocking spam mails and they guarantee their results . Achei que Abacaâ € ™ s ReceiverNet serviço tem 99% de eficiência no bloqueio de spam mails e eles garantem os seus resultados. For more information, log on to Para obter mais informações, faça o login para http://abaca.com/ .
David Bradley David Bradley // / / Jun 25, 2008 at 6:18 pm Jun 25, 2008, 6:18 pm
Sounds like an interesting approach that saves on all this mathematical analysis. Soa como uma abordagem interessante que poupa em toda esta análise matemática. Anyone else got a good system in place that works as well as Abaca? Ninguém ficou um bom sistema que funciona no local, bem como Abaca?
Phil Whelan Phil Whelan // / / Jun 26, 2008 at 8:14 pm Jun 26, 2008, 8:14 pm
Abaca approach sounds like an interesting. Abaca soa como uma abordagem interessante. 99% is quite amazing! 99% é absolutamente espantoso! I’m going to check it. Eu vou para selecioná-la.
David, yes, we have an approach that uses even less mathematical analysis, using the idea that spammers are impatient. David, sim, temos uma abordagem que utiliza muito menos análise matemática, usando a ideia de que os spammers estão impacientes. We slow down connections of unknown senders, and in doing so have found that most zombie machines sending the spam disconnect within a few seconds. Nós abrandar conexões de remetentes desconhecidos, e em fazê-lo, constataram que a maior parte zombie máquinas enviando spam a desligar em poucos segundos.
Phil Whelans last blog post.. Phil Whelans última postagem .. Sign up for a MailChannels Email System Load Test Inscreva-se para um sistema de email MailChannels Load Test
Leave a Comment Deixe um comentário