Spam Analysis Analisi spam
June 25th, 2008 · by David Bradley 25 Giugno 2008 da David Bradley
Anyone who says they have never had a problem with email spam is either my Dad, who has never touched a computer in his life (bless him), or they have staff to read their emails. Chiunque dice che essi non hanno mai avuto un problema con l'email di spam o è il mio papà, che non ha mai toccato un computer nella sua vita (lo benedica), o che hanno personale a leggere i loro messaggi di posta elettronica. Spam is ubiquitous in the online world, it is everywhere, and it is omnipresent. Lo spam è onnipresente nel mondo online, è ovunque, ed è onnipresente.
If you’re using Google Mail you may not see much, the spam filters on that system are very good (at least in my experience). Se stai usando Google Mail potresti non vedere molto, la filtri spam su tale sistema sono molto buone (almeno secondo la mia esperienza). Moreover, if you’re then POP3 downloading your Inoltre, se siete quindi il vostro scaricamento POP3 GMail into a desktop email client with in un desktop client email con Bayesian statistical filtering Statistici di filtraggio bayesiano then you may see even less. , si potrebbe vedere anche meno. Forward to your Linux-based server and employ Spam Assassin and you may well see only very rare spam emails. Trasmettere al tuo basati su Linux server e assumere Spam Assassin e si può ben vedere solo molto rare le email spam. However, just take a look at your space-draining spam folders and you will realize that, although you may not see much spam, it’s still a problem. Tuttavia, solo un'occhiata al tuo spazio drenante-spam cartelle e si rende conto che, anche se non puoi vedere molto di spam, è ancora un problema.
Computer scientists in France think they may have come up with a new answer to finding the perfect spam filter. Computer in Francia scienziati pensano che siano venuti a una nuova risposta a trovare il perfetto filtro anti-spam. Writing in the Iscritto nel International Journal of Web and Grid Services International Journal of Web e servizi di rete recently (2008, vol 4, , they describe how they can filter spam very effectively using a process known as Kolmogorov complexity analysis. This approach works, not by analyzing the headers or the body of an incoming email, but by classifying it based on how well it can be compressed (akin to WinZip or Stuffit compression) and then comparing this compression ratio to that of previously whitelisted or blacklisted emails. recentemente (2008, vol 4,, descrivono il modo in cui può filtrare lo spam in modo molto efficace utilizzando un processo noto come complessità di Kolmogorov analisi. Questo approccio funziona, non analizzando le intestazioni o il corpo di un e-mail in arrivo, ma di classifica in due categorie in base alla modalità e può essere compresso (simile a WinZip o Stuffit compressione) e poi a confronto questo rapporto di compressione a quella di precedentemente lista nera lista bianca o email.
Andrei Nikolaevich Kolmogorov (1903-1987) was a Soviet mathematician, considered one of the most pre-eminent of the twentieth century. Andrei Nikolaevich Kolmogorov (1903-1987) è stato un matematico sovietico, considerato uno dei più preminente del ventesimo secolo. He made major advances in probability theory, topology, intuitionistic logic, turbulence, classical mechanics and computational complexity. Egli ha fatto grandi progressi nella teoria della probabilità, della topologia, intuitionistic logica, turbolenza, la meccanica classica e complessità computazionale. It is within Kolmogorov’s work on logic that E 'all'interno di Kolmogorov lavori in logica che Gilles Richard Gilles Richard and Andrei Doncescu of the University of Toulouse hope to find a solution to spam filtering, as they explain: e Andrei Doncescu dell 'Università di Tolosa speranza di trovare una soluzione al filtraggio dello spam, come spiegare:
The main idea is to give a formal meaning to the notion of ‘information content’ and to provide a measure of this content. L'idea principale è di dare un significato formale alla nozione di â € ~ informazioni contentâ € ™ e per fornire una misura di questo contenuto. Using such a quantitative approach, it becomes possible to define a distance, which is a major tool for classification purposes. Utilizzando un tale approccio quantitativo, diventa possibile definire una distanza, che è un importante strumento ai fini di classificazione.
The researchers have validated their approach by proceeding in two steps: I ricercatori hanno convalidato il loro approccio di procedura in due fasi:
First, they used the classical compression distance over a mix of spam and legitimate emails to determine if they can be properly clustered without any supervision. In primo luogo, di aver utilizzato la classica distanza di compressione su un mix di spam e-mail legittime per determinare se possono essere raggruppati correttamente senza alcuna supervisione. This step could then show whether there is an underlying structure to spam emails that might be exploited in filtering. Questo passaggio potrebbe quindi mostrare se vi è una struttura di base per le email di spam che potrebbe essere sfruttato in filtraggio.
In the second step, they implemented a simple machine-learning system, a so-called k-nearest neighbors algorithm, which then classifies emails according to how closely they resemble others in the queue. Nel secondo passo, essi attuato una semplice macchina-sistema di apprendimento, un cosiddetto k-vicini di casa più vicina algoritmo, che classifica le email in base a come essi assomigliano strettamente altri in coda. The approach requires no deep analysis of the header or body of the incoming email as is necessary with Spam Assassin type systems and Bayesian filtering. L'approccio non richiede profonda analisi di intestazione o il corpo dei messaggi in arrivo per quanto è necessario a Spam Assassin e tipo di sistemi di filtraggio bayesiano. Instead, it works by simply measuring how different is the possible compression of known legitimate and spam emails. Invece, funziona semplicemente come misura diversa è la possibilità di compressione del noto legittimi e spam email.
Using this approach, the researchers were able to filter spam with 85% using this approach alone. Utilizzando questo approccio, i ricercatori sono stati in grado di filtrare lo spam con l'85% utilizzando questo approccio solo. However, its real strength will lie in turning to a more powerful classification technique (Support Vector Machines for instance) and in coupling it to another anti-spam technique, such as Bayesian analysis, Richard told me. Tuttavia, la sua vera forza risiede nella volontà di svolta di un più potente classificazione tecnica (Support Vector Machines per esempio) e, in accoppiamento ad un altro anti-spam tecnica, come ad esempio l'analisi Bayesiana, Richard mi ha detto.
Related Posts Posti connessi
- Spam Analysis Analisi spam
- SQT: Make Friends with Auntie Spam SQT: fare amicizia con Auntie spam
- SQT: Ignore Your Spam Folders SQT: ignorare il tuo spam cartelle
- Send Us Your Spam Inviaci il tuo spam
- Self Organizing Maps Take Control of Your Email L'organizzazione di autoregolamentazione mappe assumere il controllo della tua e-mail

















3 responses so far ↓ 3 risposte finora ↓
andrew // Andrew / / Jun 25, 2008 at 4:51 pm Giugno 25, 2008 a 4:51 pm
I read an article about a new technology called ReceiverNet from Abaca. Ho letto un articolo su una nuova tecnologia chiamata ReceiverNet da Abaca. ReceiverNet technology characterizes each protected user based on the percentage of spam they receive and then uses those reputations to rate the incoming message flow. ReceiverNet tecnologia protetta caratterizza ogni utente basata sulla percentuale di spam che ricevono e quindi usa questi reputazione per votare il flusso di messaggio in arrivo. I changed my spam filtering system to Abaca’s Email Protection Gateway and it blocked Replica watches spam mails, Subpoena Phishing mails and many more. Ho cambiato il mio sistema di filtraggio dello spam a Abacaâ € ™ s Email Protection Gateway e bloccato Replica orologi messaggi di spam, phishing citazione mail e molti altri. I found that Abaca’s ReceiverNet service has 99% efficiency in blocking spam mails and they guarantee their results . Ho trovato che Abacaâ € ™ s ReceiverNet servizio ha il 99% di efficienza nel bloccare lo spam mail e di garanzia che i loro risultati. For more information, log on to Per ulteriori informazioni, accedere al http://abaca.com/ .
David Bradley David Bradley // / / Jun 25, 2008 at 6:18 pm Jun 25, 2008, 6:18 pm
Sounds like an interesting approach that saves on all this mathematical analysis. Suona come un approccio interessante che salva su tutti i matematici questa analisi. Anyone else got a good system in place that works as well as Abaca? Chiunque altro ha ottenuto un buon sistema in atto che funziona come pure Abaca?
Phil Whelan Phil Whelan // / / Jun 26, 2008 at 8:14 pm Jun 26, 2008, 8:14 pm
Abaca approach sounds like an interesting. Abaca approccio suona come un interessante. 99% is quite amazing! Il 99% è davvero stupefacente! I’m going to check it. Io vado a controllare.
David, yes, we have an approach that uses even less mathematical analysis, using the idea that spammers are impatient. David, sì, abbiamo un approccio che utilizza ancora meno analisi matematica, utilizzando l'idea che gli spammer sono impazienti. We slow down connections of unknown senders, and in doing so have found that most zombie machines sending the spam disconnect within a few seconds. Siamo rallentare le connessioni di mittenti sconosciuti, e così facendo hanno trovato che la maggior parte delle macchine zombie l'invio di spam scollegare nel giro di pochi secondi.
Phil Whelans last blog post.. Phil Whelans ultimo post sul blog .. Sign up for a MailChannels Email System Load Test Iscriviti a un MailChannels Email di caricamento del sistema di prova
Leave a Comment Lascia un commento