Sciencetext Tipps & Tricks
Blogging tips, browsing tricks and computing hacks Blogging Tipps, Tricks und Browsing-Computing-Hacks

Spam Analysis Spam-Analyse

June 25th, 2008 · by David Bradley 25. Juni 2008 von David Bradley

Kommentar-Spam Control Anyone who says they have never had a problem with email spam is either my Dad, who has never touched a computer in his life (bless him), or they have staff to read their emails. Wer sagt, sie habe nie ein Problem mit E-Mail-Spam ist entweder mein Vater,, noch nie berührt einen Computer in seinem Leben (segne ihn), oder sie haben Mitarbeiter auf ihre E-Mails lesen. Spam is ubiquitous in the online world, it is everywhere, and it is omnipresent. Spam ist allgegenwärtig in der Online-Welt, es ist überall, und es ist allgegenwärtig.

If you’re using Google Mail you may not see much, the spam filters on that system are very good (at least in my experience). Wenn Sie mithilfe von Google Mail können Sie nicht viel sehen, die Spam-Filter in diesem System sind sehr gut (zumindest in meiner Erfahrung). Moreover, if you’re then POP3 downloading your Und wenn Sie dann Ihren POP3-Download GMail into a desktop email client with in einem Desktop-E-Mail-Client mit Bayesian statistical filtering Bayes-Filtern statistischen then you may see even less. Sie sehen unter Umständen sogar weniger. Forward to your Linux-based server and employ Spam Assassin and you may well see only very rare spam emails. Uns auf Ihren Linux-basierten Server und beschäftigen Spam Assassin und Sie können auch sehen, nur sehr selten Spam-E-Mails. However, just take a look at your space-draining spam folders and you will realize that, although you may not see much spam, it’s still a problem. Allerdings, so werfen Sie einen Blick auf Ihren Raum abfließen Spam-Ordner und Sie werden erkennen, dass, auch wenn Sie nicht sehen, kann viel Spam, es ist immer noch ein Problem.

Computer scientists in France think they may have come up with a new answer to finding the perfect spam filter. Computer-Wissenschaftler in Frankreich denke, sie haben sich mit einer neuen Antwort zu finden, die perfekte Spam-Filter. Writing in the Geschrieben in der International Journal of Web and Grid Services International Journal of Web Services und Grid - recently (2008, vol 4, , they describe how they can filter spam very effectively using a process known as Kolmogorov complexity analysis. This approach works, not by analyzing the headers or the body of an incoming email, but by classifying it based on how well it can be compressed (akin to WinZip or Stuffit compression) and then comparing this compression ratio to that of previously whitelisted or blacklisted emails. vor kurzem (2008, Band 4,, sie beschreiben, wie sie Spam-Filter können sehr effektiv mit Hilfe eines Prozesses bekannt als Kolmogorov Komplexität Analyse. Dieser Ansatz funktioniert, nicht durch Analyse der Header oder den Körper eines eingehenden E-Mails, sondern durch die Klassifizierung basiert auf sie, wie gut sie können komprimiert (ähnlich WinZip oder Stuffit Kompression) und vergleicht diese dann Verdichtungsverhältnis an, dass der vorher weißen oder schwarzen Liste von E-Mails.

Andrei Nikolaevich Kolmogorov (1903-1987) was a Soviet mathematician, considered one of the most pre-eminent of the twentieth century. Andrei Nikolajewitsch Kolmogorow (1903-1987) war ein sowjetischer Mathematiker, als einer der herausragenden des zwanzigsten Jahrhunderts. He made major advances in probability theory, topology, intuitionistic logic, turbulence, classical mechanics and computational complexity. Er machte große Fortschritte in der Wahrscheinlichkeitstheorie, Topologie, Intuitionismus, Turbulenzen, der klassischen Mechanik und Komplexitätstheorie. It is within Kolmogorov’s work on logic that Es ist innerhalb von Kolmogorow Arbeiten Logik, Gilles Richard Gilles Richard and Andrei Doncescu of the University of Toulouse hope to find a solution to spam filtering, as they explain: und Andrei Doncescu der Universität von Toulouse Hoffnung, eine Lösung zu finden, um Spam-Filter, wie sie erklären:

The main idea is to give a formal meaning to the notion of ‘information content’ and to provide a measure of this content. Die Grundidee ist es, einen formalen Sinn der Begriff â € ~ Informationen contentâ € ™ und um eine Maßnahme dieser Inhalte. Using such a quantitative approach, it becomes possible to define a distance, which is a major tool for classification purposes. Mit Hilfe eines solchen quantitativen Ansatz wird es möglich zu definieren, eine Distanz, die ein wichtiges Instrument für eingereiht.

The researchers have validated their approach by proceeding in two steps: Die Forscher haben ihre validierten Verfahren Vorgehen in zwei Schritten:

First, they used the classical compression distance over a mix of spam and legitimate emails to determine if they can be properly clustered without any supervision. Erstens, sie nutzten die klassische Distanz Kompression über eine Mischung aus Spam und legitime E-Mails, um festzustellen, ob sie ordnungsgemäß Cluster ohne Aufsicht. This step could then show whether there is an underlying structure to spam emails that might be exploited in filtering. Dieser Schritt könnte dann zeigen, ob es sich um eine zugrunde liegende Struktur zu Spam-E-Mails werden könnten genutzt werden, Filterung.

In the second step, they implemented a simple machine-learning system, a so-called k-nearest neighbors algorithm, which then classifies emails according to how closely they resemble others in the queue. Im zweiten Schritt werden sie umgesetzt eine einfache Maschine-Learning-System, ein so genannter k-Algorithmus nächsten Nachbarn, die dann klassifiziert E-Mails nach wie eng sie ähneln anderen in der Warteschlange. The approach requires no deep analysis of the header or body of the incoming email as is necessary with Spam Assassin type systems and Bayesian filtering. Der Ansatz erfordert keine tiefe Analyse der Kopf-oder Körper der eingehenden E-Mails wie nötig mit Spam Assassin Art und Bayes-Filter. Instead, it works by simply measuring how different is the possible compression of known legitimate and spam emails. Stattdessen wird es funktioniert, indem Sie einfach messen, wie verschieden ist die mögliche Kompression von bekannten Spam-und legitime E-Mails.

Using this approach, the researchers were able to filter spam with 85% using this approach alone. Mit diesem Ansatz, die Forscher konnten zum Filtern von Spam mit 85% mit diesem Ansatz allein. However, its real strength will lie in turning to a more powerful classification technique (Support Vector Machines for instance) and in coupling it to another anti-spam technique, such as Bayesian analysis, Richard told me. Doch seine wahre Stärke liegt in Drehen auf eine noch leistungsfähigere Technik Klassifikation (Support Vector Machines zum Beispiel) und in Verbindung zu anderen Anti-Spam-Technik, wie der Bayes'schen Analyse, Richard erzählte mir.

3 responses so far ↓ 3 Antworten bisher ↓

  • andrew // Andrew / / Jun 25, 2008 at 4:51 pm Jun 25, 2008 in 4:51 Uhr

    I read an article about a new technology called ReceiverNet from Abaca. Las ich einen Artikel über eine neue Technologie namens ReceiverNet aus Abaca. ReceiverNet technology characterizes each protected user based on the percentage of spam they receive and then uses those reputations to rate the incoming message flow. ReceiverNet Technologie geschützt charakterisiert jedes Benutzers auf der Grundlage der Anteil der Spam erhalten und sie dann nutzt diesen Ruf zu Rate der eingehenden Nachricht fließen. I changed my spam filtering system to Abaca’s Email Protection Gateway and it blocked Replica watches spam mails, Subpoena Phishing mails and many more. Ich habe meinen Spam-Filter-System auf Abacaâ € ™ s E-Mail-Gateway-Schutz, und es blockiert Replica Uhren Spam-Mails, Vorladungen Phishing-Mails und vieles mehr. I found that Abaca’s ReceiverNet service has 99% efficiency in blocking spam mails and they guarantee their results . Ich habe festgestellt, dass Abacaâ € ™ s ReceiverNet Service hat 99% Effizienz bei der Blockierung von Spam-Mails und garantieren sie ihre Ergebnisse. For more information, log on to Für weitere Informationen, melden Sie sich an http://abaca.com/ . Werden.

  • David Bradley David Bradley // / / Jun 25, 2008 at 6:18 pm Jun 25, 2008 in 6:18 Uhr

    Sounds like an interesting approach that saves on all this mathematical analysis. Klingt wie ein interessanter Ansatz, speichert diese in allen mathematischen Analyse. Anyone else got a good system in place that works as well as Abaca? Wer sonst hat ein gutes System eingerichtet, das funktioniert ebenso wie Abaca?

  • Phil Whelan Phil Whelan // / / Jun 26, 2008 at 8:14 pm Jun 26, 2008 in 8:14 Uhr

    Abaca approach sounds like an interesting. Abaca Ansatz klingt wie eine interessante. 99% is quite amazing! 99% ist schon erstaunlich! I’m going to check it. Ich gehe zu überprüfen.

    David, yes, we have an approach that uses even less mathematical analysis, using the idea that spammers are impatient. David, ja, wir haben ein Konzept, das noch weniger mathematische Analyse, mit der Idee, dass Spammer sind ungeduldig. We slow down connections of unknown senders, and in doing so have found that most zombie machines sending the spam disconnect within a few seconds. Wir slow down-Verbindungen von unbekannten Absendern, und dabei haben festgestellt, dass die meisten Zombie-Computern das Senden von Spam trennen die innerhalb von wenigen Sekunden.

    Phil Whelans last blog post.. Phil Whelans letzten Blog-Eintrag .. Sign up for a MailChannels Email System Load Test Melden Sie sich für ein MailChannels E-Mail-System Load Test

Leave a Comment Schreibe einen Kommentar

Comments are checked for spam before appearing, no need to post it twice. Kommentare werden auf Spam vor Erscheinen, keine Notwendigkeit, ihn zweimal.

Related Posts Verwandte Beiträge