Spam Analysis تحليل المتطفل
June 25th, 2008 · by David Bradley يونيو 25th ، 2008 من قبل ديفيد برادلي
Anyone who says they have never had a problem with email spam is either my Dad, who has never touched a computer in his life (bless him), or they have staff to read their emails. كل من يقول لها ابدا لديه مشكلة مع البريد الالكتروني المتطفل اما ابي ، لم تطرق من الحاسوب في حياته (يبارك له) ، او انها الموظفين ليصبح نصها كما يلي على رسائل البريد الالكتروني. Spam is ubiquitous in the online world, it is everywhere, and it is omnipresent. المتطفل هو في كل مكان في العالم عبر الانترنت ، ومن كل مكان ، وإنه كلي الوجود.
If you’re using Google Mail you may not see much, the spam filters on that system are very good (at least in my experience). اذا كنت تستخدم البريد الالكتروني صور قد لا ترى الكثير ، المتطفل المرشحات على هذا النظام جيدة جدا (على الأقل في تجربتي). Moreover, if you’re then POP3 downloading your وعلاوة على ذلك ، اذا كنت ثم تنزيل POP3 الخاص بك GMail بريد جوجل into a desktop email client with الى سطح المكتب مع عميل البريد الالكتروني Bayesian statistical filtering بايزيه احصاءيه الترشيح then you may see even less. قد ترى في ذلك الحين وحتى اقل من ذلك. Forward to your Linux-based server and employ Spam Assassin and you may well see only very rare spam emails. الى الأمام لينكس الخاص بك على اساس استخدام خادم البريد المزعج وقاتل ويمكنك ايضا لا يرون الا نادرا جدا رسائل البريد الالكتروني المتطفل. However, just take a look at your space-draining spam folders and you will realize that, although you may not see much spam, it’s still a problem. بيد ان مجرد القاء نظرة على الفضاء الخاص بك - تجفيف المتطفل المجلدات وسوف ندرك انه ، رغم انك قد لا ترى الكثير من البريد المزعج ، فهو ما زال يمثل مشكلة.
Computer scientists in France think they may have come up with a new answer to finding the perfect spam filter. الحاسوب من العلماء في فرنسا يعتقدون انهم ربما يكون قد حان حتى مع جديد الرد على ايجاد افضل مرشح المتطفل. Writing in the في كتابه International Journal of Web and Grid Services المجله الدولية للشبكة وخدمات الشبكه recently (2008, vol 4, , they describe how they can filter spam very effectively using a process known as Kolmogorov complexity analysis. This approach works, not by analyzing the headers or the body of an incoming email, but by classifying it based on how well it can be compressed (akin to WinZip or Stuffit compression) and then comparing this compression ratio to that of previously whitelisted or blacklisted emails. في الآونة الاخيرة (2008 ، المجلد 4 ، ، وهي تصف الكيفيه التي يمكن فلتره البريد المزعج بشكل فعال للغاية باستخدام العملية المعروفة باسم kolmogorov تعقيد التحليل. ويعمل هذا النهج ، وليس ذلك من خلال تحليل رؤوس أو هيئة من رسائل واردة ، ولكن عن طريق تصنيفه على أساس كيف بالاضافة الى انها يمكن ان تكون مضغوطه (أقرب الى برنامج لضغط الملفات او ضغط stuffit) وبعد ذلك الضغط مقارنة هذه النسبه الى ان من السابق whitelisted او رسائل البريد الإلكتروني في القائمة السوداء.
Andrei Nikolaevich Kolmogorov (1903-1987) was a Soviet mathematician, considered one of the most pre-eminent of the twentieth century. اندريه Nikolaevich kolmogorov (1903-1987) وكان عالم الرياضيات السوفياتي ، تعتبر من أكثر البارز من القرن العشرين. He made major advances in probability theory, topology, intuitionistic logic, turbulence, classical mechanics and computational complexity. وقال انه تقدما كبيرا في نظرية الاحتمالات ، طوبولوجيا ، intuitionistic المنطق ، والاضطراب ، ميكانيكا كلاسيكيه والتعقيد. It is within Kolmogorov’s work on logic that ومن ضمن kolmogorov عمل على هذا المنطق الذي Gilles Richard جيل ريتشارد and Andrei Doncescu of the University of Toulouse hope to find a solution to spam filtering, as they explain: واندريه doncescu من جامعة تولوز الامل لايجاد حل لفلتره البريد المزعج ، كما شرح :
The main idea is to give a formal meaning to the notion of ‘information content’ and to provide a measure of this content. والفكره الرئيسية هي رسمية لاعطاء معنى لمفهوم € ~ â € ™ contentâ المعلومات ولتوفير قدر من هذا المحتوى. Using such a quantitative approach, it becomes possible to define a distance, which is a major tool for classification purposes. استخدام هذا النهج الكمي ، ان يصبح من الممكن تحديد المسافة ، التي هي اداة رئيسية لاغراض التصنيف.
The researchers have validated their approach by proceeding in two steps: الباحثون اقرت من قبل الشروع في النهج الذي تتبعه في خطوتين :
First, they used the classical compression distance over a mix of spam and legitimate emails to determine if they can be properly clustered without any supervision. اولا ، انها تستخدم الضغط الكلاسيكيه مسافه اكثر من مزيج من رسائل البريد الالكتروني المتطفل والشرعية لتحديد ما اذا كان يمكن ان تتجمع على الوجه الصحيح دون اي اشراف. This step could then show whether there is an underlying structure to spam emails that might be exploited in filtering. هذه الخطوة يمكن ان تظهر بعد ذلك اذا كان هناك ثمة البنية التحتية لرسائل البريد الالكتروني غير المرغوبه التي يمكن استغلالها في الترشيح.
In the second step, they implemented a simple machine-learning system, a so-called k-nearest neighbors algorithm, which then classifies emails according to how closely they resemble others in the queue. وفي الخطوة الثانية ، وهي بسيطة تنفذ آليا نظام التعلم ، اي ما يسمى ك - خوارزميه اقرب الجيران ، ثم يصنف رسائل البريد الالكتروني التي وفقا لمدى ارتباط انها تشبه الآخرين في الصف. The approach requires no deep analysis of the header or body of the incoming email as is necessary with Spam Assassin type systems and Bayesian filtering. هذا النهج لا تحتاج الى تحليل عميق من الرأس او الجسم للرسائل واردة كما هو ضروري مع نوع قاتل البريد المزعج ونظم بايزيه الترشيح. Instead, it works by simply measuring how different is the possible compression of known legitimate and spam emails. وبدلا من ذلك ، بكل بساطة انه يعمل من خلال قياس مدى الاختلاف هو ممكن من الضغط المعروفة والمشروعة رسائل البريد الالكتروني المتطفل.
Using this approach, the researchers were able to filter spam with 85% using this approach alone. وباستخدام هذا النهج ، وتمكن الباحثين فلتره البريد المزعج مع 85 ٪ باستخدام هذا النهج وحدها. However, its real strength will lie in turning to a more powerful classification technique (Support Vector Machines for instance) and in coupling it to another anti-spam technique, such as Bayesian analysis, Richard told me. ومع ذلك ، فان القوة الحقيقية تكمن في الاراده وانتقل الى اقوى تقنيه التصنيف (دعم مكافحة ناقلات الآلات على سبيل المثال) وفي اقتران الى آخر تقنيه لمكافحة البريد المزعج ، مثل بايزيه التحليل ، وريتشارد لي.
Related Posts الوظائف ذات الصلة
- Spam Analysis تحليل المتطفل
- SQT: Make Friends with Auntie Spam Sqt : صداقات مع العمة المتطفل
- SQT: Ignore Your Spam Folders Sqt : تجاهل المتطفل المجلدات الخاصة بك
- Send Us Your Spam ارسل لنا البريد المزعج الخاص بك
- Self Organizing Maps Take Control of Your Email تنظيم الخرائط الذاتية للسيطره على البريد الالكترونى الخاص بك

















3 responses so far ↓ 3 الردود حتى الآن ↓
andrew // اندرو / / Jun 25, 2008 at 4:51 pm 25 يونيو ، 2008 في الساعة 4:51
I read an article about a new technology called ReceiverNet from Abaca. وأنا اقرأ مقالة عن تكنولوجيا جديدة تسمى receivernet من شجرة الموز الفلبينيه. ReceiverNet technology characterizes each protected user based on the percentage of spam they receive and then uses those reputations to rate the incoming message flow. Receivernet التكنولوجيا المحميه يميز كل مستخدم على اساس نسبة مءويه من البريد المزعج التي يتلقونها وبعد ذلك يستخدم تلك السمعه لمعدل تدفق رسالة المقبل. I changed my spam filtering system to Abaca’s Email Protection Gateway and it blocked Replica watches spam mails, Subpoena Phishing mails and many more. لقد غيرت بلدي على نظام فلتره البريد المزعج abacaâ € ™ ق البريد الالكتروني وحمايه بوابة منيعا طبق الاصل ساعات البريد المتطفل ، والتصيد البريد واحضار عدد اكبر بكثير. I found that Abaca’s ReceiverNet service has 99% efficiency in blocking spam mails and they guarantee their results . لقد وجدت ان abacaâ € ™ ق receivernet الخدمة 99 ٪ من الكفاءه في منع الرسائل غير المرغوبه وتضمن نتائجها. For more information, log on to لمزيد من المعلومات ، الاتصال على http://abaca.com/ .
David Bradley ديفيد برادلي // / / Jun 25, 2008 at 6:18 pm 25 يونيو ، 2008 في الساعة 6:18
Sounds like an interesting approach that saves on all this mathematical analysis. يبدو مثل نهج مثيرة للاهتمام أن ينقذ الرياضية على كل هذا التحليل. Anyone else got a good system in place that works as well as Abaca? من أي شخص آخر حصل على نظام جيد فى ان يعمل فضلا عن شجرة الموز الفلبينيه؟
Phil Whelan فل ويلان // / / Jun 26, 2008 at 8:14 pm 26 يونيو ، 2008 في الساعة 8:14
Abaca approach sounds like an interesting. يبدو مثل شجرة الموز الفلبينيه نهج مثيرة للاهتمام. 99% is quite amazing! 99 ٪ من المدهش جدا! I’m going to check it. أنا ذاهب لوقف هذا العنف.
David, yes, we have an approach that uses even less mathematical analysis, using the idea that spammers are impatient. ديفيد ، نعم ، لدينا نهج ويستخدم اقل تحليل رياضي ، وذلك باستخدام فكرة ان Spammers هي الصبر. We slow down connections of unknown senders, and in doing so have found that most zombie machines sending the spam disconnect within a few seconds. ونحن ابطاء وصلات غير معروف من المرسلين ، وبذلك وجدت ان معظم الآلات الكسول ارسال البريد المزعج قطع الاتصال في غضون بضع ثوان.
Phil Whelans last blog post.. فل whelans الماضي بعد بلوق.. Sign up for a MailChannels Email System Load Test وقعت لmailchannels نظام البريد الالكتروني في اختبار الحمل
Leave a Comment ترك التعليق