
فریبدادن یک فیلتر تطبیقی یا وفقی
یک فیلتر به این ترتیب اسپم بودن یا پیام را تشخیص میدهد که به کلمات موجود در متن نگاه میکند و به هر کدام از آنها با توجه به اینکه این کلمه به چه میزان به یک اسپم متعلق است وزنی اختصاص میدهد. با ترکیب این احتمالات برای همه کلمات پیام، فیلتر به احتمال اسپم بودن یا نبودن پیام میرسد و بر مبنای آن تصمیمگیری میکند. این عمل ترکیب به فیلترهای تطبیقی در تصمیمگیری هوشمندانه قدرت زیادی میبخشد. فیلتر تطبیقی برای هر کاربر کلمات مخصوص به آن کاربر را دارد.
در ادامه برای روشن شدن بیشتر مطلب با سه شخصیت سروکار داریم. دو کاربر به نامهای آلیس و باب و یک تولید کننده اسپم به نام اِوا. فیلتر اسپم آلیس کلمات مجانی، رهن و وام را اسپم تشخیص میدهد، اما از آنجا به بافتنی علاقه دارد کلمات پشم، سوزن و زردوزی برای او کلمات مفیدی هستند. از طرف دیگر برای باب هم کلمات مجانی، رهن و وام نشاندهنده اسپم هستند. اما از آنجا که به اتومبیل علاقهمند است کلماتی مانند موتور، فرمان و سرعت برای او نشاندهنده یک پیام جالب هستند.
حال اگر اِوا پیامی به آلیس و باب بفرستد که در آن کلمات رهن و وام بکار رفته باشد، توسط فیلتر هر دو بسرعت اسپم تشخیص داده میشود. توجه کنید که بعضی کلمات، افعال و حروف اضافه، کلمات خنثی محسوب میشوند. تولیدکنندگان اسپم برای اینکه پیام آنها توسط موضوع (subject) اسپم تشخیص داده نشود، از حروف یا فاصلههای اضافی در میان حروف و کلمات استفاده میکنند. مثلا کلمه “mortgage” بمعنای رهن به صورت “m o r t g a g e” یا “m-o-r-t-g-a-g-e” یا اشکال دیگر ممکن است در عنوان ایمیل آورده شود تا توسط فیلتر تشخیص داده نشود.