[Uneex] Сортировка спама

Alexander Gerasiov gq на cs.msu.su
Ср Апр 5 18:01:50 MSD 2006


Kondakov Roman wrote:
>>>>Рома, да ты гонишь. Я тебе 3 родных правила по 2,5 балла могу привести,
>>>
>>>Было бы интересно посмотреть.
>># Обязательные правила.
>># Иначе письма на русском языке будут иметь слишком высокую оценку.
>>score SUBJ_FULL_OF_8BITS        0.2
>>score HEADER_8BITS              0.3
> 
> Если честно. то таких правил я просто не нашел.
Угу, я посмотрел, в текущей версии их уже нету.
> 
>># В последней версии появились дополнительные проверки и некоторые из
>>них слишком
>># нервничают на на кривых русских письмах, поэтому уменьшим значение
>>этих правил:
>>score SUBJ_ILLEGAL_CHARS        1.0
>>score FROM_ILLEGAL_CHARS        1.5
>>score HEAD_ILLEGAL_CHARS        1.5
> 
> Эти есть в 50_scores.cf
> 
> score FROM_ILLEGAL_CHARS 3.280 3.280 3.792 4.100
> score HEAD_ILLEGAL_CHARS 1.652 1.519 1.796 1.606
> score SUBJ_ILLEGAL_CHARS 3.360 3.360 3.978 4.279
> 
> Перед ответом на письмо прогнал весь ящик через spamassassin из коробки.
> Вроде думал, что весь спам оттуда выкинул, оказывается - нет.
> Но то, что нашел (а некоторые всего со значением 5.5) действительно
> оказались спамом.
Ром, проблема не в том, что в спаме эти правила часто встречаются.
Проблема в том, что первое же письмо от кривого клиента (читай от
корпоративного заказчика у которого стоит какой-нить Lotus Notes древней
версии с кривоприкрученной отсылкой наружу, или какой-нить аутглюк со
странными настройками или еще чего такое) в котором
Subject: Письмо от заказчика
From: Заказчик <ugly_guy на mail.ru>
X-something: blah-blah-blah Пнд, 13 2008 12:00

будет зарезано _только_ на основании этих правил. Это, как показывает
практика, неправильно. Эти правила хороши, но только на них
ориентироваться нельзя.

-- 
Alexander.


Подробная информация о списке рассылки Uneex