[Uneex] Сортировка спама
Alexander Gerasiov
gq на cs.msu.su
Ср Апр 5 18:01:50 MSD 2006
Kondakov Roman wrote:
>>>>Рома, да ты гонишь. Я тебе 3 родных правила по 2,5 балла могу привести,
>>>
>>>Было бы интересно посмотреть.
>># Обязательные правила.
>># Иначе письма на русском языке будут иметь слишком высокую оценку.
>>score SUBJ_FULL_OF_8BITS 0.2
>>score HEADER_8BITS 0.3
>
> Если честно. то таких правил я просто не нашел.
Угу, я посмотрел, в текущей версии их уже нету.
>
>># В последней версии появились дополнительные проверки и некоторые из
>>них слишком
>># нервничают на на кривых русских письмах, поэтому уменьшим значение
>>этих правил:
>>score SUBJ_ILLEGAL_CHARS 1.0
>>score FROM_ILLEGAL_CHARS 1.5
>>score HEAD_ILLEGAL_CHARS 1.5
>
> Эти есть в 50_scores.cf
>
> score FROM_ILLEGAL_CHARS 3.280 3.280 3.792 4.100
> score HEAD_ILLEGAL_CHARS 1.652 1.519 1.796 1.606
> score SUBJ_ILLEGAL_CHARS 3.360 3.360 3.978 4.279
>
> Перед ответом на письмо прогнал весь ящик через spamassassin из коробки.
> Вроде думал, что весь спам оттуда выкинул, оказывается - нет.
> Но то, что нашел (а некоторые всего со значением 5.5) действительно
> оказались спамом.
Ром, проблема не в том, что в спаме эти правила часто встречаются.
Проблема в том, что первое же письмо от кривого клиента (читай от
корпоративного заказчика у которого стоит какой-нить Lotus Notes древней
версии с кривоприкрученной отсылкой наружу, или какой-нить аутглюк со
странными настройками или еще чего такое) в котором
Subject: Письмо от заказчика
From: Заказчик <ugly_guy на mail.ru>
X-something: blah-blah-blah Пнд, 13 2008 12:00
будет зарезано _только_ на основании этих правил. Это, как показывает
практика, неправильно. Эти правила хороши, но только на них
ориентироваться нельзя.
--
Alexander.
Подробная информация о списке рассылки Uneex