[Uneex] Сортировка спама

Kondakov Roman roman на po.cs.msu.su
Пт Апр 7 10:18:27 MSD 2006


On Wed, Apr 05, 2006 at 06:16:28PM +0400, Alexander Gerasiov wrote:
> Fr. Br. George wrote:
> > В документации по SA указаны эти и ещё несколько других настроек,
> > которые при установке нужно выключать, если вы используете не английский
> > язык. 
> Ой, а линк можно? Раньше такого не было.
> 
> > Стоит ли считать эти рекомендации установками по умолчанию?
> Это уже не настройки по-умолчанию ИМХО, т.к. практика показывает, что
> встречаются люди, которые этим рекомендациям не следуют.
Когда я говорил про SA, я эти настройки не отключал.
> 
> > В целом. Вероятностная контент-фильтрация _всегда_ будет иметь false
> > positives.
> Конечно, но ИМХО, оснавная задача это минимизировать эти false positive,
> сохранив приемлимый false negative (один два порядка между отброшенным
> спамом и пропущенным), а речь зашла как раз о том, что в СА
> ненастроенном есть куда двигаться. 
Насколько я помню, Андрей на в своем докладе говорил, что больше 50-60%
отсеить в общем случае нельзя.

Ненастроенный SA отсеивает лишь 65-70% (на той базе, что накопилась у
меня).
> Кстати required_score n.nn (default:
> 5) меня тоже весьма возбуждает (у меня 7 стоит).
Кстати, а как вам идея обмена письмами, на которых SA дает слишком
большую оценку?
Скажем, есть предположение, что если в текст вставлять исходники, то SA
начнет считать, что это спам (правда я посылал себе
/usr/src/usr.sbin/moused/moused.c, но score=-1.0).

Т.к. говорить про некоторого гипотетического заказчика несколько
неправильно. Он, этот заказцик, может и с зараженной машины письма
слать, и пытаться напрямую с диалапа и много чего еще.
> 
> > Есть (на мой взгляд) очень интересная и (кажется) нерешённая работа про
> > прикручиванию байесовского анализатора к AssAssIn-овским фильтрам.
> > Чтобы обучение отражалось на весах правил.
> Примерно это делается в одном из подпроектов SARE разве не так? Правда
> ты, вероятно, имеешь в виду обучение на локальном трафике данного
> сервера, а не где-то там кем-то там.
> > 
> > Или это мне одному интересно?
> Мысль интересная. Может предложить разработчикам хотя бы не обучение
> (для начала), а возможность подключения сбора статистики сделать...
> _______________________________________________
> Uneex mailing list (http://uneex.cs.msu.su)
> Uneex на imap.cs.msu.su
> https://imap.cs.msu.su/mailman/listinfo/uneex

-- 
               С уважением,
                    Roman


Подробная информация о списке рассылки Uneex