[Uneex] Семинар по антиспаму

Fr. Br. George george на po.cs.msu.su
Пн Фев 14 19:15:21 MSK 2005


> > BTW, не пора ли открывать сезон? Хочу затеять разговор про антиспам.
> 
> Я за. Со своей стороны могу рассказать про любимого всеми байеса и любимый мной рбф. Не в привязке к спаму,
> а в общем виде. Впрочем, в привязке к спаму тоже. Если не углублятся, то это минут на 40.
        Так. Это Уже очень неплохо, а то мои АЛЬТовые речи, в-основном
ликбезом были.

Собственно, вот они. Есть предложение побывбрасывать оттуда ликбез и
подобавлять -- кто что знает. Тезисно. А я потом в один список соберу,
вот и будет тезисы для семинара.
Предупреждение: очень скользкая тема! Не флеймить!!

>= Спам: кто, чем, как?
> Кто или что?
. Юридического определения не существует, или очень расплывчатое
.. в CША и ещё где-то
.. У кажого провайдера :)
. Но мы-то отличаем спам от не-спама?
.. Непрошенная почта? Коммерция? Массовая рассылка? всегда есть исключения
.. http://www.ofisp.org/documents/ofisp-008.html
. Спам -- это то, что _я_ признаю спамом
.. или мой пользователь
. Не проще ли определять спамера, а не спам?
.. Что быстрее? (смотря когда)
.. Что даёт гарантию, и когда? (false positives)
.. Ошибки опознания и их последствия (silent vs SMTP-message)
.. Возможность дальнейшего испльзования (bayes vs bl)
> Как?
>> Как стать спамером?
. Open Relay/OpenProxy/Open Frommail/
. Spam Engine
. Трояны + xDSL = любовь
. Пыонэры
>> Уровни защиты
. Во время сеанса связи (снижение трафика, увеличение времени сеанса)
. После получения письма, на сервере (снижение только клиентского трафика, кой-какие настройки)
. На клиенте (полный трафик, любые настройки, оторванность от глобальных баз)
> Чем?
>> Ловля спамера
>>> По IP-адресу
. собственный BL (пихать туда не напихать)
. RBL (недостаток -- заморский дядя-фашист)
. DRBL (недостаток -- немасштабируемость)
>>> По SMTP-заголовкам
. Regexp
. RFC-ignorant/Fake MUA (недостаток -- таких полно)
>>> По поведению
. bulk source
. bulk dest
. и для того, и для другого нужна система агентов
>> Ловля спама
. Всенародным голосованием: Razor/Pyzor и DCC
. Органичением свободы переписки: SenderID и SPF
. Выявлнием подозрительных признаков в письме (SpamAssassin)
.. fake MUA
.. no back resolver или слово DSL в back res
.. VIAGRA
.. ещё 150 подозрительных признаков
. Обучением нейронной сети или байесовского фильтра (SA, spambayes, spamoracle)
> Трудности
. False positives
. xDSL/SpyWare
. Автораспознавание IP спамера по заголовку
. Простое администрарование своих BL
. Альтернатива SpamAssassin?

-- 
			George V Kouryachy (aka Fr. Br. George)
			mailto:george at po_cs_msu_su


Подробная информация о списке рассылки Uneex