[Uneex] Семинар по антиспаму

Andrey Orlov cray_uneex на neural.ru
Чт Фев 17 02:01:26 MSK 2005


On Monday 14 February 2005 19:15, Fr. Br. George wrote:
> > > BTW, не пора ли открывать сезон? Хочу затеять разговор про антиспам.
> > 
> > Я за. Со своей стороны могу рассказать про любимого всеми байеса и любимый мной рбф. Не в привязке к спаму,
> > а в общем виде. Впрочем, в привязке к спаму тоже. Если не углублятся, то это минут на 40.
>         Так. Это Уже очень неплохо, а то мои АЛЬТовые речи, в-основном
> ликбезом были.
> 
> Собственно, вот они. Есть предложение побывбрасывать оттуда ликбез и
> подобавлять -- кто что знает. Тезисно. А я потом в один список соберу,

Давай попробуем. Как обещал, тезисы про классификаторы:

1. Общая схема построения (feature-based) классификаторов 

2. Критерии оценки качества классификации

3. "Стандартное" значение оценок качеств (попросту - 75-80% по оценкам точности и полноты)

4. Простой перцептрон и проблема разделимости

5. Байес и РБФ (Сеть функций радиального базиса)

6. Обход проблемы разделимости за счет усложнения признаков

7. Вся эта байда в спамассассин, также другие возможные применения классификаторов.

Вот. Собственно минут 30-40.

Кроме того, с удовольствием подискутирую на тему того, что является спамом и с чем, собственно, мы воюем.
Моя точка зрения - спам лишь частный случай существенно более общей проблемы:  автоматизации выделения 
существенной корресподенции из общего потока. И технологии, которые будут отработаны в ближайшее 
время на спаме  и спаммерах, в будущем станут частью любой системы коммуникации -
столь же неотторжимой, как телефонный справочник или адресная книга.

-- 
WthBstRgrds -- Андрей Орлов --  
 --- http: www.neural.ru, mail: cray на neural.ru, jid: cray на altlinux.org ---
----------------------------------------


Подробная информация о списке рассылки Uneex