[Uneex] Семинар по антиспаму
Andrey Orlov
cray_uneex на neural.ru
Чт Фев 17 02:01:26 MSK 2005
On Monday 14 February 2005 19:15, Fr. Br. George wrote:
> > > BTW, не пора ли открывать сезон? Хочу затеять разговор про антиспам.
> >
> > Я за. Со своей стороны могу рассказать про любимого всеми байеса и любимый мной рбф. Не в привязке к спаму,
> > а в общем виде. Впрочем, в привязке к спаму тоже. Если не углублятся, то это минут на 40.
> Так. Это Уже очень неплохо, а то мои АЛЬТовые речи, в-основном
> ликбезом были.
>
> Собственно, вот они. Есть предложение побывбрасывать оттуда ликбез и
> подобавлять -- кто что знает. Тезисно. А я потом в один список соберу,
Давай попробуем. Как обещал, тезисы про классификаторы:
1. Общая схема построения (feature-based) классификаторов
2. Критерии оценки качества классификации
3. "Стандартное" значение оценок качеств (попросту - 75-80% по оценкам точности и полноты)
4. Простой перцептрон и проблема разделимости
5. Байес и РБФ (Сеть функций радиального базиса)
6. Обход проблемы разделимости за счет усложнения признаков
7. Вся эта байда в спамассассин, также другие возможные применения классификаторов.
Вот. Собственно минут 30-40.
Кроме того, с удовольствием подискутирую на тему того, что является спамом и с чем, собственно, мы воюем.
Моя точка зрения - спам лишь частный случай существенно более общей проблемы: автоматизации выделения
существенной корресподенции из общего потока. И технологии, которые будут отработаны в ближайшее
время на спаме и спаммерах, в будущем станут частью любой системы коммуникации -
столь же неотторжимой, как телефонный справочник или адресная книга.
--
WthBstRgrds -- Андрей Орлов --
--- http: www.neural.ru, mail: cray на neural.ru, jid: cray на altlinux.org ---
----------------------------------------
Подробная информация о списке рассылки Uneex