Дао подорожника. Алексей Андреев
у Энн в среду… [ВХОДЯЩИЕ]
Привет, подруга! Ты спрашивала, в каком салоне… [ВХОДЯЩИЕ]
{ОШИБКА} {ЗАПУСТИТЬ КНИГУ ДЖУНГЛЕЙ} {ПОВТОР}
Привет, подруга! Ты спрашивала, в каком салоне… [МУСОР]
Книга Джунглей. Как человек, не чуждый литературе, Чесс наверняка придумал бы метафору посерьёзней. Но именно так ему обрисовали технологию почтового фильтра те двое, что работали над программой до него. Он и раньше замечал, что программисты помешаны на инфантильных образах, вроде постоянных цитат из Винни-Пуха и Алисы. А из-за интенсивного общения с Мэттью и Джоном он и сам стал мысленно развешивать вокруг ярлычки из детских книжек, превращающие весь мир в комикс. Письмо-Балу, письмо-Багира, стая писем-Бандерлогов. «Мы с тобой одной крови» – ладно, этого пропустим. А вот этого…
Фильтр «Маугли» рассматривал каждое электронное послание как Неизвестного Зверька, которого нужно проверить на вредность с помощью генетического теста. Среди трёхсот почтовых генов были и грубые приметы спама, вроде известных спамерских адресов или приветствий без имени, были и приметы похитрее, вроде слишком высокой концентрации позитивных прилагательных и повелительных глаголов. Но отдельный нездоровый ген ещё не делал письмо мусорным; их требовалось несколько, в определённых сочетаниях.
Эти вредные геномы выявлялись при обучении фильтра на тысячах примеров спамерских рассылок. В случае ошибочного пропускания Вредного Зверька программа устраивала в своей Книге Джунглей эдакую оргию скрещивания и мутаций – до тех пор, пока не выводила комбинацию генов, которая соответствовала пропущенному письму. В следующий раз такого Зверька сразу опознавали и глушили.
С этим алгоритмом «Маугли» ловил 98% мусора в почте. Но хитрые два процента грозили вырасти: спамеры тоже развивались. Их последним изобретением стали письма, замаскированные под личные. Эти рассылки приходили людям со взломанных аккаунтов друзей, родственников и коллег, и были подписаны их именами. И всё чаще мимикрия оказывалась успешной, причём не только для спама: такими поддельными письмами хакеры распространяли вирусы, выманивали деньги и корпоративные секреты.
Узнав о филологическом образовании Чесса, кодеры Джон и Мэттью тут же накинулись на нового коллегу с предложением вывести более конкретный «ген навязчивости» на основе стилистического анализа спамерских текстов. Чесс потратил на это пару месяцев, после чего стало ясно, что такой путь – тупиковый. Ведь знакомые тоже бывают требовательны и навязчивы.
Но отличить знакомого от жулика всё-таки можно. Даже если жулик пишет со взломанного почтового ящика, он всё равно не знает многих деталей о тебе, о твоём знакомом и о ваших отношениях…
Добравшись в размышлениях до этого места, Чесс хлопнул себя по лбу: программа-секретарь! Сбор личных предпочтений и прочих маркеров «своего» для хозяина каждого аккаунта. При наличии таких данных можно отслеживать не только присутствие в письме спамерских генов, но и отсутствие генов «своего». Индивидуальный