Младший брат - Страница 35


К оглавлению

35

— То есть ты хочешь сказать, что полиция должна просеивать всех без разбора наподобие спам-фильтра? — вырвалось у меня.

Раньше папа никогда не сердился, если я начинал с ним спорить, однако сегодня возражать ему было явно опасно. Но меня тоже понесло — ну как же, родной папа и становится на сторону полиции!

— Я хочу сказать, что полиция совершенно обоснованно начинает свое расследование со сбора и обработки информации с помощью электронных устройств, а затем подключает к работе ноги, то есть человеческое существо как таковое, с целью непосредственно убедиться в наличии или отсутствии аномалии. Вряд ли можно считать разумным, если компьютерная программа будет подсказывать, кого надо арестовать, просеивая виртуальный стог сена в поисках реальной иголки.

— Но они сами создают себе этот стог сена, сгребая в кучу информацию из системы общественного транспорта! — не унимался я. — Для полиции это просто гора мусора с информационной точки зрения, им там вовек не найти ничего полезного, только зря время потеряют!

— Я понимаю, Маркус, что эта система тебе не нравится, поскольку доставила определенные неудобства. Но и ты должен с пониманием отнестись к принимаемым мерам безопасности, поскольку они обусловлены серьезностью ситуации. Тебе ведь не причинили никакого вреда, не так ли? Даже привезли домой.

«Они угрожали бросить меня за решетку», — просилось у меня на язык, но я смолчал, так как видел, что отцу ничего не докажешь.

— Кроме того, ты до сих пор не рассказал нам, где тебя черти носили, так что твой нестандартный график передвижений даже привлек внимание полиции!

Тут уж меня прорвало.

— Ты, кажется, верил в мой здравый смысл и не собирался шпионить за мной? — Отец не раз говорил мне это. — А теперь хочешь, чтоб я отчитывался перед тобой за каждую поездку?


Поднявшись к себе в комнату, я сразу включил иксбокс. Теперь проектор у меня был подвешен к потолку, и луч падал на стену перед кроватью. Чтобы освободить место, мне пришлось убрать свой культовый иконостас из афиш концертов панк-рока, которые я поснимал с телефонных столбов и наклеил на большие листы белой бумаги.

Я ждал, пока загрузится программа, наблюдая за процессом на освещенной стене. Мне хотелось послать электронные сообщения Ванессе и Джолу, поделиться с ними своими мыслями по поводу сегодняшней истории с копами. Я уже положил пальцы на клавиши, но остановился.

У меня на душе вдруг стало очень паршиво. Почти такое же отвратное чувство я испытал в ту минуту, когда понял, что моего старого, многострадального «винегрета» завербовали в стукачи. А сейчас мне пришло в голову, что любимый мной икснет может запросто барабанить дээнбистам о местонахождении каждого из своих пользователей.

Вспомнились отцовские слова: «Сначала мы даем программе задание определить параметры среднестатистической позиции в базе данных, а затем отыскать те позиции, чьи параметры больше всего отличаются от среднестатистических».

Надежность икснета заключается в том, что его пользователи не связаны напрямую с Интернетом. Они как бы перескакивают с иксбокса на иксбокс, пока не отыщется тот, что подключен к Интернету. Тут и происходит передача информации в нечитабельном, зашифрованном виде, так что непонятно, какие из гуляющих по Интернету сообщений икснетовские, а какие всего лишь обычные банковские переводы, коммерческая корреспонденция и прочая криптованная переписка. Нет никаких концов, привязывающих интернетовский трафик к икснету и, тем более, к пользователям икснета.

Да, но как насчет упомянутой отцом «байесовой статистики»? Я довольно хорошо знаком с этим математическим приемом. Мы с Даррелом как-то взялись написать собственную фильтрующую программу против спама, а в таком деле без байесовой математики не обойтись. Британский математик Томас Байес жил в XVIII веке в полной неизвестности, и только спустя два столетия после его смерти ученые-программисты по достоинству оценили предложенный им метод статистического анализа большого объема данных. Именно с его помощью они сумели свернуть современные информационные Гималаи.

Байесова статистика работает примерно так. Скажем, ваш почтовый ящик завалило спамом. Сначала вам надо подсчитать количество повторений каждого отдельного слова во всех рекламных объявлениях. В итоге вы получите «гистограмму частотности употребления слов», которая указывает степень вероятности, что тот или иной объем словесной информации окажется спамом. Теперь проделайте то же самое с тонной е-мейла, который заведомо не спам (на профессиональном сленге его именуют «хэм», «ветчина», в отличие от «спам», названия мясных консервов, чья реклама и породила обобщающее название для всякой ненужной информации в Интернете, засоряющей электронные почтовые ящики).

Затем подсчитайте количество слов в только что поступившем по е-мейлу сообщении и по частотной гистограмме определите, к какой «куче» — спама или хэма — оно принадлежит вероятнее всего. Если окажется, что это спам, подкорректируйте гистограмму в соответствии с новыми данными. Существует множество способов усовершенствовать этот метод — например, подсчитывать слова парами, периодически вычищать устаревшие данные, — но принцип работы остается тот же. В общем, как все гениальное, идея простая и очевидная, когда ее преподнесут тебе на тарелочке.

Для нее найдется уйма применений. Вы можете поставить перед компьютером задачу сосчитать линии на картинке и проверить, чему больше соответствует результат: гистограмме частотности линий «собака» или гистограмме частотности линий «кошка». Программа сумеет выявить порнуху, банковские махинации, словесные флейм-войны на веб-форумах и чатах. Полезная штука.

35