Недавно вступивший в силу закон закрепляет обязательства каждой организации, владеющей персональными данными, по обеспечению их конфиденциальности. Нельзя сказать, что этот нормативный акт привнес что-то кардинально новое, скорее он унифицировал ранее разрозненные требования к защите личных данных. Лица, нарушившие эти требования, несут гражданскую, уголовную, административную, дисциплинарную и иную предусмотренную законодательством РФ ответственность. При нарушении положений закона любая компания может быть лишена лицензии на свою деятельность и подвергнута судебному преследованию со стороны пострадавших. Но все это можно было проделать и раньше, однако почему-то не делалось.
Правда, теперь можно привлекать и продавцов персональных данных, так как распространение тоже становится подсудным делом. К тому же закон заставил чиновников и бизнесменов зашевелиться, поскольку устанавливает некие нормативы обеспечения безопасности данных, требующих интеграции новых программных продуктов и изменения организационных процедур при работе с конфиденциальной информацией. Тем не менее закону не достает конкретики. В нем, например, сказано, что организация должна "принимать необходимые организационные и технические меры, в том числе использовать шифровальные (криптографические) средства" для того, чтобы защитить персональные данные от таких действий, как "неправомерный или случайный доступ, уничтожение, изменение, блокирование, копирование, распространение". Более четкие требования будут разработаны позднее Федеральной службой по техническому и экспортному контролю РФ (ФСТЭК). Это же ведомство займется проверкой исполнения закона в организациях.
Еще одно новшество - это ограничения длительности хранения приватных сведений. Держать их можно не дольше, чем требуют цели обработки данных, после чего информация подлежит уничтожению в течение трех дней. Имеются в виду именно персонифицированные данные. Информация, которую нельзя сопоставить с конкретным человеком, может храниться и дальше - например, для статистических целей. Некоторые представители банков и других организаций уже заявили, что положения закона трудновыполнимы, но обойти их вряд ли удастся.
Лицо, занимающееся сбором и обработкой персональных данных, должно уведомить о своих действиях контролирующий орган, объяснив преследуемые цели. Перечень держателей персональных данных должен быть открытым, и любой гражданин имеет право осведомиться у той или иной организации, что она о нем знает. Упоминается в законе и то, что для получения данных следует заручиться согласием лица, их предоставившего.
Интересно, что этот закон был одним из немногих (если не единственным) российских нормативных актов, непосредственно связанных с приватностью граждан, который не вызвал возмущения у правозащитников. Правда, когда законопроект только поступил на рассмотрение в Думу, депутаты были настроены куда менее благодушно. Они протестовали против двух пунктов закона, предусматривающих создание единой системы персонального учета населения (СПУН), в которую должны были быть занесены, помимо всего прочего, и биометрические данные. Но президент порекомендовал эти положения из закона исключить, и во втором чтении о них речи уже не шло. Правда, единая база в России все же будет. Для такого дела в Госдуме обещают со временем принять отдельный закон. Только теперь говорят не СПУН, а госрегистр, и фигурирует в проекте не девятнадцать параметров, а только шесть: ФИО, пол, дата, год рождения. Но все это о нас можно разузнать и сегодня из баз, украденных в госведомствах, так что хуже уже не будет.
Круг подозреваемыхПотенциальных источников утечки данных о заемщиках летом прошлого года было предостаточно. Помимо банков, эта информация имелась у розничных сетей, бюро кредитных историй, коллекторских агентств, а также в Центральном каталоге кредитных историй в ЦБ. Представители последнего, правда, постарались откреститься от причастности к столь масштабному хищению конфиденциальных данных, заявив, что в Банк России поступает не вся информация; а та, что доходит, хранится в зашифрованном виде. Хотя, конечно, памятуя о прошлых инцидентах с российским ЦБ, безоговорочно отметать причастность к делу его сотрудников сложно.
Почти сразу отпали бюро кредитных историй, которые не так долго работают, чтобы собрать данные о 700 тысячах клиентов. Вне подозрений оказались и коллекторские агентства, владеющие только списками должников, тогда как в базе имелись данные и о добросовестных плательщиках. Таким образом, среди потенциальных источников утечки остались крупные банки, специализирующиеся на рынке потребительского кредитования, среди которых Инвестсбербанк, Росбанк, Русский Стандарт, Хоум Кредит и др.
ОГОРОД КОЗЛОВСКОГО: Кода, пуля и звезды
Автор: Сергей Голубицкий
После "Голубятни" про Висту ("Как я кормил обезьяну") нарисовалась серьезная непонятка, на которую читатели разом затыкали пальцем по мылу в личку (во фраза, а?!). Во избежание недопониманса вношу ясность в скользкие моменты.
Первое. Бдительный Алексей Писклюков заподозрил старого голубятника в джинсовой подлянке: "Собственно, самой статьей (несмотря на немотивированно восторженные интонации), вы не проговариваетесь. Проговариваетесь вы той парой строк, которые в статье отсутствуют - я не нашел ни слова о системе активации. Где же камлание про бакунианские развалы и хакера Иванопуло в духе традиционного культур-повидла? Нету его - как же так, что случилось? От заказного характера статьи я лично получил только дополнительную порцию удовольствия - мне как игроку в покер всегда интересно видеть, блефует человек или нет".
Начну с афедрона - про "заказной характер". Его нет и быть не может по банальной причине - у меня нет прямых сношений с Микрософтом. Никаких копий Висты никто мне на тестирование не предоставлял, насколько знаю - в редакцию "Компьютерры" они тоже не поступали. В ситуации, когда нет заказчика, не может быть и заказухи. А потому все акты киллерства и триумфа, наблюдаемые читателями в "Голубятнях", являются сугубо добровольными и глубоко народными по духу.
Второе. Почему ни словом не обмолвился об активации Висты? Опять же по простой причине - темы такой больше не существует! Раз нет темы, нет и разговора. Для особо непонятливых: в конце февраля состоялся, геноссен, полный абгемахт иванович - защита операционной системы Виста была окончательно сломлена. Со всеми потрохами активации, WGA и прочими глупостями, на бессмысленность и бесперспективность которых вменяемые люди указывали редмондским фантазерам всегда и априорно. Речь идет не о паллиативных "тайм-стопперах", появившихся еще в конце 2006 года, - системах остановки таймера, отсчитывающего тридцатидневный льготный полнофункциональный период пользования Вистой, а о полноценной активации ОС - с генерацией валидных номеров и онлайн (псевдо) регистрацией. Потрясает прорыв защиты одновременно по всем мыслимым и немыслимым направлениям: сперва китайцы создали имитацию дистанционного сервера Key Management Server для активации версии Vista Enterprise, затем запустили brute-force-генератор номеров активации, который примитивно, но оттого не менее эффективно подбирает нужные ключи, наконец - венец творения - создали тулкит, эмулирующий OEM BIOS и позволяющий регистрировать уже любую потребительскую версию ОС на любом компьютере (драйверы, разработанные хакерской группой Paradox).
Спрашивается: чего ж еще рассказывать про хакера Иванопуло. Все уже сказано; вернее, сломано. Ну а джига жизнерадостного козла над трупом поверженного льва никогда не входила в мои этнические традиции.
Третья непонятка, связанная с кормлением обезьяны, возникла из-за неуклюжей формулировки: "Те, кто чувствуют уверенность в своих силах, меняют встроенные гадости (брандмауэр и антивирус) на нормальные аналоги сторонних производителей (Agnitum Outpost и Eset Nod32 в моем случае), а UAC’у просто сворачивают шею (полностью отключают, то бишь)". Счастливые гоблины, в предвкушении замоча, мигом затоварили мылом редакционную почту: "Хочу обратиться к Сергею Голубицкому, может он поделится секретом, как ему удалось скрестить Vista и Agnitum Outpost? Может он вообще не ставил себе новую ось?" - кайфует анонимный Рома. Разочаровываю Рому: во-первых, насколько мне известно, Outpost с Вистой уже совокупляется, поскольку ведется тестирование внутренней беты (при желании мог бы ее получить у разработчиков); во-вторых, фраза "в моем случае" относится к тому, какие программы я считаю "нормальными аналогами", а не к самоличному тестированию Outpost под Вистой. Выразился неудачно, согласен, однако всякий пожиратель культур-повидла со стажем (а не случайно шагающий мимо) должен был бы знать, что уже который год как я отказался от программных файрволлов, обходясь железным экраном моего маршрутизатора - о чем неоднократно писано в "Голубятнях".
И наконец, кода. Вопрос об "окончательном пребывании с Вистой" решился заблаговременно и отрицательно - я вернулся на Windows XP, не дожидаясь появления драйверов для стека Bluetooth, поскольку обнаружилась, уже после написания колонки, еще одна - на сей раз критичная - несовместимость: новая ОС отказалась работать с моим VоIP-телефоном, коим пользуюсь постоянно и не могу позволить себе роскошь ожидания подходящих драйверов.
Мой вердикт относительно Windows Vista: новая ОС малопригодна для апгрейда! Иными словами: либо вы пользуетесь старой доброй Windows XP, либо покупаете новый компьютер с уже предустановленной Windows Vista. Компьютер, в котором заведомо не окажется железных несовместимостей.
Прежде чем захлебнуться самому и захлебнуть читателя восторгом по поводу нового релиза одной замечательной программы, анонсирую с не меньшим захлебом два сайта. Первый - бакунианский, родом из близкой моему сердцу Незалежности. Называется www.pulya.net. Навскидку - рядовой портал, каких сегодня тысячи, с акцентом на свежие фильмы, пугливую эротику, фотосеты суперкаров, выборочные статьи гламурно-мусорной полиграфии, книжки и ненавязчивые программулины общенародного потребления, на поверку - блестящая модель онлайн-бизнеса. Чистота модели и концентрация на идее - вот изюминка украинской Пули, заставившая меня извлечь этот портал на обозрение потребителей культур-повидла.
Концепция проста и элегантна: громадный массив контента, привлекательный для максимально широкого пласта Рунет-тусовки, выкладывается на два файлохранилища - Rapidshare и FileFactory. Все линки - в открытом доступе, никакой регистрации на портале и членства не требуется. Хотите - качайте, сколько душа просит, через фриварные аккаунты. Кто пробовал, тот знает: мизерный лимит на объем скачивания и часовые ожидания допуска быстро заставляют душу ничего больше не хотеть. В этот момент и включается бизнес-модель: Пуля продает премиум-аккаунты Rapidshare и FileFactory по льготной цене (4–10 WMZ в зависимости от длительности подписки). Цены меньше, чем у самих файлохранилищ, плюс - удобная для Рунета оплата не кредитной картой, а WebMoney. Источник аккаунтов на продажу - пойнты, которые зарабатываются официально на файлохранилищах за счет гигантских объемов того самого трафика, что создается контентом, выложенным на портале. Эдакий perpetuum mobile и, на мой взгляд, ценная модель для изучения на предмет адаптации.
Второй сайт, который хочется представить читателям, называется "Война и мир" (www.warandpeace.ru). Посвящен геополитике, причем в том бесконечно редком ключе, что идеально вписывается в мою собственную модель современного мира. Небольшая выдержка из "Основных принципов информационной политики" сайта, проливающая свет на весь подход: "Игнорирование новостного мусора из СМИ - "светской жизни", будней "реалити-шоу" и прочих явлений массовой культуры; криминальной хроники; скандальных сюжетов о чиновниках, проституции и "сексуальных меньшинствах". Принципиальное неприятие "желтизны" в любых видах". Освещаемая тематика - романс Америки с Осамой, трения с Грузией, война в Ираке, доктрина Блэра, исламский банкинг (тот самый, в котором нельзя начислять проценты за кредит), политика Уго Чавеса и т. п.
Теперь - обещанная софтина. Пару лет назад я рассказывал читателям об одной из замечательных астрономических (не путать с астрологическими!) программ - Starry Night канадской компании Imaginova. Речь шла о релизе Starry Night Enthusiast 5 (категория New To Astronomy), которым я наслаждался несколько лет. Не так давно программа обновилась до версии 6, и мне посчастливилось тестировать ее самый полный вариант - Starry Night Pro Plus 6 (категория Experts).
Сказать, что я потрясен, значит ничего не сказать. Добавление одной цифры к номеру релиза в случае Starry Night служит пожизненным укором всем тем шареварным халтурщикам, что штампуют обновления, отличающиеся лишь новыми алгоритмами и ухищрениями защиты. Шестой релиз Starry Night - самая настоящая революция! Список нововведений огромен и занимает несколько страниц, поэтому я не буду утомлять читателя, тем более что он вряд ли подготовлен к адекватному восприятию астрономических реалий. Назову лишь главное - то самое революционное - новшество: полноцветовое цифровое фотографическое изображение всего звездного неба, видимого с Земли! Если в предыдущих версиях Starry Night, как и во всех прочих астрономических программах, мы имели дело с векторной симуляцией, то теперь видим так называемую AllSky CCD mosaic - цельную панораму неба, составленную из двадцати тысяч снимков, сделанных мощнейшим телескопом, размером 6,44 млрд. пикселов (съемка велась с разрешением 12 арксекунд на пиксел)! Просмотр любого уголка Вселенной возможен на пяти уровнях зуммирования, открывающих совсем уж неописуемые зрелища: как вам 24-битная цветная фотокарта всей поверхности Марса, снятая с высоты полета космического зонда? Или матушка Земля с разрешением до 1 км (здравствуй, GoogleEarth!)? Неудивительно, что пять лет усилий, направленных на создание нового революционного релиза, отлились в 11 Гбайт информации, ложащейся божественно желанным грузом на жесткий диск.
Специально не дописываю последнюю тысячу знаков "Голубятни", оставляя место для лишнего скриншота!
ТЕХНОЛОГИИ: Великие раскопки и великие вызовы
Автор: Леонид Левкович-Маслюк
Наука об извлечении содержания из гигантских массивов данных становится все более изощренной, а задачи, за которые берутся мастера такого поиска, - все более человечными.
ЦИФРА
Агентство IDC прогнозирует, что объем цифровой информации в мире достигнет тысячи экзабайт к 2010 году,
то есть по сравнению с 2006 годом увеличится в 6 раз (1 экзабайт = 260 байт, или
миллиард гигабайт).
Прочесыванием гор информации в поисках скрытых в них закономерностей люди занимаются уже многие века. Но только с появлением компьютеров, баз данных, локальных и глобальных сетей понятие "больших массивов" обрело нынешний смысл, а их вдумчивое сканирование, когда-то занимавшее лишь шпионов и каббалистов-мистиков, позже - социологов культуры и теоретиков медиа с их страстью к контент-анализу, превратилось в индустрию. Причем индустрию высокотехнологичную даже на фоне инфотеха. Ведь найти смысловые связи в новостной заметке, правильно ответить на элементарный вопрос - о чем она, к какому тематическому классу ее причислить, - сложнейшая, как оказалось, задача для машины. С другой стороны, даже простая для машины, но неподъемная и невыносимо тоскливая для человека задача механического сканирования текста с одновременной сортировкой имен, названий, ключевых слов часто оказывается очень и очень востребованной. А если еще и выйти за пределы мира текстов, попытаться научить компьютер понимать, о чем люди говорят (хотя бы в телефонных переговорах с туристическим бюро), что они показывают друг другу на фотографиях и видеолентах, - станет ясно, что колоссальный спрос на результаты таких исследований сталкивается с колоссальными трудностями в их реализации.
Вот где-то между этими молотом и наковальней и зародился современный датамайнинг (data mining, буквально - раскопки данных, или добыча чего-то из данных), в котором научные и индустриальные компоненты трудно разделить. В 1998 году научную зрелость этой отрасли подтвердило создание Special Interest Group (SIG), Группы особых интересов, в рамках авторитетной международной организации по компьютерным исследованиям ACM (Association for Computing Machinery, Ассоциация по вычислительным машинам).
Что такое SIG? Вспомним о самой популярной из подобных групп - SIGGRAPH. Ежегодные мегаконференции, на которых делаются доклады, читаются лекции и демонстрируются высшие достижения компьютерной графики, анимации и сопутствующей всему этому математики, других наук и технологий, известны далеко за пределами сообщества специалистов. Другие SIG’и (сейчас их тридцать четыре, в том числе SIGART [искусственный интеллект], SIGMOD [базы данных], SIGPLAN [языки программирования], SIGSOFT [разработка ПО] и др.) не так знамениты среди широкой публики, но заслужили уважение специалистов, а проводимые ими конференции, издаваемые журналы являются индикаторами качества в своих областях.
На наши вопросы о теории и практике датамайнинга ответил Григорий Пятецкий-Шапиро (Gregory Piatetsky-Shapiro), основатель и председатель SIGKDD - Группы особых интересов, посвященной "открытию знаний в данных" (Knowledge Discovery in Data).
ОЦЕНКА
Удачные статистические модели позволили выявить потенциальные "налоговые убежища" обеспеченных американцев объемом в сотни миллионов долларов.
Какие новые разделы датамайнинга (ДМ) появились в последние годы? Какие из них самые перспективные для бизнеса, для исследовательской работы?
- Одно из замечательных новых полей исследований - анализ связей (link analysis). Приложения весьма обширны, от биоинформатики до выявления преступлений, от маркетинга до исследования социальных сетей. Вокруг Web 2.0 сейчас столько шума именно потому, что он очень эффективно использует веб как инструмент социальных связей, - а это придает все большую значимость анализу этих связей.