Журнал «Компьютерра» № 11 от 21 марта 2006 года - Компьютерра Журнал 619 6 стр.


— Хороший сайт должен быть не только хорошо нарисован, но и хорошо виден в Интернете, — добавляет Волож. — Если Интернет — это город, а поиск — въездные ворота, то логично, если улицы сходятся к этим воротам. Структура города должна подстраиваться под них, и это нормально, когда дома стоят вдоль улиц, а не поперек.

— Недовольные клиенты иногда обвиняют нас в том, что мы их обманываем, — снова Себрант. — Мол, все мы сделали правильно, CTR большой, а покупателей нет. Заходишь к такому на сайт и понимаешь — правда не купят. Невозможно купить, сайт так сделан. А если бы с этим сайтом поработал хороший оптимизатор, то, глядишь, и реклама работала бы лучше.

У Сегаловича на сей счет особое мнение.

— Отношение к оптимизаторам в целом нисколько не смягчилось. Люди, которые занимаются баном, банят, как и раньше. Больше того, сегодня у них появились более совершенные автоматические инструменты…

(Себрант: Сережу Петренко взяли директором украинского «Яндекса». О какой нелюбви к оптимизаторам вы говорите?!)

…но при этом мир перестал быть черно-белым. Границу ведь провести почти невозможно. Многие, условно говоря, нормальные люди используют способы раскрутки, которым трудно дать однозначную этическую оценку. Мы с этим фактом примирились, приняли, так сказать, к сведению.

Насколько эффективна сегодняшняя технология оптимизации под «Яндекс»? Хорошо работает?

— Работает. Но мы делаем так, чтобы «черные методы» работали похуже.

Яндекс.Украина

Нынешний директор «Яндекс.Украина» Сергей Петренко действительно известен прежде всего как оптимизатор и главный редактор сайта SearchEngines.ru.

— Украинский офис работает по двум направлениям, — рассказывает Аркадий Волож, — Во-первых, они там развивают портал (сервисы на Украине и в России одни и те же, но сама домашняя страничка yandex.ua преднастроена на украинскую аудиторию). Во-вторых, на них лежит работа с рекламодателями.

— Офис нужен, чтобы принимать гривны — и делать это корректно с точки зрения украинского законодательства и удобно с точки зрения украинского рекламодателя, — поясняет Андрей Себрант. — Кроме того, тонкая настройка сервисов для Украины из Москвы невозможна. Мы не способны оценить, насколько адекватен контент, а Петренко живет там, читает местную прессу, чувствует медиапространство. Простой пример: в проекте «Города» появилась Украина. Мы для начала решили сделать пять городов, но как их правильно выбрать, находясь в Москве? Как узнать, чем гордятся жители, скажем, Луганска и почему они часто ищут в «Яндексе» завод «Линос» или Стаханова? Таких вопросов возникает множество. И без помощи Сережи сделать проект, за который нам не стыдно перед украинцами, было бы трудно.

Технологически преднастройка уаndex.ua делается почти так же, как обычные региональные настройки для городов России. Вся разработка по-прежнему ведется в Москве, и планов расширить штат программистов за счет украинских разработчиков у компании, судя по всему, пока нет. Справляются и сами — никаких сложностей с включением украинской морфологии у «Яндекса» не возникло.

— Да просто лицензировали словарь и все, — разводит руками Илья Сегалович, но уже следующий вопрос заставляет его задуматься.

А другие языки добавлять планируете?

Сегалович смотрит на Себранта. Себрант смотрит на Воложа. Волож пожимает плечами и улыбается.

— Не знаю.

Казахстан?

— Казахстана не будет, — отрицательно качает головой Сегалович, — нет машинных морфологий хороших.

Яндекс.Деньги

Непосредственно о бизнес-составляющей «Яндекса» рассказывает, естественно, Аркадий Волож.

— Наш бизнес состоит из двух частей. Первая — это оказание услуг онлайн-аудитории в 20 млн. человек. Вторая — работа с десятками тысяч рекламодателей. Иными словами, есть портал, построенный вокруг поиска, и есть бизнес, заключающийся в правильном нацеливании правильных рекламодателей на правильную аудиторию. Правильным средством для этого опять же оказался поиск.

По поиску в портале вся статистика открыта. Шестьдесят процентов пользователей Интернета пользуется поиском на «Яндексе» (еще 20 процентов у «Рамблера», по шесть процентов у Google и Mail.ru). От контекстной рекламы, которая завязана на услугу поиска, мы получаем порядка 80 процентов всех доходов. Остальное это баннеры и всякая мелочевка типа продажи ПО — «Спамообороны» и «Яндекс.Сервер». По сравнению с другими порталами баннеры для нас — сравнительно небольшая часть дохода, но, возможно, в этом году что-то изменится. Большие рекламодатели — в частности, Video International — собираются в этом году прийти в Интернет. Если это произойдет, то рынок будет расти не только за счет контекста, как сейчас, но и за счет медийной рекламы. И через год-два доля Интернет-рекламы от рекламного рынка будет не два процента, как сейчас, а четыре.

«Яндекс.Деньги» не считаем?

— А там нулевой доход. Не совсем, конечно, ноль, но так… Внизу, на радарах. «Яндекс.Деньги» растут очень быстро, но пока потребляют все, что зарабатывают.

Введение веб-интерфейса благотворно повлияло на популярность проекта?

— Дааааааааа! — Это Себрант на минутку оторвался от ноутбука и включился в разговор.

— Введение веб-интерфейса расширило аудиторию «Яндекс.Денег» за счет офисных людей, — кивает Волож. — До этого нашей платежной системой пользовались в основном веб-мастеры, гики, люди, которые в Интернете давно. А сейчас пришли простые офисные сидельцы. Теперь им удобно. Сдвиг виден по тому, как сместились платежи. Раньше пользователи платили либо за интернет-услуги (хостинг, к примеру), либо друг другу. Сейчас же пошли и коммунальные платежи, и телефон. Изменилась и средняя сумма платежа — у пользователей «новой волны» она меньше.

Яндекс.Поиск

Место действия: большая переговорная в старом офисе «Яндекса».

Действующие лица те же.

Сегалович: Наша задача — обеспечить пользователю идеальную подборку ссылок на его запрос, как мы его пониманием. То есть все упирается в уровень понимания запроса. А это понимание обусловлено не только текстом, но и контекстом запроса. Например, география пользователя или тематический класс, к которому этот запрос относится по ассоциациям запроса других пользователей.

Вот классический пример. Человек вводит в строку поиска слово «жизнь». Что выдавать? Что он ожидает увидеть?

«КТ»: Да какая разница? Все равно понятно, что этот человек — идиот.

Сегалович: Вы почти угадали. Но этот запрос можно понять. Оказывается, люди так ищут газету «Жизнь».

«КТ»: А нет опасности, что вы додумаете что-то не то?

Сегалович: Конечно, есть. Но это статистический процесс, и мы обязаны давать лучшую аппроксимацию, чем сейчас. Наша задача — как можно точнее (с помощью статистики, лингвистики, понимания запроса на уровне технологии отвечания на вопросы) понимать, что именно человек спросил, и максимально точно ответить на его запрос.

«КТ»: А вообще, с поисковым движком много работы? Или все основные задачи уже решены и теперь идет подкрутка?

Волож: (бледнеет от возмущения) Да вы что, это же главный проект компании…

Сегалович: Работы море. Во-первых, мы должны лучше научиться распознавать истинную ценность информации и лучше отличать оптимизированные страницы от неоптимизированных. Кроме того, идет работа с ядром, улучшение базовой функциональности. Мы видим, что и где можно улучшить. Мы хотим, чтобы качество ответов повышалось, и мы знаем, где мы плохо отвечаем.

«КТ»: Это где, например?

Сегалович смотрит на Воложа. Волож смотрит на Себранта. Себрант смотрит в ноутбук.

Сегалович: Ну, если в общем виде, то мы когда-то первыми стали аккуратно искать по всем словоформам. И концептуально это очень правильная вещь, которая работает у нас почти в неизменном виде уже много лет. Но иногда ее полезно отключать. Мы умеем это делать, но не на уровне ядра. Вот вам одно направление. На уровне ядра будем также работать над поддержкой многоязычности, постараемся реализовать возможность включения в запрос не только букв, но и специальных символов. Кроме того… (Воложу) Мы это не анонсировали еще, да?

Далее следует бурный обмен междометиями и жестами, которые должны пояснить собеседнику, какое именно «это» имеется в виду. Через минуту Волож, воспользовавшись знанием лингвистики и глубоким пониманием контекста, пожимает плечами: мол, сам решай. Сегалович решает ответить, но полезной информации в его ответе чуть больше, чем на среднестатистическом дорвее.

Сегалович: У нас на новостях справа есть колоночка, в которую выводятся имена людей, упомянутых в сюжетах. В общем, в этом направлении будем работать.

Себрант: Расскажи лучше про географию.

Сегалович: У нас на новостях справа есть колоночка, в которую выводятся имена людей, упомянутых в сюжетах. В общем, в этом направлении будем работать.

Себрант: Расскажи лучше про географию.

Сегалович: Речь вот о чем. Мы в ближайшее время собираемся включить более детальный географический каталогизатор. Нынешний основан только на каталоге, а мы уже научились распознавать сайты и страницы на лету — исходя из IP-адреса, содержания страниц и других факторов. Благодаря этой технологии мы резко увеличим полноту локализованного поиска — текущий алгоритм все же сильно сужает спектр сайтов, доступных для регионального поиска. Объем информации увеличится в разы. Кроме того, география будет помогать отвечать на запрос, который, по нашим представлениям, является географически локализованным. Если человек ищет компьютер в Санкт-Петербурге…

Волож: (перебивает) …то мы будем выдачу немножко подстраивать.

Сегалович: Это тонкий вопрос, будем ли мы подстраивать выдачу. Но это качественно новый уровень продвижения в регионы. У нас, конечно, есть «Яндекс.Города», но это поверхностная локализация. А теперь вся база будет промаркирована посайтно, постранично — что к какому региону относится.

Волож: И если для заграничных сайтов регион — это Россия, то для нас регион — это, скажем, Новосибирская область.

Сегалович: Плюс работа с тематической классификацией. Более глубокое понимание, к какой теме относится сайт. И использование этого понимания при формировании выдачи. В общем, работы много. С «Картинками» работа идет, будем делать новую версию. Поправим, например, ранжирование, на «Картинках» оно пока не очень хорошее.

«КТ»: А насколько это все востребовано? Есть же масса людей, которые днюют и ночуют на одном портале, потому что на нем есть все, что им нужно для жизни.

Сегалович: У меня ощущение, что человек — исключительно требовательное существо. Лично я жутко недоволен «Яндексом». Я к нему отношусь одновременно и с любовью, и с ненавистью, и мне очень стыдно за огромное количество недоработок и недоделок.

Яндекс.Дети

Есть какие-то сервисы, которыми вы недовольны?

— Есть любимые, но больные дети, — первым отвечает Илья.

Это, например, кто?

— Ну, например, «Открытки», — печально произносит Себрант.

Илья Сегалович называет «Закладки» и «Народ».

— Но и до них дойдут руки, — философски замечает Волож.

Закладки, кстати, жалко. Идея ведь верная, что блистательно доказал несколько лет спустя del.icio.us.

— Да, любимые, — соглашается Сегалович, — да, жалко.

Аркадий Волож, еще минуту назад хладнокровно комментировавший естественный отбор, благодаря которому выживают лишь самые сильные и востребованные сервисы, неожиданно с какой-то ностальгией произносит: «2001 год. Хороший сервис».

— Модель была неправильная, как мы теперь понимаем, — говорит Сегалович. — Там нет тегов и круга друзей. Но я надеюсь, что мы сделаем revival.

— Мы потихонечку, — вступает Волож. — Руки-то у нас доходят до всего, но «только Аллах может все, и даже Аллах не может все сразу». Главный вопрос, который решается на еженедельных менеджерских встречах, — что мы НЕ делаем. Мы растем очень быстро, у нас уже работает больше трехсот человек, но все равно не успеваем.

«Поиск по блогам и форумам», по мнению присутствующих, — это любимый и здоровый ребенок. Довольно оригинальное на первый взгляд решение — объединить поиск по блогам с поиском по форумам — вызвано тем, что в «Яндексе» особых различий между блогами и форумами не делают: «Первое сообщение форума ничем не отличается от первого сообщения в комьюнити» (Сегалович); «Форумы и блоги — это почти один формат» (Волож). Еще один довод в пользу объединенной индексации — полезность форумов: «Сообщество ru_seo на порядки менее интересно форума на Search-Engines.ru» (Себрант).

— По-хорошему, нужно индексировать все, включая комментарии, что в блогах мы делать пока не умеем, — говорит Сегалович, — но при поиске следует понимать разную ценность разных частей — очевидно ведь, что первое сообщение форума важнее всех остальных. Форумы отдают RSS так, как они его отдают, и отрезать первое сообщение от остальных трудно. Но мы уже умеем искать отдельно по форумам и отдельно по блогам (это появится в ближайшей версии). Они у нас не в одной куче, это только так кажется.

Форумы и блоги отделены от «большого робота», потому что важный признак, объединяющий форумы и блоги и четко отделяющий их от всего остального, — это время. Даже выдача на запрос по умолчанию сортируется по времени.

— Вот эта временная шкала совершенно перестраивает мозги, — продолжает Илья, — это не алгоритм PageRank, а совершенно иная мера.

— Неслучайно мы по умолчанию выдаем результаты, отсортированные по времени, — замечает Андрей Себрант. — Трехлетней давности сообщение в форуме представляет скорее исторический интерес, каким бы релевантным оно ни казалось.

Несмотря на всю полезность поиска по блогам он явно не дотягивает до зарубежных аналогов и в первую очередь — до Technorati. Аркадий Волож с такой оценкой не согласен, но даже если и так, отмечает он, сервис не заброшен, работа над ним ведется очень активно. Илья Сегалович идет еще дальше.

— Technorati — лишь первый шаг в нужном направлении. Там есть задел, но нужно двигаться вперед. В блогах часто попадается ценная информация, но как ее оттуда извлечь? Мы уже решили похожую проблему с новостями, создав полностью автоматизированный сервис (руками только добавляются сами ресурсы). Ни один редактор не пострадал. Такой должности, как журналист, в «Яндексе» нет. Вот.

В голосе Ильи слышится такая неподдельная радость, что оба редактора нервно поправляют свои розовые кофточки, ожидая в следующую минуту услышать классическое «А теперь встали и вышли отсюда».

— Что касается блогов, — продолжает суровый директор по технологиям, — то есть чудовищный соблазн сделать что-то интересное. Прошлый год уже показал, что в блогосфере есть настоящие жемчужины, которые нужно доносить до внимания общественности. Они перетекают в новости в полуразмытом виде, и нужно научиться их находить и выделять. Вопрос — как это сделать. Технически это очень нетривиально.

Яндекс.Конкуренты

Место действия: большая переговорная в старом офисе «Яндекса».

Действующие лица те же.

Волож: Я против разговоров о том, что Google придет в Россию. Черная рука идет по улице, черная рука стучится в ваш подъезд…

Сегалович: (перебивает) Черный ящик на семи колесиках…

Волож: Ну хорошо. В разных лагерях рассказывали по-разному. Google приходит в Россию? Да он в 2001 году сюда пришел, как только открыл Google.ru! И посмотрите статистику — что-то принципиально изменилось? Они в прошлом году потрясающе выросли, кстати. С пяти до шести процентов. Без шуток — это 20-процентный рост.

Сегалович: Точно так же, как «Яндекс» пугают приходом Google, Google пугали Microsoft. Мол, придет страшный черный ящик на семи колесиках и всех раздавит, как клопов. MSN в прошлом году сделал свой поиск. И что? Пять лет кричали о том, что Microsoft сделает лучший в мире поиск, Microsoft перетащила себе большую команду из Китая, разработала, выпустила — и в результате доля MSN в поиске упала с пятнадцати процентов до семи.

«КТ»: А кстати, как вы «отвоевали» Mail.ru у Google?

Волож: Ничего про это не знаю. Они сами к нам пришли. И это был большой подарок судьбы. А почему? Видимо, им понравилось, сколько денег мы собираем.

«КТ»: Просто немного странно. Они же к движку Google серьезно относились, даже морфологию русскую прикрутили.

Сегалович: О, тут как раз ничего странного нет. Алексей Сокирко, который делал русскую морфологию в Mail.ru для движка Google, теперь работает у нас.

«КТ»: А насколько качество поиска коррелирует с популярностью поискового сервиса?

Себрант: Ни насколько.

Волож: Да нет, если наш поиск долго будет хуже гугловского или рамблеровского, то люди начнут уходить.

Себрант: Но не наоборот. Если предположить, что гугловский поиск будет на два процента лучше, то… Во-первых, что значат эти два процента? Во-вторых, что значит «лучше»?

Волож: Неизвестно, как устроена эта материя. Почему пользователи приходят туда, а не сюда — никто не знает.

Сегалович: Ну нет, я знаю.

Волож: У тебя теории. У всех свои гипотезы. Я вот считаю, что просто не надо вредить. Надо стараться делать хорошо.

Сегалович: В конце 2004 года у нас был небольшой кризис, из которого мы вышли, и в течение всего 2005 года последовательно улучшали робота. Робот у нас очень приличный. По скорости занесения в базу мы опережаем конкурентов от нескольких часов до суток.

Назад Дальше