Скажем то же другими словами: управление производительностью в том виде, как его практикует большинство организаций, превратилось в зажатый в жесткие рамки правил, бюрократизированный процесс, скорее «вещь в себе», а не инструмент, реально способный управлять производительностью. Исполнители его ненавидят. Менеджеры от них не отстают. Даже кадровые отделы его терпеть не могут.
Сосредоточенность на процессе вместо цели создает коварную возможность для лентяев манипулировать системой. Руководитель отдела продаж Дон, с которым я когда-то работал (на самом деле его зовут иначе), взял за привычку заходить ко мне в кабинет за три месяца до того, как по плану предполагались выставление оценок и выдача премий. Каждый раз в октябре он начинал ко мне подкатывать. «Похоже, год выдался сложным, но мы работаем в поте лица, чтобы справиться с трудностями». В ноябре риторика менялась: «Ребята из отдела продаж добились больших успехов, чем кажется: ведь в экономике сейчас нелегкие времена». В декабре нам расшифровывали все в деталях: «Отдел малого бизнеса выходит на 90%, но господи, ребята же сражались как львы, чтобы заключить все эти сделки. И кстати, я не верю, что в январе кто-то мог поставить такие сумасшедшие задачи. Это просто невыполнимо!»
Я не осознавал, какую игру ведет Дон, пока однажды мы не решили выплатить премии на квартал раньше обычного, а он об этом ничего не знал. В тот раз он появился в первый раз со своими докладами на полгода раньше. Честно говоря, тот факт, что он всегда старался сглаживать острые углы, превратил его в отличного коммивояжера; но весь этот эпизод открыл мне глаза на то, насколько система подвержена манипуляциям.
На самом деле никто не в восторге от текущего состояния дел с управлением производительностью. Компании WorldatWork и Sibson Consulting провели опрос среди 750 руководителей высшего звена в области управления персоналом и выяснили, что 58% оценивали свои системы управления производительностью на троечку или хуже. Только 47% считали, что система помогает организации «достигать стратегических целей», и около 30% чувствовали, что сотрудники верят в систему108.
На сегодняшний день самый распространенный выход — сдаться на милость победителя.
Adobe, Expedia, Juniper Networks (производитель компьютерной техники), Kelly Services (агентство по предоставлению временного персонала) и Microsoft отказались от учета показателей рабочей эффективности. Аргументация Adobe звучит так.
В ходе поездки в Индию страдающая от недосыпа [глава департамента HR Adobe Донна] Моррис дала интервью для статьи журналу Economist. Чувствуя себя «на грани», Моррис проговорилась о растущем желании отменить аттестацию персонала. Чтобы по горячим следам обосновать свою позицию, Моррис вместе с департаментом Adobe по связям быстренько опубликовала запись в блоге, которую потом перепостили в локальной сети компании. Сотрудники залпом бросились читать сообщение, которое стало одним из самых популярных материалов интранета Adobe. В компании разразилась бурная дискуссия на тему неудовлетворенности аттестацией персонала. По версии Моррис, основополагающая мысль звучала так: сотрудники «разочарованы тем, что считали недостаточным признанием их вклада в дело компании». Ей было очевидно, что предпринять.
«Мы очень быстро решили отменить процесс аттестации. Это означало, что больше не будет ежегодных формальных письменных процедур, — пишет Моррис. — Более того, следовало бы отменить и показатели рабочей эффективности, чтобы людей более не заботило, какие ярлыки на них навешивают».
Вместо традиционной процедуры оценки персонала Adobe летом 2012 г. внедрила так называемую The Check-In — неформальную систему обратной связи на постоянной основе в режиме реального времени109.
Интуиция подсказывает, что это многообещающий подход. Работники недовольны, так давайте выбросим на помойку систему, которая им не нравится. Проще некуда.
Разве не лучше получать обратную связь постоянно, а не ждать целый год?
Но нет никаких подтверждений тому, что системы, которые нравятся, будут эффективнее. Академические исследования имеют один недостаток: непоследовательное осуществление измерений, когда «режим реального времени» может значить что угодно, от «немедленно» до «несколько дней спустя». Большинство систем обратной связи в режиме реального времени быстро превращаются в систему «ай молодца!», поскольку люди предпочитают говорить друг другу только приятное. Скажите, как часто ваши отзывы обрабатываются и используются так, чтобы реально повлиять на изменение в чьем-то поведении? Фраза «ты отлично поработал на этом совещании» звучит гораздо более обобщенно, чем «я видел, что ты заметил, когда клиент отодвинулся от стола и потерял интерес к разговору, а ты отреагировал, спросив, нет ли у него замечаний. Ты отлично поработал, когда снова привлек его внимание. Продолжай в том же духе, обращай внимание на язык тела участников совещаний».
Гораздо проще ограничиваться общими приятностями. Так обычно все и поступают.
Постановка целей
Даже в Google система далека от идеала. Согласно ежегодным опросам «Гуглгейст», удовлетворенность управлением производительностью всегда оценивалась ниже многих прочих областей. На начало 2013 г. всего 55% гуглеров дали этому процессу благоприятную оценку. Показатель, конечно, выше, чем типичные 33% в других компаниях, но все же хорошего мало. Две основные жалобы звучат так: процедура занимает слишком много времени, к тому же она недостаточно прозрачна, что сразу же поднимает проблему справедливого подхода.
Итак, что мы делаем правильно, чтобы наши сотрудники были в два раза довольнее системой, чем в других местах, — но все же недостаточно? И что мы делаем неправильно?
Система управления производительностью Google всегда начиналась с постановки целей. В начале 2000-х член совета директоров Джон Доерр познакомил меня с методом, который с большим успехом использовала Intel. Он назывался OKR (Objectives and key results) — «Цели и ключевые результаты». Результаты должны быть специфичными, измеримыми и верифицируемыми; если вы добились всего нужного, то достигли своей цели. Например, если цель — улучшить качество поиска в интернете на х процентов, значимыми ключевыми результатами будут улучшенная релевантность поиска (полезность результатов для пользователей) и период ожидания (скорость выдачи результатов). Важно иметь систему мер качества и эффективности, потому что иначе инженеры будут решать одну проблему за счет другой. Недостаточно выдать идеальный результат, если это займет три минуты. Нужно обеспечить одновременно и релевантность, и скорость.
Мы намеренно ставим амбициозные цели, которых достичь не сможем ни при каких обстоятельствах. Если вы достигаете всех целей — значит вы недостаточно агрессивно подходите к целеполаганию. Астро Теллер[61], куратор Google[x], нашей команды — разработчика Glass (это очки-компьютер с экраном размером с ваш ноготь) и самодвижущихся автомобилей, описывает это так: «Хотите, чтобы ваша машина двигалась со скоростью 80 км в час, — прекрасно. Можно немножко ее усовершенствовать. Но если я захочу, чтобы она проехала 800 км на 4 л бензина, вам придется начать работу с нуля». Не все наши цели столь агрессивны, но в этом подходе есть мудрость. Как часто подчеркивает Ларри: «Если вы поставите сумасшедшую, амбициозную цель и не сумеете ее достичь, вы все равно придете к чему-то замечательному».
Поэтому в начале каждого квартала Ларри ставит OKR, побуждая всех прочих сделать так, чтобы их личные OKR подтягивались к общегугловским. Мы не позволяем идеальному становиться врагом хорошего. Если корпоративные цели вам известны, легко провести сравнение со своими собственными. Если они не совпадают — либо тому есть причина, либо вам придется изменить ориентиры. Кроме того, все персональные OKR доступны всем сотрудникам на корпоративном сайте — рядом с номерами телефонов и адресами офисов. Важно иметь возможность узнать, чем заняты другие люди и команды. Когда есть возможность увидеть общую картину целей Google и оценить свое место в общем процессе, мотивация сразу повышается. Наконец, OKR Ларри и его квартальный отчет об успехах компании — стандарт прозрачности информации и высокая планка наших целей.
Что касается целей, то академические исследования согласны с вашей интуицией: наличие целей улучшает результативность110. А вот часами заниматься распределением целей по уровням организационной иерархии — увы, бесполезно111. Времени это занимает много, и все равно слишком сложно обеспечить взаимное соответствие всех поставленных целей. Мы применяем рыночный подход, который предусматривает сближение целей в долгосрочной перспективе, поскольку OKR высшего уровня известны, а остальные видимы. Команды, идущие не в ногу, сразу выделяются, а немногочисленными ключевыми инициативами, которые затрагивают всех, достаточно легко управлять напрямую. Что ж, и на том спасибо…
Измерение рабочей эффективности
До 2013 года эффективность каждого гуглера оценивалась по 41 критерию. Оценка производилась по шкале от 1,0 (ужасно) до 5,0 (великолепно). Грубо говоря, балл ниже 3,0 означал, что вы время от времени или постоянно не оправдываете ожиданий; от 3,0 до 3,4 — оправдываете; от 3,5 до 3,9 — превышаете ожидания; от 4,0 до 4,4 — намного превышаете; от 4,4 до 4,9 — «стремитесь к выдающимся успехам»; ну, и 5,0 — «великолепно». Средний балл составлял 3,3–3,4, а те, кто имел средний балл 3,7 или выше несколько кварталов подряд, часто получали повышение. В общем-то, ничего кардинально нового.
Рейтинги — не панацея112. Наша 41-балльная шкала — плод нашего инженерного мышления. Различие между оценкой эффективности работника в 3,3 и 3,4 балла — вполне удовлетворительная точность. А если усреднять рейтинги за много кварталов, можно добиться почти неуловимой точности — от 3,325 до 3,350. Если вы считаете, что наши рейтинги доходят только до трех знаков после запятой, знайте, что на самом деле у нас имелась шкала для 4,001 балла! Мы разработали безумно сложную формулу, чтобы сотрудники были уверены: если твой рейтинг хоть чуточку выше, чем у кого-то еще, ты и вознаграждение получишь хоть ненамного, а больше. Но все это не сработало. Несмотря на бесчисленные часы, потраченные на постановку рейтингов, когда приходило время для раздачи повышений или премий, в двух третях случаев менеджеры или другие оценщики меняли решения о вознаграждениях. Наши менеджеры каждый квартал тратили тысячи часов рабочего времени, присуждая рейтинги, которые оказывались до смешного точными и при этом не становились безошибочной основой для определения размеров жалованья.
То же четыре раза в год происходит и с измерением производительности. Мы взяли этот метод на вооружение по двум причинам: потому, что в годы стремительного роста он помогал управлять работой персонала, и потому, что мы хотели сделать так, чтобы оценки эффективности сотрудников всегда как можно точнее отражали реальное положение дел. И все же мы поняли, что каждый год тратим до 24 недель рабочего времени на присуждение, калибровку (ниже я поясню, что это такое, — это важно) или обнародование рейтингов. Кое-кто из менеджеров заявлял, что периодичность процесса им по душе, потому что побуждает контролировать тех, чья результативность внезапно снизилась. Но это была только отговорка. Ведь никто не запрещал им контролировать отстающих и без формальных процедур; а какая трата времени — опрашивать 50 тыс. народу, чтобы выявить пять сотен, которые плетутся позади.
Большую часть 2013 года мы пытались найти лучший метод. Мы исследовали варианты, от отсутствия классификации должностей по уровням до системы с 800 таких уровней, чтобы каждый или почти каждый имел моральный стимул ожидать повышения каждый квартал. Мы рассматривали возможность оценивать производительность раз в год, квартал, месяц или в режиме реального времени. Мы исследовали рейтинговые системы со шкалами и в три балла, и в пятьдесят. Мы спорили о том, стоит ли обозначать каждую категорию производительности числом или дескриптором, и даже обдумывали вариант незначащего дескриптора, чтобы люди не зацикливались на ярлыках. Я сам предложил несколько вариантов, где рейтинговые уровни именовались «аквамен», «красный треугольник» или «манго».
Суть системы заключалась в том, чтобы побудить людей не зацикливаться на ней, поэтому использовались бессмысленные названия. Конечно, люди все равно будут приписывать ярлыкам значения. И, вероятно, начнут с предположения, что «Аквамен» — это очень плохо (он всегда проигрывает крутым героям). Мы созывали организационные комитеты и консультативные комиссии, даже выносили некоторые вопросы на общее голосование. В итоге стали ясны три момента.
Гуглер Пол Коэн создал эту иллюстрацию одного из моих предложений113
1.-Консенсус — недостижимая мечта. В отсутствие четких доказательств каждый считал себя экспертом и всякий вариант находил горячих сторонников. Люди имеют сильные убеждения по вопросам вроде того, сколько категорий производительности лучше: пять или шесть. Даже при попытке изменить наименее популярный в компании процесс не было никакой возможности найти решение, удовлетворяющее всех. Текущая система не нравилась почти никому, но любое другое решение казалось всем еще хуже!
2.-Люди очень серьезно подходят к проблеме управления производительностью. Например, мы проводили среди гуглеров опрос, какие названия дать категориям производительности, и получили более 4200 отзывов. Самой явной тенденцией было стремление к серьезности и ясности, а вовсе не причудливости.
3.-Нужен был эксперимент. В отсутствие проверенных систем нам пришлось разработать собственную, поработать с руководителями всех направлений Google и помочь им протестировать разные идеи. Группа YouTube попыталась рассортировать всех в порядке убывания эффективности и обнаружила, что один из двух наиболее эффективных сотрудников принадлежал по должности к среднему уровню. Потом он получил один из двух крупнейших пакетов акций в виде премии для группы YouTube. И хотя факт этой особой награды не афишировали, все узнали, что такие расхождения между уровнем должности и вознаграждением порой случаются[62]. В остальных подразделениях мы старались использовать шкалу из пяти категорий эффективности, которую менеджеры восприняли на 20% лучше, чем старый 41-балльный подход.
Не могу найти достаточно ярких выражений, чтобы рассказать вам, как трудно пришлось тогда команде People Operations. Наша работа, конечно, не вопрос жизни и смерти. Но люди возмущались, кричали, даже хлопали дверью. Один из вызовов Google, с которым мы постоянно сталкиваемся, — та великая свобода, которую мы даем гуглерам, потому что обращаем внимание на факты, а гуглеры огромное значение придают справедливости и обращению с людьми. Поэтому изменения вроде тех, о которых я вам рассказываю, — поистине геркулесов труд. Каждая из команд, которые мы опрашивали, выражала недовольство существующей системой — и каждая сопротивлялась, когда предлагалось что-то новое. Только в подразделении YouTube нам высказали дюжину различных идей о том, какие новые рейтинговые системы попробовать. Я очень горжусь той спокойной настойчивостью и тщательностью, с которыми команда People Operations продиралась через чащу всех этих перемен. Не менее благодарен я и тем командам, которые работали с нами бок о бок, помогая выбросить на свалку 15 лет корпоративных традиций, чтобы освободить место новому.
Взяв за основу проведенные эксперименты, в начале 2013 г. мы отказались от квартальных рейтингов в пользу полугодичных. Многие брюзжали и ворчали, но хотя бы в нас не кидались ничем тяжелым. Зато временные затраты сразу сократились наполовину.
В конце 2013 г. мы перевели более 6200 гуглеров, представляющих примерно 15% компании, на пятибалльную рейтинговую шкалу: «нуждается в улучшении», «стабильно оправдывает ожидания», «выше ожидаемого», «намного выше ожидаемого» и «великолепно». Похоже на те названия, что были раньше, но рейтинги более последовательны.
Мы действовали согласно одному из ключевых догматов медицины: Primum non nocere. Не навреди. На первом этапе изменений нашей целью было добиться такого же уровня удовлетворенности, справедливости и эффективности процесса, что и при старой рейтинговой шкале. Мы выяснили, что как только удалось преодолеть изначальный скептицизм и разъяснить новую шкалу производительности («А почему это мой балл больше не 3,8? Я точно наработал на 3,8!»), мы сэкономили время, которое раньше приходилось тратить на стенания по поводу десятой доли балла. И менеджеры вынуждены были вести более осмысленные беседы с сотрудниками, а не прятаться за высказываниями вроде «В этом квартале ваш балл вырос на 0,1. Отличная работа, продолжайте в том же духе».
И каким же облегчением было увидеть, что снижение «прецизиозности» не нанесло нам вреда. Мы провели сравнение между гуглерами, которых оценивали по 5- и 41-балльной шкалам. Задавались следующие вопросы.
Удалось ли правильно определить отстающих?
Удалось ли правильно определить кандидатов на повышение?
Носили ли обсуждения осмысленный характер?
Можно ли считать процедуру справедливой?
По общему мнению, новая процедура оказалась не хуже прежней. Может показаться, что это пиррова победа, но я лично воспринял это с огромным облегчением. Ведь ответы гуглеров, участвовавших в опросе, подтвердили то, что мы подозревали и так: 41-балльная система была лишь иллюзией точности.
Большинство гуглеров признали, что часто невозможно определить разницу в рейтингах в пределах одной десятой балла. Например, не удалось достичь консенсуса в различиях между 3,1 и 3,2. По словам сотрудницы нашей лаборатории по человеческим ресурсам и инновациям (People and Innovation Lab) Меган Хат, «возникала ситуация, когда рейтинги нельзя было считать ни надежными, ни валидными. Одному и тому же человеку с одной и той же производительностью можно было поставить как 3,2, так и 3,3, в зависимости от оценщика и группы калибровки. Это и означает ненадежность рейтинга. А если человек получает 3,3, когда на самом деле его результат не выше 3,2, то рейтинг тоже нельзя считать валидным, поскольку он не отражает реального положения дел».