Второй момент состоит в том, что ключевой компонент РАД – визуализация данных, т. е. представление данных в виде понятных и полезных картинок. Важно отметить, что роль картинок гораздо больше, нежели просто «сжать» информацию и представить ее в компактном виде. Зачастую они дают нам «новую» информацию, которой «как бы не было» при ином ее представлении. Дело в том, что правильная картинка позволяет нам увидеть не только сами значения данных, но и их связь друг с другом, а также наличие тех или иных особенностей и структур в поведении данных, не обнаруживаемых при их текстовом или табличном представлении.
Есть и чисто физиологическая причина того, что, глядя на картинку, человек часто видит много нового по сравнению с текстовым изображением или таблицей: мы воспринимаем картинку и текст разными полушариями мозга (логическим и эмоциональным) [Роэм 2009]. Другими словами, именно картинки часто служат тем мостиком, с помощью которого мы переходим от одной ступени DIKW к другой.
Следуя вышеприведенным стихотворным образцам, мы предлагаем такую модель:
Как превратить данные в информацию, информацию в знание, знание в мудрость?
Ответ: с помощью разведочного анализа данных (РАД).
Семь (девять) простых методов РАД
1. Визуализация
2. Диаграммы потока процесса
3. Контрольные листки
4. Контрольные карты Шухарта
5. Гистограммы
6. Стратификация данных
7. Диаграмма Парето (80/20)
8. Схема Исикава
9. Диаграмма рассеяния
В РАД мы включаем семь простых методов контроля качества [Куме 1990], семь новых методов контроля качества [Адлер 2000, Кане 2008], визуализацию данных, метод построения диаграмм (блок-схем) потока процессов (flowcharts), ящик с усами, правило семи вопросов, ментальные карты и любые другие полезные для понимания картинки. Поскольку все перечисленные методы нужны не только при контроле качества, а при анализе любых данных в любых сферах деятельности, мы далее опускаем слова «контроль качества» и говорим о семи простых и семи новых методах РАД, включив в семь простых диаграммы потока и визуализацию как самостоятельный метод (т. е. по сути семь простых у нас состоят из девяти инструментов)[2].
Семь новых методов РАД
Диаграмма сродства
Граф связей
Метод иерархических структур
Матричная диаграмма (домик)
Анализ матричных диаграмм
Блок-схема принятия решений
Сетевой график (метод ПЕРТ)
Один из самых простых способов превратить данные в информацию – добавить к ним ответы на семь простых вопросов: кто? когда? как? где? зачем их собирал? сколько чего собрали? и что, собственно, они означают?
В англоязычной литературе это хорошо известное и очень популярное, особенно у японцев,
Правило 5W+2H:
Но вербальных ответов недостаточно – они по-прежнему не позволяют нам обнаружить структуры и тренды (если, конечно, они есть – а они есть в большинстве случаев реальной жизни). Чтобы обнаружить структуры и тренды в данных, их – данные – нужно визуализировать.
Наиболее употребительные практические инструменты визуализации данных перечислены в табл. 1.1.
Бóльшая часть того, что перечислено в этой таблице, будет рассмотрена в разных местах книги, но сначала разберем несколько примеров того, как визуализация помогает нам обнаружить то, что нельзя увидеть из цифр. В табл. 1.2 приведена часть таблицы Росстата с данными о валовом внутреннем продукте (ВВП) РФ в постоянных ценах 2011 г. (вся таблица просто не поместится на одной странице). Значения ВВП приведены в миллиардах рублей. Данные даны поквартально, но из таблицы вряд ли вы увидите какие-то закономерности.
На рис. 1.2 показан ход ВВП во времени с 1995 по 2016 г. в постоянных ценах 2008 г. Из рисунка видно, что рост ВВП начался сразу после дефолта 1998 г. и дальше до 2007 г. шел с практически идентичной структурой данных, что говорит о постоянстве системы, т. е. рост ВВП на этом участке был обусловлен восстановлением экономики после дефолта. В 2008 г. произошел обвал вследствие мирового экономического кризиса, после чего снова начался рост, прекратившийся примерно в 2012 г. После этого экономика не растет, т. е. имеет место так называемая стагнация экономики страны. Все вышесказанное очевидно любому человеку, и для этого не нужно ничего считать, так же как и не нужно никаких специальных экономических знаний. Нам все рассказала простая картинка, на которой показан ход процесса во времени. Такая картинка получила название «карта хода процесса». Англоязычный аналог этого термина – run chart.
Глава 2
История возникновения статистического мышления. Основы теории вариабельности
Мышление – это то, чем каждый из нас, слава богу, обладает от рождения. И пока что оно нас не подводит. Но что такое «статистическое мышление»? И зачем оно нам нужно (если нужно)? Такие вопросы могут возникнуть у читателя после знакомства с названием этого параграфа. Простых ответов на подобные вопросы нам дать не удастся. Поэтому вам придется довольствоваться сложными разъяснениями. Но прежде, чем мы попытаемся их дать, заметим, что сам термин «статистическое мышление» представляется не совсем удачным. Дело в том, что слово «статистический» у многих людей вызывает неприятие, поскольку напоминает об изучавшейся когда-то в институте дисциплине под названием «математическая статистика», которую большинство людей не помнит и побаивается.
Между тем под «статистическим мышлением» мы понимаем[3] подход к принятию любых решений как в жизни отдельного человека, так и на всех уровнях организации, причем решений как оперативных или тактических, так и стратегических. Более точно наше понимание сформулировано во врезке ниже.
Статистическое мышление – это умение принимать системные решения в мире, подверженном вариабельности.
Ниже мы постараемся расшифровать смысл приведенного определения, а здесь просто заметим, что статистическое мышление – это вовсе не использование статистических методов, по крайней мере в подавляющем большинстве жизненных ситуаций. Статистическое мышление – это точка зрения, позиция, взгляд на мир, помогающие принимать эффективные решения благодаря системному подходу к возникающим проблемам. Очевидна важность этой позиции, ибо если мы делаем ошибку любого типа – совершения или несовершения – т. е. вмешиваемся в процесс, когда этого делать не надо, или не вмешиваемся, когда это крайне важно, то процесс только ухудшается. Аналогичный результат возникает, если в процесс вмешиваются не те люди, кому следует это делать, и не вмешиваются те, кому следовало. Попробуем же разобраться в сути обсуждаемого подхода, для чего сначала бросим взгляд на историческую ретроспективу его возникновения и эволюции.
Открытие У. Шухарта
Поводом для возникновения статистического мышления послужила практическая задача борьбы с дефектами продукции, которая была поставлена перед молодым физиком Уолтером Шухартом (1891–1967), принятым в 1923 г. на работу в знаменитую Bell Laboratories (лаборатория того самого А. Белла, что изобрел телефон) [Нив 2005, Говард 1995, Адлер 2012]. Задача эта была связана с одной трудностью, возникшей в ходе телефонизации Америки. При тогдашней технологии прокладки телефонных сетей приходилось примерно через каждые 500 м вставлять в линию связи усилитель сигнала размером с письменный стол (полупроводниковых приборов, на которых построена вся современная миниатюризация, еще не было[4]), закапывая его в землю. И все было бы хорошо, если бы не одно обстоятельство. Лампы в этих усилителях перегорали не по графику, а когда им вздумается. Из-за этого у бригад ремонтников возникали большие трудности. Не удавалось заранее определить требуемое число ремонтных бригад, их потребности в транспорте и запасах ламп для замены. Проблема заключалась в большом разбросе времени наработки до отказа усилительных ламп, и хотя завод-изготовитель определял нормативный срок непрерывной работы, лампы почему-то ничего не знали про требования ТУ и отказывали как попало. Естественно, возникало много вопросов. Например, почему разброс так велик и нерегулярен? И что можно сделать, чтобы ввести его в приемлемые рамки? Как наилучшим образом описывать само явление разброса времени работы ламп? И так далее. Стоит заметить, что это было одно из первых (хотя и далеко не первое) столкновение массового производства с проблемой вариабельности, т. е. разброса.
Некоторыми из этих вопросов и занялся У. Шухарт. С самого начала он был фанатиком применения статистических методов. Его коллега и друг Э. Деминг так писал об этом в статье, посвященной памяти У. Шухарта [Deming 1967]: «Управление качеством означало для него применение статистических методов всюду: от сырьевых материалов до готовых изделий и обратно – в разработке новых изделий, при пересмотре требований к сырью, в непрерывном цикле обработки результатов, получаемых при исследовании покупательского спроса и из других источников».
Хотя традиционный взгляд на контроль качества был обращен в то время на обнаружение и изъятие негодных изделий из партии продукции, У. Шухарт увидел возможность увеличения выхода годных изделий непосредственно в процессе производства. Профилактика, направленная на предотвращение брака или несоответствий, несомненно, важнее и полезнее, чем отбраковка, ибо отбраковка сама по себе не приводит к улучшению изделий: она лишь разделяет их на две группы – принимаемых и бракуемых. Качество как данной партии, так и будущих партий при отбраковке не меняется. В то же время профилактика, т. е. система мер, направленных на предотвращение появления некачественных изделий, ведет к улучшению будущих партий продукции.
Первое, до чего додумался У. Шухарт, размышляя над поставленными вопросами, было обнаружение двух принципиально различных источников разброса или вариабельности (изменчивости)[5] показателей качества, к которым чувствителен потребитель.
Первый источник вариабельности – сама система, в которой производится продукция (услуга). Понятие о производственной системе довольно неопределенно. Сюда относятся и здания, и оборудование, и сырье, и люди, и многое другое. Практически это все, что может повлиять на интересующие нас показатели качества. Пока система не меняется, вариабельность характеризующих ее параметров остается практически постоянной. Поэтому вариабельность – одна из важнейших характеристик системы, которую надо знать, если мы хотим управлять системой или совершенствовать ее. Понятно, что для этого сначала придется научиться эту самую вариабельность каким-то образом измерять.
Второй источник имеет совершенно другую природу. Существует, оказывается, вариабельность, обусловленная вмешательством в систему тех или иных факторов, не принадлежащих системе, т. е. внешних по отношению к ней (например, неправильное поведение оператора, или неправильный ход какого-то технологического режима вследствие сбоя настройки, или непредвиденное изменение внешних условий и т. д.). Эта вариабельность проявляется спорадически, нерегулярно. Ее величина может сильно меняться от случая к случаю, причем здесь каждый случай – особый, и отклонение от той установившейся вариабельности, какая характерна для вариаций, вызываемых самой системой, может быть каким угодно.
В реальной жизни на выходе системы мы наблюдаем смесь, сумму вариаций, происходящих из этих двух источников.
Если бы теперь мы смогли определить, какие именно источники и как влияют на выход системы, то стало бы понятно, какие действия стоит предпринять, чтобы улучшить ситуацию. Другими словами, если бы мы знали, вызваны ли те или иные вариации системой или внешними по отношению к системе силами, то мы одновременно знали бы, кто и каким образом должен действовать. В самом деле, если, например, вариации обусловлены системой, т. е. тем, что процесс устроен именно так, как он устроен, то ясно, что вмешиваться в него изнутри системы бессмысленно, так как такое вмешательство, будучи незапланированным для системы, ведет только к ее раскачке (выводит систему из стабильного состояния). Нас или нашего потребителя может, конечно, не устраивать вариабельность системы. Но тогда надо менять систему в целом (вспомним о системном подходе), т. е. нам надо реорганизовать систему. А это в свою очередь означает, что делать это должны те люди, которые «стоят над системой», т. е. высший менеджмент. Поэтому всякая попытка справиться с ситуацией за счет сотрудников-исполнителей заведомо обречена на неудачу. Более того, она практически неизбежно приведет к существенному ухудшению положения дел.
С другой стороны, если вариации обусловлены внешними по отношению к системе причинами, т. е. тем, чего в нормально работающей системе быть не должно, то здесь надо немедленно браться за дело самим сотрудникам. Их задача – создать команду для изучения возможных причин возникновения нерегулярных вариаций, которые довольно часто, хотя и далеко не всегда, вызываются так называемым человеческим фактором (это, впрочем, вовсе не означает, что такие причины легко обнаружить.) В любом случае следует начать непрерывную борьбу за устранение всех «лишних» вариаций и за достижение стабильности. Только стабильность делает систему предсказуемой, а значит, управляемой (подробнее это утверждение рассмотрено ниже).
Основы теории вариабельности
Итак, в 1924 г. У. Шухарт заложил основы того, что сейчас принято называть теорией вариабельности. Основные положения этой теории можно кратко сформулировать следующим образом: все виды продукции и услуг, а также все процессы, в которых они создаются и/или преобразуются, подвержены отклонениям от заданных значений, называемых вариациями.
Вариации своим происхождением обязаны двум принципиально разным источникам, которые принято называть общими (common) и особыми или специальными (assignable) причинами вариаций[6].
Кроме общих «…существуют неизвестные причины вариабельности качества продукции, не принадлежащие постоянной системе, …и такие причины получили название особых» [Shewhart 1931, p. 14].
Общими причинами вариаций называют причины, составляющие неотъемлемую часть данного процесса и внутренне ему присущие. Они связаны с неабсолютной точностью поддержания параметров и условий осуществления процесса, с неабсолютной идентичностью условий на его входах и выходах и т. д. Другими словами, общие причины вариаций – это результат совместного воздействия большого числа случайных факторов, каждый из которых вносит весьма малый вклад в результирующую вариацию и влияние которых мы по тем или иным соображениям не можем или не хотим отделить друг от друга.
Особые причины вариаций – это те причины, которые возникают из-за внешних по отношению к процессу воздействий на него и не служат его неотъемлемой частью. Они связаны с приложением к процессу незапланированных воздействий, не предусмотренных его нормальным ходом. Другими словами, это – результат конкретных случайных воздействий на процесс, причем тот факт, что именно данная конкретная причина вызывает данное конкретное отклонение параметров/характеристик процесса от заданных значений, часто (но далеко не всегда) и приводит к тому, что эту причину можно обнаружить без приложения каких-то исключительных усилий или затрат.
Разделение причин вариаций на два указанных вида принципиально потому, что борьба с вариабельностью процесса в этих двух случаях требует различного подхода. Особые причины вариаций требуют локального вмешательства в процесс, тогда как общие причины вариаций требуют вмешательства в систему.
Локальное вмешательство:
● обычно осуществляется людьми, занятыми в процессе и близкими к нему (т. е. это линейный персонал, линейные руководители и т. д.);
● обычно нужно примерно для очень небольшого числа всех возникающих в процессе проблем (это выяснилось после многих лет применения данного подхода на практике, откуда и вытекают известное правило Дж. Джурана 85/15 или правило Деминга 94/6 – см., например, [Конарева 2008] – и все следствия из этих правил);