Скачать книгу

помощью разведочного анализа данных (РАД).

      Семь (девять) простых методов РАД

      1. Визуализация

      2. Диаграммы потока процесса

      3. Контрольные листки

      4. Контрольные карты Шухарта

      5. Гистограммы

      6. Стратификация данных

      7. Диаграмма Парето (80/20)

      8. Схема Исикава

      9. Диаграмма рассеяния

      В РАД мы включаем семь простых методов контроля качества [Куме 1990], семь новых методов контроля качества [Адлер 2000, Кане 2008], визуализацию данных, метод построения диаграмм (блок-схем) потока процессов (flowcharts), ящик с усами, правило семи вопросов, ментальные карты и любые другие полезные для понимания картинки. Поскольку все перечисленные методы нужны не только при контроле качества, а при анализе любых данных в любых сферах деятельности, мы далее опускаем слова «контроль качества» и говорим о семи простых и семи новых методах РАД, включив в семь простых диаграммы потока и визуализацию как самостоятельный метод (т. е. по сути семь простых у нас состоят из девяти инструментов)[2].

      Семь новых методов РАД

      Диаграмма сродства

      Граф связей

      Метод иерархических структур

      Матричная диаграмма (домик)

      Анализ матричных диаграмм

      Блок-схема принятия решений

      Сетевой график (метод ПЕРТ)

      Один из самых простых способов превратить данные в информацию – добавить к ним ответы на семь простых вопросов: кто? когда? как? где? зачем их собирал? сколько чего собрали? и что, собственно, они означают?

      В англоязычной литературе это хорошо известное и очень популярное, особенно у японцев,

      Правило 5W+2H:

      Но вербальных ответов недостаточно – они по-прежнему не позволяют нам обнаружить структуры и тренды (если, конечно, они есть – а они есть в большинстве случаев реальной жизни). Чтобы обнаружить структуры и тренды в данных, их – данные – нужно визуализировать.

      Наиболее употребительные практические инструменты визуализации данных перечислены в табл. 1.1.

      Бóльшая часть того, что перечислено в этой таблице, будет рассмотрена в разных местах книги, но сначала разберем несколько примеров того, как визуализация помогает нам обнаружить то, что нельзя увидеть из цифр. В табл. 1.2 приведена часть таблицы Росстата с данными о валовом внутреннем продукте (ВВП) РФ в постоянных ценах 2011 г. (вся таблица просто не поместится на одной странице). Значения ВВП приведены в миллиардах рублей. Данные даны поквартально, но из таблицы вряд ли вы увидите какие-то закономерности.

      На рис. 1.2 показан ход ВВП во времени с 1995 по 2016 г. в постоянных ценах 2008 г. Из рисунка видно, что рост ВВП начался сразу после дефолта 1998 г. и дальше до 2007 г. шел с практически идентичной структурой данных, что говорит о постоянстве системы, т. е. рост ВВП на этом участке был обусловлен восстановлением экономики после дефолта. В 2008 г. произошел обвал вследствие мирового экономического кризиса,

Скачать книгу


<p>2</p>

Термины «семь простых» и «семь новых» настолько широко вошли в уже имеющуюся литературу, что мы не видим смысла их менять.