Подход Data Driven

Подход Data Driven
Публикации
22 декабря 2022
Как применение подхода Data Driven может помочь в повышении эффективности бизнеса и стать вашим конкурентным преимуществом. Какие последовательные шаги необходимо сделать для внедрения подхода Data Driven, а также, как измерить эффект от внедрения.

Долгое время считалось, что принятие решений в бизнесе неизменно связано с рисками, возникающими из-за ограниченности и неполноты доступной информации. В условиях, когда решение нельзя откладывать, на протяжении многих лет господствовал подход HiPPO (Highest Paid Person Opinion) — принятие решения сотрудником с наибольшим доходом. В этом подходе неявно подразумевается, что опыт в бизнесе, в том числе опыт принятия решений в условиях недостатка информации, — это тренируемый навык, который в наибольшей степени развит у управленцев высшего звена. Однако не существует никакой статистики и исследований, подтверждающих наличие такой связи. Более того, эффект авторитета (повышение веса любых суждений наиболее авторитетных людей) — одна из социальных когнитивных ловушек, известная в психологии с 1963 года.

Как же быть, если вы хотите повысить эффективность принятия решений в бизнесе и иметь более надежные подтверждения для них? Здесь может помочь подход Data Driven Decision Making — принятие решений, основанных на данных. На первый взгляд может показаться, что происходит подмена понятий: просто дайте все эти данные тому же управленцу и его решения сразу станут более эффективными. Но не все так просто:

1.   Для решений могут быть нужны самые разные данные, и заранее не всегда известно, какие именно и как они повлияют на конкретное решение.

2.   Если было проведено исследование данных и известен ответ на п. 1 для конкретного решения и набора данных — эти данные могут быть недоступны в нужный момент.

3.   Даже если данные доступны и п. 2 не является проблемой, качества данных может быть недостаточно для принятия решений.

Похоже, мы вернулись к тому, с чего начали — доступная информация всегда будет ограниченной и неполной для принятия обоснованных решений. И это действительно так, если вы не используете подход Data Driven!

Итак, вы решили взять на вооружение данные как инструмент принятия решений. Какие шаги вам предстоят.

1.   Сформулируйте бизнес-задачу так, чтобы она была измерима. Выясните, от каких ключевых бизнес-метрик зависит решение? Каковы их пороговые и нормальные значения? На каком временном интервале их изменения отличны от случайных? С какой периодичностью эти метрики могут быть использованы для принятия решений? Это задача для аналитика данных: совместно с руководителем, отвечающим за решения, определить вводные для дальнейшей работы с данными.

2.   Определите, от каких исходных данных зависят выделенные вами бизнес-метрики. На этом этапе выявляются источники данных, их качество, выстраиваются механизмы преобразований данных к тому формату, который будет использоваться для расчета бизнес-метрик. Также определяются требования к периодичности процессов обновления данных. На выходе мы получаем так называемую логическую схему данных, связывающую известные бизнес-сущности и наборы данных, а также схему их сбора и преобразования.

3.   Постройте аналитическую модель для принятия решений. Получив выгрузки необходимых данных за какой-то прошлый период, а также имея набор принятых в этом периоде решений, аналитик данных определяет взаимосвязи между ними. Если такие зависимости априори неясны, а данных и решений в истории достаточно много — это отличная вводная для дата-сайентиста, который построит модель принятий решений на основе машинного обучения. В обоих случаях построенные модели (аналитические либо предиктивные) тестируются на исторических данных. Как только вы увидите, что модель показывает достаточное качество или предсказательную силу, вы готовы перейти на следующий этап.

4.   Постройте инфраструктуру для сбора, преобразования и хранения данных. Это может быть Data Lake либо Data Warehouse, а также ETL-процедуры для подключения к источникам данных. Это задача для профессиональных Data-инженеров и разработчиков БД.

5.   Включите в инфраструктуру модули для управления качеством данных, отображения данных в виде дашбордов и/или отчетов, а также для запуска и контроля моделей машинного обучения. Здесь помогут DevOps, BI-разработчики и MLOps-инженеры.

6.   Подключите мониторинг данных, ML-моделей и качества их прогнозов. В случае отклонений своевременно реагируйте на них. Это поле деятельности для DevOps и MLOps-инженеров.

Подход Data Driven успешно показал себя в самых разных отраслях — наши клиенты используют его в маркетинговых задачах крупной авиакомпании, контроле производственных процессов на металлургическом предприятии, логистических операциях торговой сети, финансовых актуарных расчетах для страховой компании и т. д. Важно, что построение эффективных аналитических решений возможно на основе открытого ПО либо сертифицированных российских компонентов. И самое главное — такие проекты имеют понятный срок возврата инвестиций, поскольку при оцифровке бизнес-задачи становится понятна цена принимаемых бизнес-решений, которая обычно сравнивается со стоимостью внедрения и дальнейшей поддержки инфраструктуры данных и прочих необходимых компонентов.

Александр Борисов, руководитель направления Data Science в компании «Иннодата».


Источник: https://www.it-world.ru/cionews/business/189886.html