Вызовы руководителю при анализе данных большого объёма

Читать на латышском
Читать на английском

17.01.2018

Под «данными большого объёма» (англ. big data) обычно понимается не большое число записей или большой объём в мегабайтах (хотя это зачастую идёт в комплекте), а то, каким способом производится обработка данных и их анализ. В этой статье – о существенных различиях и вызовах руководителю.
 
В случаях, когда легко определить, каким способом из данных получить конкретный ответ, это обычно не считают работой с данными больших объёмов даже тогда, когда число обрабатываемых записей велико.
 
Если руководителя интересует вопрос, у какого магазина объём продаж самый большой, а у какого – самый малый, тогда данные об объёмах продаж можно ввести в таблицу Excel (принимая, что исходные данные доступны и достоверны), упорядочить по соответствующим колонкам и найти ответ.
 
Когда вопрос сложнее…
 
Всё чаще возникают ситуации, когда настолько простую связь между разрешаемым вопросом и доступными данными невозможно найти. Например, если банк собирается предложить новую услугу имеющимся клиентам, однако эта услуга непосредственно не замещает какую-то имеющуюся, тогда эта связь не столь очевидна. Дополнительно к тому, что надо определить потребность и технически обработать данные, надо придумать, каким способом достигнуть результата. В некоторых случаях следует прибегнуть к отраслевой экспертизе (например, какие бы услуги клиент мог получать вместе), в некоторых случаях связь не интуитивна, и правильный ответ надо искать в данных, используя математические, статистические и другие современные способы их обработки.
 
В любом случае процесс начинается с определения цели – какую бизнес-проблему мы хотим решить? Например, у предприятия имеется инфраструктура, и предприятие хочет инвестировать в ту часть инфраструктуры, которая приносит наибольшую отдачу на вложения. Или предприятие хочет открыть новый магазин, и для него надо определить месторасположение с максимальным потенциалом роста. Это примеры целей анализа данных, когда неочевиден путь к правильному ответу.
 
Целью этой статьи не является детальное углубление в методы математические, статистические и искусственного интеллекта, применяемые к данным, чтобы отыскать связи разного рода – это в наши дни делают специалисты с соответствующими знаниями в этих отраслях, и это не так доступно широким кругам, как работа с таблицами Excel. Руководителю следует учесть, что этот процесс – экспериментален и без гарантированного результата. В ходе исследования может оказаться, что доступные данные недостаточны, чтобы ответить на поставленный вопрос - цель исследования.
 
Проводя анализ, в некоторых случаях приходится делать вывод, что качество данных не соответствует принятию решения. В этих случаях часто приходится преобразовывать процесс, в результате которого данные были собраны, или систему, которая их собирает. Это может означать, что данные не будут доступны тотчас, возможно, что анализ данных можно будет возобновить только через несколько месяцев или даже лет.
 
На анализ данных большого объёма следует смотреть, как на инвестиции. Инвестиции в техническом аспекте (в системы IT и услуги), улучшение качества данных, организационные изменения при введении новых должностей и преобразовании культуры предприятия чаще всего не дают отдачи незамедлительно, а только в долговременной перспективе, принимая кроме того известный риск, однако их отдача может быть значительной.
 
Невзирая на трудности, многие предприятия приобрели опыт, как анализ данных большого объёма может увенчаться существенными приобретениями. 
 
Контактная информация
Eriks Dobelis
eriks.dobelis@pwc.com
Tel: +371 67094400
© 2019 PricewaterhouseCoopers. "PricewaterhouseCoopers" является участником международной сети PricewaterhouseCoopers International Limited, каждый участник которой является отдельным и независимым юридическим лицом.  | Последние изменения: 14.01.2019