?

Log in

No account? Create an account

serge_gorshkov


Сергей Горшков - о бизнесе в сфере ИТ

о семантической интеграции, программировании, управлении...


Previous Entry Share Next Entry
Детская болезнь математизма в аналитике
serge_gorshkov
Продолжая тему, начатую в прошлом посте, расскажу об опасности сведения бизнес-аналитики к математическим абстракциям.
Представим себе предпринимателя, обладающего аналитическим мышлением, и желающего управлять своим бизнесом с опорой на рациональные гипотезы/доказательства. Первым делом ему необходимо построить модель своих бизнес-процессов. Таких моделей существует множество, плюс каждый может придумать себе свою. "Ловушкой", в которую легко при этом попасть, является принятие слишком простой модели. Она будет удобна для восприятия, но с реальностью связана так же, как сферический конь в вакууме - с конем Гнедком. Наломать дров с такой моделью будет легко, а отказаться от нее - очень сложно.

Отличным примером такого упрощения в бизнесе является любимый в некоторых корпоративных культурах показатель EBITDA. Казалось бы, очень удобно сравнивать между собой по эффективности разные подразделения: EBITDA высокая - значит, подразделение работает хорошо. На этом основании людям выписывают премии, и раздают подзатыльники. Однако очевидно, что два подразделения могут иметь одну и ту же EBITDу, и при этом совершенно разную эффективность. Например, можно делать инвестиции (да еще применять разные политики их амортизации), можно по-разному учитывать общие затраты по компании. Можно выжать из клиентов авансы, задрать EBITDу в декабре и получить премии, а потом два-три месяца курить бамбук, и т.д., и т.п. Если сравнивать по этому показателю разные предприятия, картина будет такой же - у одного может быть порядок со сбором дебиторки, и высокие инвестиции; у второго все запущенно с задолженностью, но и вложений не делают. Для инвестора первое предприятие заведомо привлекательнее, но в отчетности этого не видно, потому что EBITDA у них одинаковая.

Отчего сие? Оттого, что при вычислении одного комплексного показателя происходит потеря информации. Мы взяли кучу показателей, и рассчитали на их основе одно значение. Не надо думать, что вся исходная информация присутствует в этом конечном числе, как может показаться! Это неправда - исходная информация потеряна, если мы смотрим только на результат. Интуитивно понятной метафорой этого явления является "средняя температура по больнице".

Такая же проблема возникает во множестве других бизнес-вычислений. Сделаем отступление про оптимизационные задачи, а потом вернемся к EBITDе (кому не интересно про оптимизацию - пропустите два абзаца).
Итак, например, некая компания хочет научно подойти к проблеме оптимизации ремонтной программы. Есть N рублей, на которые в течение года можно отремонтировать M подстанций (всего их L, причем L много больше M). Какие именно подстанции надо отремонтировать, чтобы минимизировать число будущих аварий и ущерб от них? Самый очевидный вариант решения - присвоить каждой подстанции некий критерий, который будет вычисляться по сложной-сложной формуле в зависимости от степени изношенности, числа подключенных потребителей, потребляемой мощности, стоимости ремонта и т.д. Вычислив критерий для каждой подстанции, их можно будет по нему отсортировать, и отремонтировать верхние M. Будет ли это правильно? Только в некотором приближении. На самом деле, значение критерия для каждой подстанции уже не несет информации ни о ее изношенности, ни о важности. Например, может существовать подстанция, к которой подключен один потребитель, но это - резиденция губернатора. Ее важность, по понятным причинам, будет выше остальных. Или, даже без политики: одна подстанция изношена на 90%, и к ней подключено 500 потребителей (упрощаем - говорим о количестве, а не о мощности), другая - на 60%, но к ней подключено 6000 потребителей. По формуле вторая может оказаться приоритетнее первой, однако, вполне вероятно, ремонтировать следует все-таки первую, т.к. она почти неминуемо выйдет из строя, и, конечно, сделает это в самые лютые морозы.

Как решать проблему? Приданием физического смысла критерию, и логическим обоснованием его вычисления. В задаче про подстанции критерий должен называться "Ремонтировать или нет", и принимать значения "да" или "нет". К значению "да" должен приводить набор логических условий. Например: "если изношенность больше 90%, то ремонтируем"; "если подключен губернатор, то ремонтируем"; "если подключено больше N потребителей, и изношенность больше 80%, то ремонтируем". Конечно, пример условный и очень простой. В реальности условия могут представлять собой сложные логически-арифметические комбинации, использовать нечеткую логику и т.п.
Следующий вопрос - откуда брать эти условия. Предпочтительным является такой вариант: экспертом формулируются некие гипотезы, т.е. варианты условий, полученные из теоретических предпосылок. Затем эти гипотезы проверяются на имеющихся данных прошлых периодов. В ходе проверки корректируются условия, и участвующие в них граничные значения параметров. Подтвержденные условия попадают в итоговый набор, через который прогоняем новые данные, и получаем результат. Если нужно корректировать объем результата в зависимости от ограничений (например, доступного бюджета) - варьируем количественные параметры в условиях, или присваиваем ранги самим условиям, и поочередно отбрасываем менее приоритетные.

Если говорить не об оптимизационных задачах, а о мониторинге, к которому относится сравнение подразделений или компаний по экономической эффективности, то заботиться нужно о двух вещах: а) чтобы каждый используемый показатель имел физический смысл, совпадающий с тем, как мы данный показатель используем (у EBITDы смысл нечеток, а используется она для далеких даже от этого смысла задач), и б) чтобы каждый показатель можно было детализировать, в конечном счете - до уровня тех исходных данных, из которых он получен (drill-down).

Задача поиска физического смысла в показателях совсем не так проста. Например, мы хотим отслеживать экономическую эффективность подразделения. Интуитивно кажется, что "экономическая эффективность" может быть вычислена и представлена как числовое значение: раз экономическая - значит, в рублях. Но на практике это не так, ибо "эффективность" - понятие философское. Сравнивать эффективность московского филиала с урюпинским в рублях - заведомо бессмысленно (даже в расчете на число сотрудников, количество населения, ВВП региона). Эффективность зависит, например, и от конкуренции: если наша компания возникла 5 лет назад в Новосибирске, и занимает там 40% рынка - это хорошо; а если мы год назад вышли на перегруженный конкуренцией московский рынок, и сегодня заняли там 2% - это просто очень хорошо, даже если в рублях оборот у московского филиала будет меньше. Зависит эффективность и от объема спроса, и от платежеспособности населения, и от кадровой ситуации - факторов множество. И какой бы числовой показатель для ее оценки мы не придумали, он все равно будет неправильным. Точнее - он будет отражать существующее у нас в голове представление об "эффективности" лишь в некотором приближении. А самое печальное - чем сложнее будет придуманный нами показатель, тем больше будет отдел, который занимается его ежемесячным расчетом, и тем меньше будет эффективность компании в целом :) Это характерная для квантовой физики ситуация, когда акт наблюдения влияет на наблюдаемую систему.

Так что же делать предпринимателю, который хочет понять эффективность чего-либо? Перестать упрощать картину. Решения, основанные на упрощениях, неверны; и чем больше сделано упрощений, тем менее хуже будут решения.
Вместо плоской картины (филиалы, ранжированные по эффективности) надо научиться видеть многомерную.

Пусть целевой функцией является не эффективность, а прибыль. Ее уже можно выразить в рублях. И тут мы приходим к оптимизационной задаче - есть множество разных стратегий, среди которых нужно выбрать наиболее прибыльную, на интересующем нас промежутке времени. Промежуток может зависеть, например, от предполагаемой даты продажи компании очередным инвесторам. Стратегии могут заключаться в концентрации всех сил на сложных, но высокоприбыльных рынках, или в распылении на малобюджетные, но и низкорисковые - задача такого выбора уже полностью является прерогативой предпринимателя (хотя и тут можно кое-что промоделировать при помощи математики и логики). После того, как стратегия выбрана, можно уточнить понятие "эффективности" в этом свете. Если нас интересуют региональные рынки с низким доходом и невысокой конкуренцией - "эффективность" будет заключаться в достижении широты охвата, и определенного уровня проникновения, что можно отразить в соответствующих логически-цифровых показателях. Построив желаемую зависимость каждого из этих показателей от времени, можно определить эффективность каждого подразделения по каждому показателю, как отклонение факта по нему от плана. На этом основании уже можно давать премии с гораздо бОльшей справедливостью. Кстати, вычислительную сложность этой задачи можно свести к минимуму, если в компании порядок со внутренней автоматизацией (а без этого ни о какой эффективности и мечтать нельзя).

Далее, нужно понять, что некоторые показатели вообще имеют логическую, а не математическую природу. Например, "достоин ли сотрудник премии" - это не математический критерий. К варианту "достоин" может привести комбинация совершенно разных логических условий, аналогично описанному выше примеру с подстанциями.

Закончу, как Катон, фразой о том, что "строить подобные решения можно только с использованием семантических технологий". Карфаген в конце концов разрушили; может, будет и на нашей улице праздник.


  • 1
Хорошие размышления.

Я бы ещё обобщил: метод оценивания или критерий оценки (важный в некоторой оптимизационной задаче) сам должен стать объектом оптимизации, стать целью и результатом некоторой регулярной охватывающей организационной практики. Ваш пост - это как раз такого рода адаптивная активность, которая задаётся вопросом "а правильный ли у нас метод?" с нелокальным или мета- критерием "эффективности".

Всё так, спасибо :)

  • 1