Закладки


Поделиться

URL
***

Инновации / Управление инновациями

Берегитесь простых ответов, полученных от больших данных

30 сентября 2014

Берегитесь простых ответов, полученных от больших данных

Мощное и удобное в использовании программное обеспечение (программное обеспечение как сервис) и аналитические языки программирования (например, R) дали возможность всем сотрудникам, а не только фанатам больших данных уточнять различные параметры и показатели в работе компании. Внезапно все или почти все смогли разобраться в большинстве тонкостей процессов.

Такая прозрачность позволяет значительно большему числу людей подключаться к решению важных проблем фирмы, а значит, повышается вероятность их успешного исхода. Но есть один существенный недостаток в этой идеальной картине: добыв ответ на вопрос, даже «осмысленный», вы не знаете, получили ли вы важную или не столь существенную информацию.

Это теперь называют «эффектом кнопки»: призрак в машине всякий раз выдает правильный ответ, избавляя нас от необходимости думать. Но не все данные попадают в «машину», надо уметь хорошо ориентироваться в реальном и сложном мире, чтобы понять результаты, выданные «кнопкой».

Для анализа больших данных нужно, к примеру, кое-что понимать в самом «распределении данных». Многие статистические методы, в том числе те, которые преподают на курсах статистики в университетах, предполагают «нормальное распределение» данных. Существует и математическое описание такого распределения, однако привычнее так и называть график кривой нормального распределения Гаусса. Выглядит этот график как колокол: число наблюдений отмечается на оси ординат, самое большое значение находится посередине, распределение симметрично по обе стороны от среднего, и число результатов по обе стороны стремительно падает. Благодаря такому распределению 66% результатов попадает в одно стандартное отклонение выше или ниже среднего — и 95% результатов отличается от среднего (в плюс или минус) не более чем на два стандартных отклонения. Элементарные вычисления показывают, отличаются ли две группы результатов по каким-либо параметрам в «существенной мере» или же нет. И хотя на описание графика понадобилось много слов, он наглядно...

Показать полностью

Доступ к статье закрыт.
Чтобы прочитать статью целиком, оформите подписку.

У меня уже есть подписка

Чтобы оставить комментарий, вам необходимо авторизоваться


САМОЕ ПОПУЛЯРНОЕ