Средняя, модус и медиана: важные понятия в беттинге.

Почему средние показатели могут искажать прогнозы? Средняя, модус и медиана: важные понятия в беттинге.


Самым популярным способом оценки данных в беттинге являются средние показатели, но являются ли они самой полезной вещью? Модус и медиана часто представляют собой более подходящую альтернативу, поэтому их понимание имеет решающее значение для успешных ставок.

Проблема средней для игроков в букмекерских конторах

Из-за её простоты, многие игроки используют среднюю для подсчета статистики результативности. Но многие ли из игроков знают об ограниченности этого метода?
К примеру, рынок ставок на общий тотал голов в футболе. Игроки могут полагать, что высчитав среднее количество мячей, забитое за предыдущие игры, они могут высчитать точное количество голов, которое ожидается в предстоящем матче. Но действительно ли здесь уместен подобный подсчет средней величины?

В качестве примера давайте посмотрим на количество голов, забитых в Английской Премьер-Лиге по сравнению с Испанской Примерой в сезоне 2013/2014. Среднее количество голов за игру в этих лигах 2.77 и 2.75 соответственно. Эти данные могут привести игрока к мысли, что в Ла Лиге матчи чаще играются на Тотал Меньше 2.5, чем в АПЛ. Тем не менее, это не так — 48.4% матчей в АПЛ заканчиваются на ТМ2.5, по сравнению с 47.3% в Ла Лиге.

Взглянув на рисунок ниже, мы увидим, что хотя общее распределение количества голов схоже, в АПЛ чаще всего забивается два гола за матч, а в Примере этот показатель составляет 3 гола. Средняя же маскирует и скрывает от нас этот факт.

Почему же это происходит? Хотя средние показатели и дают нам общую картину результативности, они не могут отражать степень равномерности распределения голов.

Другой пример опасности в применении средних показателей, это их использование в подсчете гандикапов в матчах «футбольных карликов», которые считаются мальчиками для битья в каждой отборочной кампании. Но так ли они плохи, какими их пытаются представить? Среднее количество голов в их матчах может достигать больших показателей, однако эта цифра может возникнуть в результате редких, но очень крупных поражений команды. В итоге игроки ошибаются, часто переоценивая ожидаемое количество голов в матче.

Ниже мы рассмотрим альтернативы средней — модус и медиану, и используем три набора чисел и два сценария, при которых средняя не может давать адекватную информацию.

Рассмотрим следующий наборы чисел, среднее количество каждого из которых насчитывает 5.

Набор А: 4, 5, 5, 5, 6
Набор B: 3, 4, 4, 4, 10
Набор C: 3, 4, 5, 6, 7

Первый сценарий: наличие отклонений в меньшую или большую сторону

Хотя все три набора имеют одинаковую среднюю 5, и сумма чисел каждого набора насчитывает 25, они имеют совершенно разное распределение.

Набор А можно назвать симметрично-распределенным. одно из чисел одинаково отклоняется в большую и меньшую стороны от средней, 4 меньше 5, а 6 больше 5 на одинаковую величину.

Средняя, или средняя величина идеально подходит для использования в случаях с симметричным распределением, когда отклонения от переменной происходят на подобных частотах в обе стороны, и средняя находится в середине множества значений.

В противоположность подобному распределению, Набор В насчитывает четыре числа меньше среднего, и только одно выше. Это можно назвать ассиметричным распределением.

При использовании большой базы данных, игроки могут проверить пригодность средней с помощью других мер величины — модуса и медианы.
Медиана — это значение, которое лежит в середине распределения, в порядке возрастания или убывания. В наборах А и В это число 5 и 4 соответственно.
Модус — это наиболее часто повторяющаяся величина, и в наборах А и В это также соответственно 5 и 4.

Симметричное распределение должно иметь одинаковые среднюю, медиану и модус. Разница между двумя последними величинами и средней в Наборе В говорит о том, что это несимметричное распределение, и поэтому средняя не является идеальной величиной в данном примере.

 Второй сценарий: разные распространения

Два набора из нашего примера могут быть оба симметрично распределены, но не в равной степени распространяться. К примеру, Набор С одинаково симметрично распределен как Набор А, потому что они имеют равные величины выше и ниже средней, а также отклонение от средней одинаково в обе стороны в обоих наборах.

Тем не менее, хоть и средняя арифметическая в обоих наборах это 5, это среднее является более подходящим показателем для Набора А, поскольку он содержит большее количество равных средней величин. Разница между двумя этими наборами лежит в дисперсии в значениях каждого набора. Поэтому мы должны измерить и эту дисперсию.

Чтобы сделать это, игроки должны высчитать диапазон и стандартное отклонение. Диапазон — это разница между максимальным и минимальным значениями, вычислить диапазон совсем не сложно. С другой стороны, стандартное отклонение является более сложным показателем. В общих словах, применительно к данной статье, эта величина отражает изменение значений в наборе от средней. Обратите внимание, что вскоре мы опубликуем статью, в которой изучим распределение более глубоко, и в ней будет подробно раскрыта суть стандартного отклонения.

Набор А и С имеют диапазоны 2 и 4 соответственно, в то время как их стандартные отклонения составляют 0.71 и 1.58. Раз обе эти величины выше в Наборе С, мы можем сделать вывод, что распространение в ней выше.

Вывод

Понимая ограниченность такой величины как средняя, перекос распределения и различия в дисперсии, игроки окажутся в более выгодном положении, используя эти меры для прогнозирования событий. Хотя эта статья и не слишком тщательное исследование адекватности использования средней, этой информации должно быть достаточно, чтобы натолкнуть игроков на исследование других мер измерения.