Статистика и котики. Владимир Савельев

Статистика и котики

target="_blank" rel="nofollow" href="#image39_580a0e0dbd36dd2822f9bf73_jpg.jpeg"/>

Надо сказать, что статистика в это время активно развивалась. Было разработано большое количество методов, которые, впрочем, не совсем подходили Госсету. Это происходило в силу малочисленности выборок растительных культур, используемых им в исследованиях. Поэтому в 1904 году Госсет отправился за советом в Лондонскую биометрическую лабораторию, которой руководил Карл Пирсон, один из самых видных статистиков XIX и XX веков. Их совместная переписка, продолжавшаяся вплоть до смерти Пирсона, внесла огромный вклад в развитие методов обработки данных.

В 1907 году Госсет решился опубликовать свои наработки в журнале Пирсона «Биометрика». Фирма «Гиннесс» разрешила сделать это только на том условии, что никакие конкретные данные в нее не попадут, а сам автор возьмет себе псевдоним. Таким образом пивовар Уильям Госсет превратился в математика Стьюдента, чьим именем назван ряд статистических критериев и открытое им t-распределение.

К слову, превращение ученых и инженеров в профессиональных статистиков не является такой уж редкостью. Так, Рональд Фишер был биологом, Фрэнк Вилкоксон – химиком, а Чарльз Спирмен – психологом.

      Глава 4.

      Как понять, что песики отличаются от котиков

      или p-уровень значимости

Предположим, что вы вычислили t-критерий Стьюдента. Или U-критерий Манна-Уитни. Или какой-нибудь другой. Как же по нему понять, действительно ли песики и котики различаются по размеру? Чтобы это выяснить, статистики используют весьма нетривиальный подход.

Во-первых, они делают предположение, что котики и песики как биологические виды абсолютно не отличаются друг от друга. Это предположение называется нулевой гипотезой.

Следующим шагом они вычисляют вероятность того, что две случайно выбранные группы котиков и песиков дадут значение критерия большее или равное тому, которое мы получили (чаще всего без учета его знака). Эта вероятность называется p-уровнем значимости.

Если p-уровень значимости меньше 5% (чаще записывается как 0,05), то нулевая гипотеза отвергается и принимается гипотеза о том, что котики и песики все-таки различаются. Такая гипотеза называется альтернативной.

Если же p-уровень значимости больше 0,05, то нулевая гипотеза не отвергается.

Однако, то, что она не отвергается, еще не значит, что она верна. Это означает только то, что в данном опыте мы не обнаружили значимых различий.

В специальных статистических программах p-уровень значимости вычисляется автоматически, и нам достаточно просто найти его в соответствующей таблице. Однако, если у вас таких программ нет, то вам придется пользоваться таблицами критических значений.

Работать с ними просто: найдите нужную строчку и посмотрите на значение критерия, которое там указано. Если то, что вы получили, превышает это значение, то котики и песики отличаются друг от друга. Правда, для этого правила

Скачать книгу

Статистика и котики. Владимир Савельев

Статистика и котики

Глава 4. Как понять, что песики отличаются от котиков или p-уровень значимости

Глава 4.

Как понять, что песики отличаются от котиков

или p-уровень значимости