Статистика и котики. Владимир Савельев
target="_blank" rel="nofollow" href="#image39_580a0e0dbd36dd2822f9bf73_jpg.jpeg"/>
Надо сказать, что статистика в это время активно развивалась. Было разработано большое количество методов, которые, впрочем, не совсем подходили Госсету. Это происходило в силу малочисленности выборок растительных культур, используемых им в исследованиях. Поэтому в 1904 году Госсет отправился за советом в Лондонскую биометрическую лабораторию, которой руководил Карл Пирсон, один из самых видных статистиков XIX и XX веков. Их совместная переписка, продолжавшаяся вплоть до смерти Пирсона, внесла огромный вклад в развитие методов обработки данных.
В 1907 году Госсет решился опубликовать свои наработки в журнале Пирсона «Биометрика». Фирма «Гиннесс» разрешила сделать это только на том условии, что никакие конкретные данные в нее не попадут, а сам автор возьмет себе псевдоним. Таким образом пивовар Уильям Госсет превратился в математика Стьюдента, чьим именем назван ряд статистических критериев и открытое им t-распределение.
К слову, превращение ученых и инженеров в профессиональных статистиков не является такой уж редкостью. Так, Рональд Фишер был биологом, Фрэнк Вилкоксон – химиком, а Чарльз Спирмен – психологом.
Глава 4.
Как понять, что песики отличаются от котиков
или p-уровень значимости
Предположим, что вы вычислили t-критерий Стьюдента. Или U-критерий Манна-Уитни. Или какой-нибудь другой. Как же по нему понять, действительно ли песики и котики различаются по размеру? Чтобы это выяснить, статистики используют весьма нетривиальный подход.
Во-первых, они делают предположение, что котики и песики как биологические виды абсолютно не отличаются друг от друга. Это предположение называется нулевой гипотезой.
Следующим шагом они вычисляют вероятность того, что две случайно выбранные группы котиков и песиков дадут значение критерия большее или равное тому, которое мы получили (чаще всего без учета его знака). Эта вероятность называется p-уровнем значимости.
Если p-уровень значимости меньше 5% (чаще записывается как 0,05), то нулевая гипотеза отвергается и принимается гипотеза о том, что котики и песики все-таки различаются. Такая гипотеза называется альтернативной.
Если же p-уровень значимости больше 0,05, то нулевая гипотеза не отвергается.
Однако, то, что она не отвергается, еще не значит, что она верна. Это означает только то, что в данном опыте мы не обнаружили значимых различий.
В специальных статистических программах p-уровень значимости вычисляется автоматически, и нам достаточно просто найти его в соответствующей таблице. Однако, если у вас таких программ нет, то вам придется пользоваться таблицами критических значений.
Работать с ними просто: найдите нужную строчку и посмотрите на значение критерия, которое там указано. Если то, что вы получили, превышает это значение, то котики и песики отличаются друг от друга. Правда, для этого правила