Вперед | Назад | Конец | Список |
2. Однофакторный ДА полиморфных признаков
В основе однофакторного дисперсионного анализа качественных признаков, характеризующихся несколькими альтернативными вариациями (морфами) также лежит правило разложения общей (суммарной) вариансы на две части – факториальную () и остаточную ():
. |
(2.1) |
Однако в этом случае формулы для их расчета имеют другой вид.
Итак, предположим, что мы имеем дело с s отдельными выборками и в каждой выборке отмечается наличие k морф. Тогда исходную таблицу данных можно представить в следующем виде:
Морфы |
Выборки |
Суммы |
||||
1 |
2 |
3 |
... |
s |
||
1 |
m 11 |
m 21 |
m 31 |
... |
m s1 |
n 1 |
2 |
m 12 |
m 22 |
m 32 |
... |
m s2 |
n 2 |
3 |
m 13 |
m 23 |
m 33 |
... |
m s3 |
n 3 |
... |
... |
... |
... |
... |
... |
... |
k |
m 1k |
m 2k |
m 3k |
... |
m sk |
nk |
Суммы |
N 1 |
N 2 |
N 3 |
... |
Ns |
N |
В этой таблицы численности особей в каждой выборке представляют собой сумму частот отдельных морф:
, |
(2.2) |
а суммы по строкам представляют общее количество особей, характеризующихся данным феном:
. |
(2.3) |
Общее количество особей представляет собой сумму частот по строкам и столбцам:
. |
(2.4) |
Первым этапом анализа является расчет частот фенов для каждой выборки отдельно:
. |
(2.5) |
Кроме этого, рассчитываются средние (обобщенно для всех выборок в целом) частоты фенов:
. |
(2.6) |
Тогда наша таблица с исходными данными приобретает следующий вид:
Морфы |
Выборки |
Средние частоты |
||||
1 |
2 |
3 |
... |
s |
||
1 |
p 11 |
p 21 |
p 31 |
... |
p s1 |
|
2 |
p 12 |
p 22 |
p 32 |
... |
p s2 |
|
3 |
p 13 |
p 23 |
p 33 |
... |
p s3 |
|
... |
... |
... |
... |
... |
... |
... |
k |
p 1k |
p 2k |
p 3k |
... |
p sk |
Теперь, можно рассчитать суммарную, остаточную и факториальную вариансы:
; |
(2.7) |
; |
(2.8) |
. |
(2.9) |
Для каждой из варианс затем рассчитываются соответствующие значения числа степеней свободы:
dfT = N - 1; |
(2.10) |
df Z = N - s; |
(2.11) |
df X = s - 1. |
(2.12) |
Средние квадраты для факториальной и остаточной компонент рассчитываются как отношения соответствующих варианс на число степеней свободы:
; |
(2.13) |
. |
(2.14) |
Наконец, дисперсионное отношение рассчитывается как отношение факториального среднего квадрата к остаточному:
. |
(2.15) |
Оценка значимости полученного дисперсионного отношения производится сравнением расчетного F с табличным значением критерия Фишера-Снедекора для числа степеней свободы df1 = dfX и df2 = dfZ.
Пример. В трех популяциях наземного моллюска H.albescens было зарегистрировано наличие трех морф с частотами, которые приведены в таблице 2.1.
Необходимо выяснить, достоверно ли различаются эти выборки по структуре фенетической изменчивости в отношении характера опоясанности раковины.
Таблица 2.1
Фен |
Выборка |
Суммы |
||
1 |
2 |
3 |
||
У12345Ф |
15 |
18 |
11 |
n 1 = 44 |
У10345Ф |
17 |
27 |
23 |
n 2 = 67 |
У10345Ф |
25 |
30 |
15 |
n 3 = 70 |
Суммы |
N 1 = 57 |
N 2 = 75 |
N 3 = 49 |
N = 181 |
Вначале рассчитаем соответствующие частоты по каждой ячейке таблицы и маргинальные (т.е. средние):
Таблица 2.2
Фен |
Выборка |
Средние частоты |
||
1 |
2 |
3 |
||
У12345Ф |
0,263 |
0,240 |
0,224 |
0,243 |
У10345Ф |
0,298 |
0,360 |
0,469 |
0,370 |
У10345Ф |
0,439 |
0,400 |
0,307 |
0,387 |
36,993 |
48,975 |
31,164 |
Теперь мы можем рассчитать суммарную вариансу:
.
Остаточная варианса представляет собой сумму трех (по числу выборок) слагаемых, каждая из которых рассчитывается по аналогичной формуле, где вместо суммарной численности подставляется объем соответствующей выборки, а вместо средних частот - соответствующие для выборки частоты фенов. Эти значение приведены в таблице 2.2 в последней строке.
Таким образом, остаточная варианса равна:
.
Факториальную вариансу можно не рассчитывать, поскольку согласно формуле 2.1 она может быть найдена как разность суммарной и остаточной, т.е. . (В принципе, формула 2.9 даст ту же величину, с точностью до округления.)
Теперь, используя формулы 2.10 - 2.15 мы можем заполнить таблицу дисперсионного анализа (табл. 2.3).
Таблица 2.3
Источник |
s 2 |
df |
MS |
F |
p |
X |
1,293 |
2 |
0,647 |
0,98 |
> 0,05 |
Z |
117,132 |
178 |
0,658 |
||
T |
118,425 |
180 |
Как видно, расчетное значение дисперсионного отношения намного меньше, чем табличное значение критерия Фишера-Снедекора с числом степеней свободы df1 = 2 и df2 = 178 (F
a=0,05 = 3,05), следовательно можно сделать заключение, что нулевая гипотеза остается в силе. Таким образом, частоты соответствующих трех фенов в трех сравниваемых выборках достоверно не отличаются между собой.Оценка силы фактора можно рассчитать двумя способами.
Первый способ. Оценка силы влияния фактора рассчитывается как отношение факториальной вариансы к суммарной:
. |
(2.16) |
Проверка нулевой гипотезы (в данном случае о равенстве частот соответствующих морф во всех выборках) проверяется сравнением величины
(2.17) |
с табличным значением критерия Хи-квадрат Пирсона с числом степеней свободы
df = (s - 1)·(k - 1). |
(2.18) |
В данном примере сила влияния фактора, рассчитанная первым способом, составляет всего
ή2 = 1,293 : 118,425 = 0,011.Ёта оценка (как и следовало ожидать) не значима, поскольку величина χ2 = 0,011·181·2 = 3,98 меньше табличного значения критерия Хи-квадрат с числом степеней свободы df = 2 · 2 = 4 (χ2a=0,05 = 9,49).
Второй способ. Как и в разделе 1, используем формулы
, |
(2.19) |
где
; |
(2.20) |
; |
(2.21) |
. |
(2.22) |
Тогда, оценка силы влияния фактора будет составлять
η2 = -0,00029, т.е. практически равна 0.95 % доверительный интервал для оценки η2 , рассчитанный по формулам 1.18 - 1.21, составляет [-0,013; 0,388]. Поскольку этот интервал включает 0, принимается нуль-гипотеза об отсутствии достоверных различий по структуре фенетической изменчивости в отношении характера опоясанности раковины моллюска H.albescens.
Вперед | Назад | Начало | Список |