Таблица 2.2

Схемы представления результатов статистической обработки для различных критериев и методов анализа (составлена В.П.Леоновым)

п/п

Метод проверки гипотез или статистический критерий

Содержание рекомендуемого описания.

1

Проверка гипотез о законе распределения

Наименование закона распределения, на соответствие которому производится проверка. Название статистического критерия, с помощью которого производится проверка гипотез, полученная величина данного критерия и отвечающее ему значение достигнутого уровня значимости.

2

Проверка равенства двух законов распределения вероятностей

Сформулировать причины проверки данной гипотезы, указать статистический критерий для проверки, привести его значение и достигнутый уровень значимости. Сделать вывод о том, какая из гипотез принимается и какой из этого следует вывод применительно к целям исследования.

3

Проверка нормальности распределения вероятностей

Сформулировать причины проверки данной гипотезы, указать статистический критерий для проверки, привести его значение и достигнутый уровень значимости. Сделать вывод о том, какая из гипотез принимается, и какой из этого следует вывод, применительно к целям исследования. Желательно привести график распределения на “вероятностной бумаге”.

4

Критерий Колмогорова- Смирнова

Указать, какой именно из семейства критериев использовался в конкретном случае и цель его применения (сформулировать проверяемые гипотезы). Привести значение критерия и достигнутый уровень значимости. По результатам проверки сформулировать вывод относительно выдвигаемых гипотез.

5

Уровень значимости "р = …."

Обязательное указание, к какому конкретному статистическому критерию относится данное значение уровня значимости. Не употреблять выражения вида “p < …” или “p > … ”.

6

Оценка дескриптивных статистик

Объем выборки (подгрупп), среднее, стандартное отклонение, ошибка среднего. При сравнении вариабельности двух и более признаков - коэффициент вариации. Обязательно сообщить, использовались ли методы оценки аномальных наблюдений (выбросов) и если – да, то какие. Сообщить, применялись ли методы робастного оценивания (Пуанкаре, Винзора, Хубера и т.д.)

7

Проверка гипотез о равенстве дисперсий с помощью F- критерия Фишера

Предварительно провести проверку имеющегося ограничения на использование F критерия Фишера. Вычислить значение критерия и достигнутого уровня значимости. Сделать вывод о том, какая из конкурирующих гипотез принимается, дать интерпретацию этого результата.

8

Проверка гипотез о равенстве дисперсий с помощью критериев Кохрэна, Бартлетта и др.

Сформулировать проверяемую гипотезу о равенстве нескольких дисперсий и указать используемый для этого статистический критерий. Вычислить значение критерия и достигнутого уровня значимости. Сделать вывод о том, какая из конкурирующих гипотез принимается, дать интерпретацию этого результата. При использовании критерия Бартлетта обязательно привести результаты проверки нормальности во всех сравниваемых группах.

9

F-критерий Фишера

Сообщить, для проверки каких именно статистических гипотез использовался данный критерий, степени свободы для него и достигнутый уровень значимости.

10

Сравнение двух выборок с помощью критерия знаков

Дать описание природы количественного и группирующего признаков. Сообщить объемы наблюдений в сравниваемых группах. Сформулировать гипотезу, которая проверяется с помощью данного критерия. Привести вычисленное значение z-критерия и величину достигнутого уровня значимости. Результат проверки гипотезы интерпретировать.

11

Проверка гипотез о равенстве средних критерием Стьюдента

Привести объемы выборок, результаты проверки нормальности распределения (оно должно быть нормальным) и равенства генеральных дисперсий (они должны быть равны), значение t-критерия Стьюдента и значение достигнутого уровня значимости “р = ….”.

12

t-критерий Стьюдента при проверке иных гипотез

При проверке иных статистических гипотез (например, значимости коэффициентов корреляции или коэффициентов регрессии и т.п.) в пакетах программ могут не выводиться значения самого t-критерия Стьюдента, а только отвечающий ему уровень значимости. Поэтому можно ограничиться только уровнем значимости “р = … ”.

13

Критерий Манна-Уитни

Привести величину критерия и достигнутый уровень значимости. Привести значения средних величин сравниваемых групп.

14

Сравнение двух групп с помощью критерий серий Вальда-Вольфовица

Сформулировать гипотезу, проверяемую с помощью данного критерия. Привести значение критерия и достигнутый уровень значимости для него. Обязательно указать объем выборки, по которой проводилась проверка гипотез.

15

Сравнение двух выборок с помощью критерия Ван дер Вардена.

Сформулировать гипотезу, проверяемую с помощью данного критерия. Привести значение критерия и достигнутый уровень значимости для него. Обязательно указать объем выборки, по которой проводилась проверка гипотез.

16

U-критерий Вилкоксона,, Х-критерий Ван-дер-Вардена

Привести величину критерия и достигнутый уровень значимости. Привести значения средних величин сравниваемых групп.

17

Последовательный анализ Вальда

Привести аргументы в пользу выбранного метода анализа. Сформулировать проверяемые гипотезы. Привести значения статистических критериев и объемов наблюдения на момент окончания анализа. Указать, какая из конкурирующих гипотез была принята.

18

Дисперсионный анализ Краскела- Валлиса

Дать определение сравниваемых групп, указать количественную переменную, пояснить мотив выбора непараметрического ДА. Привести значение H-статистики Краскела-Валлиса, достигнутый уровень значимости. В случае отклонения нулевой гипотезы желательно провести множественные сравнения, результаты которых обсудить.

19

Дисперсионный анализ

Сообщить, был ли данный анализ параметрическим (по Фишеру), или же непараметрическим. В первом случае сообщить результаты проверки нормальности для всех (NB!) сравниваемых между собой групп, а также результаты сравнения генеральных дисперсий для этих групп (дисперсии должны быть равны). Сообщить, проверялась ли модель с фиксированными эффектами (модель 1-го типа), случайными факторами (модель 2-го типа), или же это была смешанная модель. Привести значение критерия Фишера, степени свободы и достигнутый уровень значимости. Для однофакторного дисперсионного анализа желательно сообщить и значение коэффициента детерминации. Для однофакторной модели с числом уровней более 2, после отклонения нулевой гипотезы провести множественные сравнения, используя линейные (или нелинейные) контрасты; результаты обсудить. Для многофакторного анализа привести и обсудить как значимые, так и не значимые эффекты взаимодействия.

20

Множественные контрасты в дисперсионном анализе

Сообщить, какой вид контрастов (линейные, нелинейные) использовались и их название (Шеффе, Дункана, Бонферрони и т.д.). Для обсуждаемых результатов контрастов привести полученные оценки (значения критерия и достигнутого уровня значимости). Желательно привести средние значения для сравниваемых групп.

21

Ковариационный анализ

Указать количественный признак, группирующий признак и ковариаты. Указать, являются ли ковариаты переменными или фиксированными. В случае влияния ковариат на межгрупповой фактор привести скорректированные средние.

22

Проверка гипотез о векторах с помощью l -критерия Уилкса

Сформулировать проверяемые гипотезы, описать количественные признаки и группирующий признак. Сообщить результаты проверки гипотез нормальности в сравниваемых группах, а также результат проверки гипотезы о равенстве ковариационных матриц. Привести вычисленное значение l -статистики, либо функций от этой статистики с величиной достигнутого уровня значимости. Дать интерпретацию принятой гипотезы.

23

Дискриминантный анализ

Дать описание дискриминируемых групп, их число и набор количественных переменных. Привести результаты проверки предположений для сравниваемых групп. Сообщить алгоритм оценки дискриминантных функций. Привести коэффициенты дискриминантных функций и канонических осей, обсудить их структуру, а также привести графики рассеяния в канонических осях. Привести таблицу классификации с использованием дискриминантных функций. При необходимости обсудить причины неправильной переклассификации отдельных наблюдений.

24

Оценка парных коэффициентов корреляции

Указать какой коэффициент корреляции оценивается (Пирсона, Спирмэна, Кендэла и т.д.). Для корреляции Пирсона обязательно сказать о результатах проверки нормальности для обоих признаков, привести значение коэффициента корреляции и значение достигнутого уровня значимости для него.

25

Оценка частных коэффициентов корреляции

Пояснить необходимость вычисления парциальных коэффициентов корреляции. Записать пару признаков, для которых вычисляется данный коэффициент и перечень элиминируемых признаков. После вычисления парциального коэффициента провести проверку его значимости, сравнить его величину с парным коэффициентом, дать интерпретацию имеющегося различия.

26

Проверка гипотез о равенстве коэффициентов корреляции

Укажите, для какой пары признаков будет проводиться проверка гипотезы о равенстве коэффициентов корреляции, и сформулируйте саму гипотезу. В частности, сообщите вид сравниваемых коэффициентов корреляции, для какого количества коэффициентов проверяется гипотеза, и что представляют собой субпопуляции, в которых проведена оценка этих коэффициентов.

27

Коэффициент непараметрической корреляции g

Обосновать выбор данной статистики. Указать пару признаков, для которых производится оценка корреляции. Привести значение g -статистики и величину достигнутого уровня значимости. Интерпретировать полученный результат.

28

Коэффициент непараметрической корреляции t -Кендалла.

Обосновать выбор данной статистики. Указать пару признаков, для которых производится оценка корреляции. Привести значение статистики Тау-Кендалла и величину достигнутого уровня значимости. Интерпретировать полученный результат.

29

W -коэффициент конкордации Кендалла

Сформулировать проверяемую гипотезу, дав описание анализируемых объектов и признаков. Привести вычисленное значение W-коэффициента, значение достигнутого уровня значимости и интерпретацию принятой гипотезы.

30

Ранговая корреляция Спирмена

Обосновать выбор данной статистики. Указать пару признаков, для которых производится оценка корреляции. Привести значение статистики Спирмена и величину достигнутого уровня значимости. Интерпретировать полученный результат.

31

Анализ таблиц сопряженности

Сообщить смысл отдельных градаций (уровней) анализируемых признаков. Уточнить, как вычислялся критерий Пирсона (классический метод, максимального правдоподобия, с поправкой Иэйтса и т.д.), привести значение критерия, число степеней свободы, достигнутый уровень значимости, а также наиболее адекватный показатель интенсивности связи признаков. Желательно обсудить вклады отдельных клеток таблицы в статистику Пирсона.

32

Проверка гипотез для нескольких частотных таблиц с помощью Q-критерия Кохрена

Сформулировать проверяемую гипотезу, дав описание каждой из частотных таблиц. Привести вычисленное значение Q-статистики и достигнутый уровень значимости. Интерпретировать принятую статистическую гипотезу.

33

Методы теории планирования экспериментов

Привести цель планирования экспериментов, аргументы в пользу выбранного плана, его матрицу. Привести таблицы с оценками параметров полученных зависимостей, результаты проверки предположений, а также критерии согласия полученной модели и реальных наблюдений. В случае проведения процедуры оптимизации описать алгоритм оптимизации, привести графики в канонических осях.

34

Множественный регрессионный анализ

Сообщить о том, какой именно анализ использовался (линейный, нелинейный, методом наименьших квадратов либо какой-то иной). Сообщить об используемом алгоритме оценки коэффициентов регрессии (принудительное включение предикторов, пошаговый отбор, наличие/отсутствие свободного члена, метод всех регрессий, максимального значения коэффициента детерминации и т.д.). Привести результаты проверки нормальности остатков, некоррелированности и гомоскедастичности. Привести значения размерных и безразмерных коэффициентов регрессии и результаты проверки их значимости. Обсудить соотношения безразмерных коэффициентов регрессии. Привести результаты проверки адекватности всего уравнения в целом (дисперсионный анализ). Привести значения множественного коэффициента корреляции и коэффициента детерминации.

35

Анализ канонических корреляций

Сформулировать гипотезу, которую предполагается проверить данным методом. Перечислить состав каждого множества признаков. Привести оценки параметров выбранного канонического уравнения, а также значение коэффициента канонической корреляции и результат проверки его значимости. Привести график распределения объектов в осях канонических переменных. Дать интерпретацию имеющейся связи между двумя множествами.

36

Нелинейный регрессионный анализ

Сообщить о том, какой именно алгоритм оценки коэффициентов регрессии использовался. Привести результаты проверки адекватности всего уравнения в целом (дисперсионный анализ).

37

Оценка аллометрических уравнений

На вербальном уровне описать модель связи между исследуемыми признаками. Записать в явном виде искомое аллометрическое уравнение. Указать метод оценки параметров уравнения, в частности, используются ли линеаризация, или же оценка производится иными методами. Если последнее, то указать какими. Привести значения оценок параметров и проверить их значимость. Привести график фактических и расчетных значений зависимой переменной. Обсудить полученное уравнение.

38

Нелинейные преобразования переменных

Сформулировать цель применения нелинейных преобразований. Явно указать используемое преобразование. Если есть особые точки в преобразовании, уточнить, как поступали с наблюдениями в этом случае. Прокомментировать, была ли достигнута поставленная цель с помощью этого преобразования. Если использовались параметрические преобразования типа Бокса-Кокса или Бокса-Тидвелла, указать метод оценки искомых параметров преобразований, и результаты его использования.

39

Анализ таблиц дожития и оценка уравнений кривых выживаемости

Указать выбранную модель выживаемости - модель пропорционального риска Кокса, экспоненциальная регрессия, нормальная и логнормальная регрессия, стратифицированный анализ, метод множительных оценок Каплана-Мейера и т.д. Привести таблицы оценок параметров и результатов проверки значимости полученных уравнений, а также графики с функциями выживаемости. В случае сравнения выживаемости двух групп привести используемый критерий (Гехана – Вилкоксона, F-критерий Кокса, критерий Кокса-Мантеля, логранговый критерий, критерий Вилкоксона-Пето и т.д.)

40

Оценка кривых "Доза-Эффект"

Привести выражение нелинейного уравнения регрессии, для которого производится оценка зависимости "Доза-Эффект". Сообщить, в каких единицах обозначается доза и эффект. Указать метод оценки параметров уравнения (метод наименьших квадратов, функция потерь, метод взвешенных наименьших квадратов, метод максимума правдоподобия, максимум правдоподобия и логит/пробит модели и т.д.). Привести характеристики пригодности модели, объясненную долю дисперсии, критерий согласия, график наблюдаемых и предсказанных значений и т.д.

41

Критерий Пирсона хи-квадрат

Сообщить, как вычислялся критерий Пирсона (классический метод, максимального правдоподобия, с поправкой Иэйтса и т.д.), привести значения критерия, степеней свободы, достигнутого уровня значимости. Для таблиц сопряженности привести наиболее адекватный показатель интенсивности связи признаков.

42

Анализ главных компонент

Сообщить на основе какой именно матрицы (ковариационной или корреляционной) выполнялся данный анализ. Указать каким методом производился отбор используемых главных компонент из всех возможных компонент. Обсудить структуру отобранных компонент и дать их интерпретацию.

43

Факторный анализ

Сообщить об алгоритме выделения факторов из корреляционной матрицы (главные компоненты, использование общностей, метода максимального правдоподобия, центроидный или метод главных осей) а также об алгоритме вращения осей. Отметить, являются ли факторы после вращения ортогональными или использовался алгоритм косоугольного вращения. Привести аргументацию выделения необходимого количества факторов, их структуру, дать интерпретацию генеральных, общих и характерных факторов. Привести данные об информативности выделенных факторов. Желательно привести графику распределения собственных значений и распределение нагрузок признаков в осях факторов, а также результаты проверки значимости собственных значений.

44

Анализ соответствий

Сообщить, является ли данный анализ парным или множественным. Перечислить признаки, используемые в данном анализе, в случае множественного анализа указать группирующий признак. Привести значение статистики Пирсона и достигнутый уровень значимости для нее. Привести таблицу координат строк и столбцов в новых осях. По результатам анализа привести график распределения анализируемых признаков в осях новых координат, выделив при этом градации группирующего признака, обсудив взаимное расположение точек на данном графике. Привести показатели качества отображения, относительную инерцию и величину косинус-квадрат.

45

Кластерный анализ

Сообщить с какой целью использовался кластерный анализ, в частности, сформулировать некоторые гипотезы, которые предполагалось проверить с помощью этого вида анализа. Уточнить, что являлось объектом кластеризации (наблюдения или признаки), указать используемую метрику и алгоритм кластеризации (иерархический КА, метод k-средних, метод поиска сгущений и т.д.). Обязательно указать используемый функционал качества кластеризации. Привести результаты кластеризации, которые могут иметь разную природу в зависимости от алгоритма кластеризации. Весьма желательно привести графические результаты кластеризации. Обсудить соответствие результатов кластерного анализа и сформулированных выше гипотез. Указать пути дальнейшего использования результатов кластерного анализа.

46

Многомерное шкалирование

Сформулировать гипотезу, для проверки которой был использован метод многомерного шкалирования. Укажите используемый метод шкалирования (метрический или неметрический). Перечислить используемые в процедуре шкалирования переменные, указать искомую размерность отображения объектов, привести аргументацию выбора количества осей, показатели качества отображения (стресс, диаграмму Шепарда). Дайте интерпретацию полученных результатов, сопровождая ее графиком распределения объектов в осях новых шкал.

47

Анализ временных рядов

Указать, был ли весь ряд эквидистантным, а также какой из алгоритмов анализа использовался. Если производилось сглаживание ряда, указать алгоритм сглаживания. Идентифицировать модель временного ряда. Если производилась оценка тренда – привести результаты такой оценки; то же самое для сезонности. При оценке функции автокорреляции привести ее график и оценки значимости коэффициентов. При использовании модели АРПСС (Бокса и Дженкинса) привести оценки параметров модели а также указать алгоритм оценки (квазиньютоновский максимизации правдоподобия, приближенный метод максимального правдоподобия МакЛеода и Сейлза, приближенный метод максимального правдоподобия с итерациями назад, точный метод максимального правдоподобия по Meларду и т.д. При использовании одномерного анализа Фурье, кросс-спектрального анализа либо быстрого преобразования Фурье привести их результаты в виде оценок параметров и графиков (периодограммы, спектральные плотности и т.д.).

48

Оценка отношения шансов

Описать, каким образом организовывались перекрестные исследования, какой смысл имели отдельные уровни признаков, между которыми изучалась связь. Привести оценку отношения шансов, и дать его словесную интерпретацию. Привести стандартную ошибку оценки отношения шансов, которая дает представление о его точности. Желательно также привести величину относительного риска, а также рассмотреть возможность использования логарифма отношения шансов и логистической модели. Используя соответствующий статистический критерий провести проверку значимости отношения шансов.

49

Проверка гипотез
о равенстве относительных частот

Пояснить целесообразность проверки сформулированной гипотезы, сообщить выборочные значения относительных частот, записать проверяемую гипотезу, указав число пропорций. Пояснить какой метод использовался для проверки этой гипотезы. В зависимости от количества и вида признаков, идентифицирующих разные пропорции, эти методы могут отличаться.

50

Построение доверительного интервала для относительной частоты

Сообщить, для какого показателя получена оценка относительной частоты и для чего необходимо построение доверительного интервала. Указать величину доверительной вероятности. Учитывая, что существуют разные методы оценки доверительного интервала для относительной частоты, указать метод построения доверительного интервала.

51

Логистическая регрессия с биномиальной или мультиномиаль-ной переменной отклика

Указать название и градации зависимой переменной, а также число предикторов, предлагаемых для включения в уравнение. Если предикторов немного, перечислить их, если же достаточно много (порядка нескольких десятков), описать их в виде отдельных групп признаков. Сообщить число наблюдений по каждой градации зависимого признака, метод оценки параметров уравнения, коэффициенты логистического уравнения и отношения шансов, критерии согласия фактических и предсказанных состояний объектов по градациям зависимой переменной. Желательно для наиболее интересных результатов записать в явной форме уравнение логистической регрессии.

52

Логлинейный анализ

Сформулировать гипотезу, которую предполагается проверить с помощью логлинейного анализа. Указать зависимую переменную и предикторы, а также алгоритм построения зависимости (принудительное включение признаков, автоматический поиск оптимального подмножества, использование эффектов взаимодействия и т.п.). Указать, для каких именно комбинаций признаков имелись в наличии структурные нули. Привести для конечного варианта значение статистики Пирсона и указать, как она вычислялась (классический метод или метод максимального правдоподобия). Обсудить имеющиеся маргинальные и частные связи. Привести график наблюдаемых и расчетных частот. При необходимости привести значение критерия Мантеля-Ханзеля.