Интересный

Пример расчета ANOVA

Пример расчета ANOVA



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Однофакторный дисперсионный анализ, также известный как ANOVA, дает нам возможность проводить множественные сравнения нескольких групп населения. Вместо того, чтобы делать это попарно, мы можем одновременно рассмотреть все рассматриваемые средства. Чтобы выполнить тест ANOVA, нам нужно сравнить два вида вариаций, вариацию между средними значениями выборки, а также вариацию в каждой из наших выборок.

Мы объединяем все эти вариации в одну статистику, называемуюF статистика, потому что он использует F-распределение. Мы делаем это путем деления вариации между выборками на вариацию внутри каждой выборки. Способ сделать это обычно обрабатывается программным обеспечением, однако есть некоторая ценность в том, чтобы увидеть один такой расчет.

Это будет легко потеряться в дальнейшем. Вот список шагов, которые мы будем выполнять в следующем примере:

  1. Рассчитайте среднее значение выборки для каждой из наших выборок, а также среднее значение для всех данных выборки.
  2. Рассчитать сумму квадратов ошибки. Здесь в каждой выборке мы возводим в квадрат отклонение каждого значения данных от среднего значения выборки. Сумма всех квадратов отклонений является суммой квадратов ошибок, сокращенно SSE.
  3. Рассчитать сумму квадратов лечения. Мы возводим в квадрат отклонение каждого среднего значения выборки от общего среднего. Сумма всех этих квадратов отклонений умножается на единицу меньше количества выборок, которые мы имеем. Это число является суммой квадратов лечения, сокращенно SST.
  4. Рассчитайте степени свободы. Общее количество степеней свободы на единицу меньше, чем общее количество точек данных в нашей выборке, или N - 1. Количество степеней свободы лечения на единицу меньше количества использованных образцов, или м - 1. Число степеней свободы ошибок - это общее количество точек данных за вычетом количества выборок или N - м.
  5. Рассчитайте среднеквадратичное значение ошибки. Это обозначается MSE = SSE / (N - м).
  6. Рассчитайте среднюю площадь лечения. Это обозначается MST = SST /м - '1.
  7. Рассчитать F статистики. Это отношение двух средних квадратов, которые мы рассчитали. Так F = MST / MSE.

Программное обеспечение делает все это довольно легко, но хорошо знать, что происходит за кулисами. В дальнейшем мы разрабатываем пример ANOVA, следуя шагам, перечисленным выше.

Данные и Образец Средства

Предположим, у нас есть четыре независимые популяции, которые удовлетворяют условиям для однофакторного ANOVA. Мы хотим проверить нулевую гипотезу ЧАС0: μ1 = μ2 = μ3 = μ4, Для целей этого примера мы будем использовать выборку размера три из каждой изучаемой популяции. Данные из наших образцов:

  • Выборка из населения № 1: 12, 9, 12. Это выборочное среднее значение 11.
  • Выборка из населения № 2: 7, 10, 13. Это среднее значение выборки 10.
  • Выборка из населения № 3: 5, 8, 11. Это среднее значение выборки 8.
  • Выборка из населения № 4: 5, 8, 8. Это среднее значение выборки 7.

Среднее значение всех данных - 9.

Сумма квадратов ошибок

Теперь вычислим сумму квадратов отклонений от каждого среднего значения выборки. Это называется суммой квадратов ошибки.

  • Для выборки из популяции № 1: (12 - 11)2 + (9- 11)2 +(12 - 11)2 = 6
  • Для выборки из населения № 2: (7 - 10)2 + (10- 10)2 +(13 - 10)2 = 18
  • Для выборки из популяции № 3: (5 - 8)2 + (8 - 8)2 +(11 - 8)2 = 18
  • Для выборки из населения № 4: (5 - 7)2 + (8 - 7)2 +(8 - 7)2 = 6.

Затем мы сложим все эти суммы квадратов отклонений и получим 6 + 18 + 18 + 6 = 48.

Сумма квадратов лечения

Теперь вычислим сумму квадратов лечения. Здесь мы смотрим на квадратичные отклонения каждого среднего значения выборки от общего среднего и умножаем это число на единицу меньше, чем количество популяций:

3(11 - 9)2 + (10 - 9)2 +(8 - 9)2 + (7 - 9)2 = 34 + 1 + 1 + 4 = 30.

Степени свободы

Прежде чем перейти к следующему шагу, нам нужны степени свободы. Есть 12 значений данных и четыре образца. Таким образом, число степеней свободы лечения равно 4 - 1 = 3. Количество степеней свободы ошибки равно 12 - 4 = 8.

Средние квадраты

Теперь мы разделим нашу сумму квадратов на соответствующее число степеней свободы, чтобы получить средние квадраты.

  • Средний квадрат для лечения составляет 30/3 = 10.
  • Среднее значение квадрата ошибки составляет 48/8 = 6.

F-статистика

Последним шагом является деление среднего квадрата для обработки на средний квадрат для ошибки. Это F-статистика по данным. Таким образом, для нашего примера F = 10/6 = 5/3 = 1.667.

Таблицы значений или программное обеспечение можно использовать для определения вероятности получения значения F-статистики, столь же экстремального, как это значение, только случайно.


Смотреть видео: ANOVA дисперсионный анализ. АНАЛИЗ ДАННЫХ #9 (August 2022).