Стандартная ошибка разности средних арифметических

Критерий Стьюдента, формула, алгоритм, формула стандартной ошибки разности, коэффициент стьюдента формула

Критерий Стьюдента применяется для проверки равенства средних значений двух выборок, сравнение количественных значений только двух выборок с нормальным распределением случайной величины. 

 Критерий Стьюдента определяется по формуле:

Критерий Стьюдента формула

$bar{X_1}$ – выборочные средние значения первой выборки;

$bar{X_2}$ – выборочные средние значения второй выборки;

n1 – объем первой выборки;

n2 – объем второй выборки;

σ1 и σ2 – среднее квадратическое отклонение в соответствующих выборках и находятся из формулы:

СКО

Число степеней свободы определяется по формуле:

k=n1+n2−2

Fкр(α, k) определяется по таблице

При Fнабл<Fкр нулевая гипотеза принимается.

Формула критерия Стьюдента для несвязанных независимых выборок:

Формула критерия Стьюдента для независимых выборок

Формула для определения стандартной ошибки разности средних арифметических σxy:

стандартная ошибка разности средних арифметических формула

Число степеней свободы определяется выражением:

k=n1+n2–2

При n1=n2 число степеней свободы находится по формуле:

k=2n-2

а стандартная ошибка разности средних арифметических σxy задаётся выражением:

стандартная ошибка разности средних арифметических


Пример

Даны две выборки.

В первой выборки продажа товара со скидкой, а во второй без скидки.

№ п/п X Y
1 25 19
2 34 31
3 23 17
4 35 24
5 33 28
6 25 31
7 45 39
8 41 32
9 27 38
10 54 43
11 32 21
12 32

По критерию Стьюдента определить зависит ли спрос на товар от скидок на него при p=0.99?

Решение

В соответствии с таблицей n1=12, n2=11

Вычислим дисперсии D(X), D(Y)

№ п/п X Y D(X) D(Y)
1 25 19 78,028 107,4
2 34 31 0,0278 2,6777
3 23 17 117,36 152,86
4 35 24 1,3611 28,769
5 33 28 0,6944 1,8595
6 25 31 78,028 2,6777
7 45 39 124,69 92,86
8 41 32 51,361 6,9504
9 27 38 46,694 74,587
10 54 43 406,69 185,95
11 32 21 3,3611 69,95
12 32 3,3611
Сумма 406 323 911,67 726,55
Среднее 33,833 29,364

Подставим значения в формулу стандартной ошибки разности средних арифметических σxy:

 стандартная ошибка разности решение

Вычисляем критерий Стьюдента:

критерий Стьюдента решение

Число степеней свободы равно:

k=12+11–2=21

По таблице Стьюдента находим критическое значение:

tкрит=2,8310     

Отсюда tкрит> tнабл, следовательно, зависит.

15612


Непараметрические
критерии статистики 
—  свободны
от допущения о законе распределения
выборок и базируются на предположении
о независимости наблюдений.

В
группу параметрических
критериев 
методов
математической статистики входят
методы для вычисления описательных
статистик, построения графиков на
нормальность распределения, проверка
гипотез о при­надлежности двух выборок
одной совокупности. Эти методы
основыва­ются на предположении о том,
что распределение выборок подчиняется
нормальному (гауссовому) закону
распределения. Среди параметрических
критериев статистики нами будут
рассмотрены критерий Стьюдента и Фишера.

6.1.1 Методы проверки выборки на нормальность

Чтобы
определить,  имеем ли мы дело с
нормальным распределением, можно
применять следующие методы:

1)
в пределах осей можно нарисовать полигон
частоты (эмпирическую функцию
распределения) и кривую нормального
распределения на основе данных
исследования. Исследуя формы кривой
нормального распределения и графика
эмпирической функции распределения,
можно выяснить те параметры, которыми
последняя кривая отличается от первой;

2)
вычисляется среднее, медиана и мода и
на основе этого определяется отклонение
от нормального распределения. Если
мода, медиана и среднее арифметическое
друг от друга значительно не отличаются,
мы имеем дело с нормальным распределением.
Если медиана значительно отличается
от среднего, то мы имеем дело с асимметричной
выборкой.

3)
эксцесс кривой распределения должен
быть равен 0.
Кривые  с  положительным  эксцессом  значительно  вертикальнее
кривой нормального распределения.
Кривые с отрицательным эксцессом
являются более покатистыми по сравнению
с кривой нормального распределения;

4)
после   определения среднего
значения распределения частоты и
стандартного oтклонения находят следующие
четыре интервала распределения сравнивают
их с действительными данными  ряда:

а) 
к интервалу должно относиться около
25% частоты совокупности,

б) 
к интервалу должно относиться около
50% частоты совокупности,

в) 
к интервалу должно относиться около
75% частоты совокупности,

г) 
к интервалу должно относиться около
100% частоты совокупности.

6.1.2 Критерий Стьюдента (t-критерий)

Критерий
позволяет найти вероятность того, что
оба средних значения в выборке относятся
к одной и той же совокупности. Данный
критерий наиболее часто используется
для проверки гипотезы: «Средние двух
выборок относятся к одной и той же
совокупности».

При
использовании критерия можно выделить
два случая. В первом случае его применяют
для проверки гипотезы о равенстве
генеральных средних
двух неза­висимыхнесвязанныхвыборок
(так называемый двухвыборочный t-критерий).
В этом случае есть контрольная группа
и экспериментальная (опытная) группа,
количество испытуемых в группах может
быть различно.

Во
втором случае, когда одна и та же группа
объектов порождает числовой матери­ал
для проверки гипотез о средних,
используется так называемый парный
t-критерий
.
Выборки при этом называют зависимымисвязанными.

а)
случай независимых выборок

Статистика
критерия для случая несвязанных,
независимых выборок равна:

                                                                             (1)                  

 где ,
средние арифметические в эксперименталь­ной
и контрольной группах,

 —
стан­дартная ошибка разности средних
арифметических. Находится из формулы:

  ,                              (2)

где n1 и n2 соответственно
величины первой и второй выборки.

Если n1=n2,
то стандартная ошибка разности средних
арифметических будет считаться по
формуле:

                                         (3)

где
n величина выборки.

Подсчет числа
степеней свободы
 осуществля­ется
по формуле:

k
= n1 +
n2 –
2.                                                                                     (4)

При
численном равенстве выборок k =
2n —
2.

Далее
необходимо срав­нить полученное
значение tэмп с
теоретическим значением t—рас­пределения
Стьюдента (см. приложение к учеб­никам
статистики). Если tэмп<tкрит,
то гипотезаH0 принимается,
в противном случае нулевая гипотеза
отвергается и принимается альтернативная
гипотеза.

Рассмотрим
пример использования t-критерия
Стьюдента для несвязных и неравных по
численности выборок.

Пример 1. В
двух группах учащихся — экспериментальной
и контрольной — получены следующие
результаты по учеб­ному предмету
(тестовые баллы; см. табл. 1).[1]

Таблица
1. Результаты эксперимента

Первая
группа (экспериментальная) N1=11
человек

Вторая
группа (контрольная)

N2=9
человек

12   14   13   16   11   9   13   15  15   18   14

13   9   11   10   7   6   8  10   11

Общее
количество членов выборки: n1=11, n2=9.

Расчет
средних арифметических: Хср=13,636; Yср=9,444

Стандартное
отклонение: sx=2,460; sy=2,186       

По
формуле (2) рассчитываем стандартную
ошибку разности арифметических средних:

Считаем
статистику критерия:

 Сравниваем
полученное в эксперименте значение t с
табличным значением с учетом степеней
свободы, равных по формуле (4) числу
испытуемых минус два (18).

Табличное
значение tкрит равняется
2,1 при допущении возможности риска
сделать ошибочное сужде­ние в пяти
случаях из ста (уровень значимости=5 %
или 0,05).

Если
полученное в эксперименте эмпирическое
значение t превы­шает табличное, то
есть основания принять альтернативную
гипотезу (H1)
о том, что учащиеся экспериментальной
группы показывают в среднем более
высокий уровень знаний. В эксперименте
t=3,981, табличное t=2,10, 3,981>2,10, откуда
следует вывод о преимуществе
эксперимен­тального обучения.

Здесь
могут возникнуть такие вопросы:

1.
Что если полученное в опыте значение t
окажется меньше табличного? Тогда надо
принять нулевую гипотезу.

2.
Доказано ли преимущество экспериментального
метода? Не столько доказано, сколько
показано, потому что с самого начала
допускается риск ошибиться в пяти
случаях из ста (р=0,05). Наш эксперимент
мог быть одним из этих пяти случаев. Но
95% возможных случаев говорит в пользу
альтернативной гипотезы, а это достаточно
убедительный аргумент в статистическом
доказательстве.

3.
Что если в контрольной группе результаты
окажутся выше, чем в экспериментальной?
Поменяем, например, местами, сделав средней
арифметической эксперимен­тальной
группы, a 
контрольной:

 Отсюда
следует вывод, что новый метод пока не
про­явил себя с хорошей стороны по
разным, возможно, при­чинам. Поскольку
абсолютное значение 3,9811>2,1, принимается
вторая альтернативная гипотеза (Н2)
о пре­имуществе традиционного метода.

б)
случай связанных (парных) выборок

В
случае связанных выборок с равным числом
измерений в каждой можно использовать
более простую формулу t-критерия
Стьюдента.

Вычисление
значения t осуществляется по формуле:

                                                                                                       (5)

  где 
разности между соответствующими
значениями переменной X и переменной
У, аd —
среднее этих разностей;

Sd
вычисляется по следующей формуле:

                                                                                       (6)

Число
степеней свободы k определяется
по формуле k=n-1.
Рассмотрим пример использования t-критерия
Стьюдента для связных и, очевидно, равных
по численности выборок.

Если tэмп<tкрит,
то нулевая гипотеза принимается, в
противном случае принимается
альтернативная.

Пример
2
.
Изучался уровень ориентации учащихся
на художественно-эстети­ческие
ценности. С целью активизации формирования
этой ориентации в экспериментальной
группе проводились бе­седы, выставки
детских рисунков, были организованы
по­сещения музеев и картинных галерей,
проведены встречи с музыкантами,
художниками и др. Закономерно встает
вопрос: какова эффективность проведенной
работы? С целью проверки эффективности
этой работы до начала эксперимента и
после давался тест. Из методических
со­ображений в таблице 2 приводятся
результаты небольшо­го числа
испытуемых.[2]

Таблица
2. Результаты эксперимента

Ученики

(n=10)

Баллы

Вспомогательные
расчеты

до
начала экспери­мента (Х)

в
конце

экспери­мента
(У)

d

d2

Иванов

14

18

4

16

Новиков

20

19

-1

1

Сидоров

15

22

7

49

Пирогов

11

17

6

36

Агапов

16

24

8

64

Суворов

13

21

8

64

Рыжиков

16

25

9

81

Серов

19

26

7

49

Топоров

15

24

9

81

Быстров

9

15

6

36

å

148

211

63

477

Среднее

14,8

21,1

Вначале
произведем расчет по формуле:

Затем
применим формулу (6), получим:

И,
наконец, следует применить формулу (5).
Получим:

Число
степеней свободы: k=10-1=9
и по таблице При­ложения 1 находим
tкрит =2.262,
экспериментальное t=6,678, откуда следует
возможность принятия альтерна­тивной
гипотезы (H1)
о достоверных различиях средних
арифметических, т. е. делается вывод об
эффективности экспериментального
воздействия.

В
терминах статистических гипотез
полученный результат будет звучать
так: на 5% уров­не гипотеза Н0 отклоняется
и принимается гипотеза Н1 .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Среднее арифметическое, как известно, используется для получения обобщающей характеристики некоторого набора данных. Если данные более-менее однородны и в них нет аномальных наблюдений (выбросов), то среднее хорошо обобщает данные, сведя к минимуму влияние случайных факторов (они взаимопогашаются при сложении).

Когда анализируемые данные представляют собой выборку (которая состоит из случайных значений), то среднее арифметическое часто (но не всегда) выступает в роли приближенной оценки математического ожидания. Почему приближенной? Потому что среднее арифметическое – это величина, которая зависит от набора случайных чисел, и, следовательно, сама является случайной величиной. При повторных экспериментах (даже в одних и тех же условиях) средние будут отличаться друг от друга.

Для того, чтобы на основе статистического анализа данных делать корректные выводы, необходимо оценить возможный разброс полученного результата. Для этого рассчитываются различные показатели вариации. Но то исходные данные. И как мы только что установили, среднее арифметическое также обладает разбросом, который необходимо оценить и учитывать в дальнейшем (в выводах, в выборе метода анализа и т.д.).

Интуитивно понятно, что разброс средней должен быть как-то связан с разбросом исходных данных. Основной характеристикой разброса средней выступает та же дисперсия.

Дисперсия выборочных данных – это средний квадрат отклонения от средней, и рассчитать ее по исходным данным не составляет труда, например, в Excel предусмотрены специальные функции. Однако, как же рассчитать дисперсию средней, если в распоряжении есть только одна выборка и одно среднее арифметическое?

Расчет дисперсии и стандартной ошибки средней арифметической

Чтобы получить дисперсию средней арифметической нет необходимости проводить множество экспериментов, достаточно иметь только одну выборку. Это легко доказать. Для начала вспомним, что средняя арифметическая (простая) рассчитывается по формуле:

формула средней арифметической

где xi – значения переменной,
n – количество значений.

Теперь учтем два свойства дисперсии, согласно которым, 1) — постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат и 2) — дисперсия суммы независимых случайных величин равняется сумме соответствующих дисперсий. Предполагается, что каждое случайное значение xi обладает одинаковым разбросом, поэтому несложно вывести формулу дисперсии средней арифметической:

Формула дисперсии средней арифметической

Используя более привычные обозначения, формулу записывают как:

Дисперсия средней арифметической

где σ2 – это дисперсия, случайной величины, причем генеральная.

На практике же, генеральная дисперсия известна далеко не всегда, точнее совсем редко, поэтому в качестве оной используют выборочную дисперсию:

Дисперсия средней арифметической по выборке

Стандартное отклонение средней арифметической называется стандартной ошибкой средней и рассчитывается, как квадратный корень из дисперсии.

Формула стандартной ошибки средней при использовании генеральной дисперсии

Стандартная ошибка средней

Формула стандартной ошибки средней при использовании выборочной дисперсии

Стандартная ошибка средней по выборке

Последняя формула на практике используется чаще всего, т.к. генеральная дисперсия обычно не известна. Чтобы не вводить новые обозначения, стандартную ошибку средней обычно записывают в виде соотношения стандартного отклонения выборки и корня объема выборки.

Назначение и свойство стандартной ошибки средней арифметической

Стандартная ошибка средней много, где используется. И очень полезно понимать ее свойства. Посмотрим еще раз на формулу стандартной ошибки средней:

Стандартная ошибка выборочной средней

Числитель – это стандартное отклонение выборки и здесь все понятно. Чем больше разброс данных, тем больше стандартная ошибка средней – прямо пропорциональная зависимость.

Посмотрим на знаменатель. Здесь находится квадратный корень из объема выборки. Соответственно, чем больше объем выборки, тем меньше стандартная ошибка средней. Для наглядности изобразим на одной диаграмме график нормально распределенной переменной со средней равной 10, сигмой – 3, и второй график – распределение средней арифметической этой же переменной, полученной по 16-ти наблюдениям (которое также будет нормальным).

Зависимость стандартной ошибки средней от объем выборки

Судя по формуле, разброс стандартной ошибки средней должен быть в 4 раза (корень из 16) меньше, чем разброс исходных данных, что и видно на рисунке выше. Чем больше наблюдений, тем меньше разброс средней.

Казалось бы, что для получения наиболее точной средней достаточно использовать максимально большую выборку и тогда стандартная ошибка средней будет стремиться к нулю, а сама средняя, соответственно, к математическому ожиданию. Однако квадратный корень объема выборки в знаменателе говорит о том, что связь между точностью выборочной средней и размером выборки не является линейной. Например, увеличение выборки с 20-ти до 50-ти наблюдений, то есть на 30 значений или в 2,5 раза, уменьшает стандартную ошибку средней только на 36%, а со 100-а до 130-ти наблюдений (на те же 30 значений), снижает разброс данных лишь на 12%.

Лучше всего изобразить эту мысль в виде графика зависимости стандартной ошибки средней от размера выборки. Пусть стандартное отклонение равно 10 (на форму графика это не влияет).

Распределение исходных данных и средней

Видно, что примерно после 50-ти значений, уменьшение стандартной ошибки средней резко замедляется, после 100-а – наклон постепенно становится почти нулевым.

Таким образом, при достижении некоторого размера выборки ее дальнейшее увеличение уже почти не сказывается на точности средней. Этот факт имеет далеко идущие последствия. Например, при проведении выборочного обследования населения (опроса) чрезмерное увеличение выборки ведет к неоправданным затратам, т.к. точность почти не меняется. Именно поэтому количество опрошенных редко превышает 1,5 тысячи человек. Точность при таком размере выборки часто является достаточной, а дальнейшее увеличение выборки – нецелесообразным.

Подведем итог. Расчет дисперсии и стандартной ошибки средней имеет довольно простую формулу и обладает полезным свойством, связанным с тем, что относительно хорошая точность средней достигается уже при 100 наблюдениях (в этом случае стандартная ошибка средней становится в 10 раз меньше, чем стандартное отклонение выборки). Больше, конечно, лучше, но бесконечно увеличивать объем выборки не имеет практического смысла. Хотя, все зависит от поставленных задач и цены ошибки. В некоторых опросах участие принимают десятки тысяч людей.

Дисперсия и стандартная ошибка средней имеют большое практическое значение. Они используются в проверке гипотез и расчете доверительных интервалов.

Поделиться в социальных сетях:

Понравилась статья? Поделить с друзьями:

Читайте также:

  • Стендофф error code 291
  • Старлайн а91 ошибка sp при автозапуске на брелке
  • Статус код об ошибочном запросе со стороны клиента
  • Старлайн ошибка ос7 при автозапуске как исправить ошибку
  • Стандартная ошибка прогноза это

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии