Добавил:
Vezen
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз:
Предмет:
Файл:
Скачиваний:
605
Добавлен:
20.06.2014
Размер:
2.76 Mб
Скачать
● Основные
характеристики выборочной и генеральной
совокупностей. Точечные оценки
-
Игральную
кость бросили
раз. При этом
очко выпало
раз,
очка –
раз,
очка –
раз,
очка –
раза,
очков –
раза,
очков –
раз. Найдите эмпирическую функцию
распределения числа очков, выпавших
при бросании игральной кости.
|
Xi |
1 |
2 |
3 |
4 |
5 |
6 |
|
Ni |
1 |
1 |
1 |
2 |
2 |
1 |
-
В четырех
независимых испытаниях случайная
величина
приняла следующие значения:
Найдите несмещенную оценку дисперсии
-
В
независимых испытаниях случайная
величиназначениe
приняла
раз, а значение
–
раз. Найдите несмещенную оценку дисперсии
-
Даны
результаты
независимых измерений одной и той же
величины прибором, не имеющим
систематических ошибок:м. Найдите несмещённую оценку дисперсии
ошибок измерений, если истинная длинам.
-
Даны
результаты
независимых измерений одной и той же
величины прибором, не имеющим
систематических ошибок:м. Найдите несмещённую оценку дисперсии
ошибок измерений, если истинная длина
неизвестна. -
Используя
метод моментов, оцените параметры
и
равномерного распределения на отрезке
по эмпирическому распределению
-
Значение
3
5
7
9
Частота
21
18
15
26
-
Случайная
величина
(время бесперебойной работы устройства)
имеет показательное распределение с
плотностью(
).
По эмпирическому распределению времени
работы
|
Время |
|
|
|
|
|
Число |
|
|
|
|
методом
моментов найдите точечную оценку
.
-
Случайная
величина
распределена по закону Пуассона
.
Результатынезависимых наблюдений
отражены в таблице
|
Значение |
0 |
1 |
2 |
3 |
|
Частота |
|
|
|
|
Найдите
методом моментов точечную оценку
.
● Интервальные
оценки параметров распределения
-
В
сеансах игры с автоматом выигрыш
появилсяраз. Найдите для вероятности выигрыша
приближенный
– доверительный интервал.
-
Глубина
моря измеряется прибором, систематическая
ошибка которого равна
,
а случайные ошибки распределены
нормально со среднеквадратичным
отклонениемм. Каково наименьшее число независимых
измерений, при котором удается определить
глубину с ошибкой меньшеметров с надежностью не ниже
?
-
Брокер
на бирже желает найти
-доверительный
интервал для математического ожидания
недельной доходности выбранной акции.
Известно, что выборочная средняя
недельная доходность за последний год
(52 недели) составила.
Найдите искомый доверительный интервал
в предположении, что недельные доходности
независимы и распределены нормально
с постоянными параметрами, причем
генеральное среднеквадратичное
отклонение недельной доходности равно.
-
Найдите
‑доверительный
интервал для генерального среднего
нормально распределенного признака,
если генеральное среднеквадратичное
отклонение равно,
а выборочное среднее при объеме выборкиравно
.
-
Выборка
из большой партии электроламп содержит
ламп. Средняя продолжительность горения
отобранных ламп оказалась равнойч. Найдите приближенный
-доверительный
интервал для средней продолжительности
горения лампы во всей партии, если
известно, что среднеквадратичное
отклонение продолжительности горения
лампы в партии равноч.
-
Произведено
независимых испытаний, в каждом из
которых неизвестная вероятностьсобытия
постоянна. Событие
наступило в
испытаниях. Найдите для вероятности
приближенный 0.994‑доверительный
интервал.
-
Выборочно
обследовали качество кирпича. Из
проб в
случаях кирпич оказался бракованным.
В каких пределах заключается доля брака
для всей продукции, если результат
гарантируется с надежностью?
-
При
испытании
элементов зарегистрировано
отказов. Найдите доверительный интервал,
покрывающий неизвестную вероятностьотказа элемента с надежностью
.
-
В
результате проведенного социологического
опроса
человек рейтинг кандидата в президенты
составил.
Найдите доверительный интервал для
рейтинга кандидата с гарантированной
надежностью.
-
Численность
повторной выборки составляет
единиц. Доля признака составляет
.
Найдите с доверительной вероятностью,
в каких пределах находится отклонение
частоты от доли признака.
-
Обследуется
средняя продолжительность телефонного
разговора. Сколько телефонных разговоров
должно быть зафиксировано, чтобы с
вероятностью
можно было бы утверждать, что отклонение
средней продолжительности зафиксированных
разговоров от генеральной средней не
превосходитсекунд, если среднее квадратичное
отклонение длительности одного разговора
равноминутам?
-
Производится
выборочное обследование возраста
читателей массовых библиотек. Сколько
карточек необходимо взять для
обследования, чтобы с вероятностью
можно было бы утверждать, что средний
возраст в выборочной совокупности
отклонится от генерального среднего
не более, чем на 2 года? Генеральное
среднее квадратичное принять равнымгодам.
55
0< <0,16∙(1+1,80); 0< <0,448.
Ответ: 0<<0,448.
Пример 3.
По данным 9 независимых равноточных измерений некоторой физической величины найдены среднее арифметическое результатов измерений =42,319 и «исправленное» среднее квадратическое отклонение s=5,0. Требуется оценить истинное значение случайной величины с надежностью
=0,95.
Решение.
Истинное значение случайной величины равно ее математическому ожиданию и задача сводится к нахождению доверительного интервала для оценки математического ожидания при неизвестном .

По заданным =0,95 и n=9 по таблице приложения 3 находим
=
.
Найдем доверительные границы:


Ответ: С надежностью =0,95 истинное значение измеряемой физической величины заключено в доверительном интервале 38,469<a<46,169.
Пример 4.
Построить доверительный интервал для оценки неизвестного математического ожидания нормального распределения при n=9, s=3, =6.
Решение.
Решим задачу двумя способами.
1) Примем в качестве среднего квадратического отклонения «исправленное» среднее квадратическое отклонение, т. е.
=s=3,
и найдем искомый доверительный интервал по формуле

По приложению 2 найдем из соотношения




тогда доверительный интервал для оценки математического ожидания равен
4,04<a<7,96.
2) Будем считать, что неизвестно и найдем искомый доверительный интервал по формуле

По таблице приложения 3 найдем
;




Таким образом, доверительный интервал равен
3,69<a<8,31
В первом случае длина интервала равна 7,96 – 4,04=3,92, во втором случае – 8,31 – 3,69=4,62.
Мы видим, что во втором случае с помощью закона Стьюдента получен более широкий доверительный интервал для оценки математического ожидания по сравнению с результатом, полученным для нормального закона распределения. При использовании t – распределения учитывается, что никакой дополнительной информации о дисперсии генеральной совокупности кроме той, которую дает выборка, нет. Поэтому использование при оценке математического ожидания нормального закона распределения при малом объеме выборки n и неизвестной дисперсии
привело бы к неоправданному сужению доверительного интервала.
Итак, для оценки математического ожидания нормального распределения по малым выборкам и неизвестном следует пользоваться t – распределением Стьюдента.
Пример 5.
Производят независимые испытания с одинаковой, но неизвестной вероятностью p появления события А в каждом испытании. Найти доверительный интервал для оценки вероятности p биномиального распределения с надежностью 0,95, если в 80 испытаниях событие А появилось 16 раз.
Решение.
По условию n=80; m=16; .
Найдем относительную частоту появления события А:

Найдем аргумент t функции Лапласа из соотношения

Найдем концы интервала p1 и p2:
Ответ: искомый доверительный интервал 0,128<p<0,299.
Пример 6.
Найти доверительный интервал для оценки с надежностью 0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение , выборочная средняя
и объем выборки n=25.
Решение.
Требуется найти доверительный интервал

Все величины, кроме t, известны. Найдем t из соотношения Ф(t)=0,95/2=0,475. По таблице приложения 2 находим t=1,96. Подставив t=1,96, =14,
=5, n=25 в формулу, окончательно получим искомый доверительный интервал 12,04<a<15,96.
Контрольная работа
Задание № 1.
Найти внутригрупповую, межгрупповую и общую дисперсию совокупности, состоящей из трех групп.
I II III
|
1. |
|
|
|
||||||||||||||||||||||
|
2. |
|
|
|
||||||||||||||||||||||
|
3. |
|
|
|
||||||||||||||||||||||
|
4. |
|
|
|
||||||||||||||||||||||
|
5. |
|
|
|
||||||||||||||||||||||
|
6. |
|
|
|
||||||||||||||||||||||
|
7. |
|
|
|
||||||||||||||||||||||
|
8. |
|
|
|
||||||||||||||||||||||
|
9. |
|
|
|
||||||||||||||||||||||
|
10. |
|
|
|
Задание № 2
1. Найти доверительный интервал для оценки параметра нормального распределения с надежностью
по выборке:
,
если .
2. Событие А в серии из испытаний Бернулли произошло
раз. Найти интервальную оценку для вероятности Р событий А с надежностью

3. Найти минимальный объем выборки из нормальной генеральной совокупности, при котором с надежностью не меньшей , погрешность средней, найденная по этой выборке, будет меньше 0,3, если
.
4. Для оценки параметров нормально распределенной случайной величины была сделана выборка объема 30 и вычислено
. Найти доверительный интервал, покрывающий
с надежностью 0,90.
5. Производятся независимые испытания с одинаковой, но с неизвестной вероятностью Р появления события А в каждом испытании. Найти доверительный интервал для оценки Р с надежностью 0,95, если в 400 испытаниях событие А появилось 80 раз.
6. Количественный признак Х генеральной совокупности распределен нормально, по выборке объема 16 найдено . Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью 0,999.
7. Глубина моря измеряется прибором, систематическая ошибка которого равна нулю, а случайные ошибки распределены нормально с см. Сколько надо сделать независимых измерений, чтобы определить глубину моря с ошибкой не более 5м при надежности 0,9?
8. Произведено 5 независимых наблюдений С. В. Х (нормальное распределение,неизвестно): x1=-25, x2=34, x3=-20, x4=10, x5=21. При уровне значимости 0,95 найти доверительный интервал для параметра
.
9. На контрольных испытаниях 16 осветительных ламп были определены: 
ч. Считая, что срок службы лампы является нормально распределенной С. В. Найти с надежностью 0,9 доверительный интервал для параметра
.
10. С. В. распределена по нормальному закону с параметром . По выборке объема
найти интервальную оценку параметра
.
Котрольная работа по математике
1.
Статистические ряды
Х – изучаемый признак – случайной величиной.
Произведено
наблюдений.
Полученные
наблюдения образуют выборку объемом :
.
Значения — варианты.
Результаты наблюдений, записанные в порядке
возрастания вариант:
называются вариационным рядом.
Пример 1. При исследовании состояния лесного массива выявлено на одном гектаре
следующее число пораженных деревьев:
4 12 11 13 15 7 15 6 4 9 10 15.
Расположив
полученные данные в порядке возрастания, получим вариационный ряд:
4 4 6 7 9 10 11 12 13 15 15 15.
Количество
исследованных гектаров – объем выборки .
Если значение встречается
в наблюдениях раз, то число
называется частотой величины
, а отношение частоты к общему числу
опытов называется относительной частотой или частостью:

В
примере 1 для варианты и
.
Важное свойство частот и частостей:


где
— число различных вариант в
выборке.
В
примере 1 .
Последовательность чисел называется
статистическим рядом и записывается в виде таблицы.
|
|
|
|
. . . |
|
|
|
|
|
. . . |
|
Пример 2. Количество ежедневных нарушений техники безопасности в цехе,
сделанных за месяц, представлено следующими данными:
5 6 5 6 6 4 9 6 4 5
1 4 5 10 10 5 2 2 5 7
4 0 6 5 7 6 9 1 9 4.
Статистический
ряд распределения частот будет иметь вид:
|
|
0 |
1 |
2 |
4 |
5 |
6 |
7 |
9 |
10 |
|
|
1 |
2 |
2 |
5 |
7 |
6 |
2 |
3 |
2 |
Ломаная линия, соединяющая точки , называется полигоном частот.
Для примера 2 полигон частот имеет вид:
Полигон частот распределения ежедневных нарушений ТБ.
Замечание. Если
вместо значений частот взять значения относительных частот, то ломаная линия,
соединяющая точки , называется полигоном
относительных частот.
Для непрерывных признаков и при большом объеме выборки
данные группируются, и результаты представляются в виде интервального
статистического ряда.
2.
Оценки
математического ожидания
Статистической оценкой математического ожидания называется среднее арифметическое
элементов выборки, которая называется выборочное среднее и обозначается .
Для выборки объемом n, заданной
вариационным рядом :

Пример.
В контрольной точке на морской акватории из придонного слоя отобрали 5 проб
воды и определили в них содержание растворенного кислорода, получив следующие
значения (мл/л): 5,07 5,16
5,19 5,23 5,25.
Тогда содержание растворённого кислорода в придонном
слое оценим значением

Если учитывается повтор значений вариант, то данные
представляются статистическим рядом
|
|
|
|
. . . |
|
|
|
|
|
. . . |
|
и
выборочное среднее рассчитывается по формуле:

3.
Доверительный
интервал для математического ожидания нормального распределения с известной
дисперсией
Условие (1) для математического ожидания принимает вид
(2)
Для
нормального распределения

Из
(2) и (3) имеем уравнение для определения d

Введем
обозначение: 
Тогда

Значение

функции Лапласа.
Например,
для

в таблице 2 находим:
|
|
|
|
1,96 |
0,4750 |
Следовательно,.
После определения определяем
точность оценки по формуле:

и
границы доверительного интервала:
и
(6)
Таким образом, с надежностью доверительный
интервал содержит в себе генеральное среднее
(математическое ожидание) а или в %
случаев построенный интервал накроет истинное значение параметра а.
Задача. 1. Пусть имеется
генеральная совокупность с некоторой характеристикой, распределенной по
нормальному закону с дисперсией, равной .
Произведена выборка объема n = 27 и получено выборочное среднее характеристики
. Найти доверительный интервал,
покрывающий неизвестное математическое ожидание исследуемой характеристики
генеральной совокупности с надежностью .
Дано: n = 27, ,
,
.
Решение.
1)
По таблице 2 для функции
Лапласа из уравнения
найдем значение .
2) Определим точность оценки d:

3)Находим границы доверительного интервала:
Отсюда
получаем искомый доверительный интервал:
(10,76; 13,24).
Случай
больших выборок. Приведенные выше
расчеты доверительного интервала применяются и в случаях с неизвестной
дисперсии, но только если объем выборок ,
т.е. в случаях больших выборок.
В
этом случае в формулах (3) и (4) вместо используется
его вычисленная по выборке несмещенная оценка .
Для примера (из лекций) о концентрации нитратов в
огурцах найдем доверительный интервал генерального среднего с надежностью . При этом мы предполагаем нормальное
распределение концентрации нитратов.
Имеем ,
.
1)Для
находим по таблице 2
,
2)Тогда 
3) и
.
Отсюда
получаем искомый доверительный интервал: (7,0; 8,0).
Минимальный
объем выборки. Если требуется оценить
математическое ожидание с наперед заданной точностью оценки d
и надежностью , то из формулы (3) получим
формулу для минимального объема выборки, который обеспечит эту точность:

Задача
2. Морская глубина измеряется
прибором, систематическая ошибка измерения которого равна нулю, а случайная ошибка измерения распределена нормально со
среднеквадратическим отклонением 18м. Сколько надо сделать независимых
измерений, чтобы определить глубину моря с точностью 4 м при надежности 0,996?
Решение. Согласно условию задачи . По
таблице 2 для функции Лапласа из уравнения
найдем
значение .
откуда
.
Поскольку
n – число целое, то .
Доверительный
интервал для математического ожидания нормального распределения с неизвестной
дисперсией
Обычно дисперсия распределения неизвестна и мы можем
только по выборке получить оценки
и
.
По данным выборки построим случайную величину

Условие определения доверительного интервала (2)
перепишем в виде
Введем
обозначение: 
Тогда
последнее уравнение примет вид
. (7)
Значения
, удовлетворяющие уравнению (7) при
различных значениях и n,
определяются по таблице 3.
После определения алгоритм
построения доверительного интервала аналогичен случаю известной дисперсии.
Случайная величина t имеет t-распределение
Стьюдента, вид которого, сильно зависит от объема выборки .
При распределение
Стьюдента близко к нормальному распределению и можно пользоваться таблицей 2
для нормального распределения.
При — случай малых
выборок — распределение Стьюдента далеко от нормального. Поэтому в этом
случае использование таблиц распределения Стьюдента необходимо.
Алгоритм построения
доверительного интервала:
1)
Значения ,
удовлетворяющие уравнению (7) при различных значениях и
n, определяются по таблице 3
2)
Точность оценки находим по
формуле:

3)
Находим границы доверительного интервала :
.
Пример
1лекции 1 (продолжение).
Дано:
,
1)По
таблице 3
.
2)Точность
3)
Границы интервала:
.
Получим доверительный интервал (7,5; 12,7).
Оценка
достоверных различий между результатами измерений и фиксированной величиной с
помощью доверительного интервала
В практической деятельности по контролю состояния
окружающей среды нередко возникает необходимость сравнить результаты измерений
с какой-либо заданной фиксированной величиной.
Наиболее типичный случай – сравнение с величиной
предельно допустимой концентрации (ПДК) загрязняющего вещества в объектах
окружающей среды.
Пусть фиксированная величина – ПДК, тогда
если >
ПДК ПДК превышена (с надежностью
):
если <
ПДК ПДК не превышена (с надежностью
):
если <ПДК <
различия
недостоверны (с надежностью ):

В % случаев наши выводы
могут оказаться неверными.
Задача
3. Произведено девять проб почвы с целью определения,
превышает ли концентрация загрязняющего вещества уровень ПДК, равный 4,2 мг/кг.
Получены следующие результаты в мг/кг:
4.7; 5.8; 3.9; 6.1; 5.1; 4.4; 4.6; 4.1; 4.5
Можно ли с надежностью 0.95 утверждать, что ПДК в
среднем превышена?
Решение.
1) Вычисляем выборочное среднее:
2)
Вычисляем дисперсию:
и
выборочное среднее отклонение .
3)
Так как то по таблице 3
.
4) Точность оценки

5) Границы интервала:
.
Получим доверительный интервал
(4,23;5,37) мг/кг.
6)Так как >
ПДК=4,2, то можно утверждать, что ПДК превышена.
Ответ: Можно с заданной доверительной
вероятностью.
4. Задача.
4.
Пусть имеется генеральная совокупность с некоторой характеристикой,
распределенной по нормальному закону с дисперсией, равной . Произведена выборка объема n = 27 и
получено выборочное среднее характеристики .
Найти доверительный интервал, покрывающий неизвестное математическое ожидание
исследуемой характеристики генеральной совокупности с надежностью .
Дано: n = 27, ,
,
.
Решение.
2) По таблице 2 для функции Лапласа из
уравнения
найдем значение .
2) Определим точность
оценки d:

3)Находим границы
доверительного интервала:
Отсюда получаем искомый доверительный
интервал:
(10,76; 13,24).
Случай больших выборок. Приведенные выше расчеты
доверительного интервала применяются и в случаях с неизвестной дисперсии, но
только если объем выборок , т.е. в случаях
больших выборок.
В этом случае в формулах (3) и (4)
вместо используется его вычисленная по выборке
несмещенная оценка .
Для примера (из
лекций) о концентрации нитратов в огурцах найдем доверительный интервал
генерального среднего с надежностью . При этом мы
предполагаем нормальное распределение концентрации нитратов.
Имеем ,
.
1)Для
находим
по таблице 2 ,
2)Тогда 
3) и
.
Отсюда получаем искомый доверительный
интервал: (7,0; 8,0).
Минимальный объем выборки. Если требуется оценить
математическое ожидание с наперед заданной точностью оценки d и надежностью , то из формулы (3) получим формулу для
минимального объема выборки, который обеспечит эту точность:

Задача 5. Морская глубина измеряется
прибором, систематическая ошибка измерения которого равна нулю, а случайная ошибка измерения распределена нормально со
среднеквадратическим отклонением 18м. Сколько надо сделать независимых
измерений, чтобы определить глубину моря с точностью 4 м при надежности 0,996?
Решение. Согласно условию задачи . По таблице 2 для функции Лапласа из
уравнения
найдем значение .
откуда
.
Поскольку n – число целое, то .
5.
Понятие статистической гипотезы
Статистической гипотезой называется предположение о виде распределения или о
параметрах известных распределений.
Гипотезы
о значениях параметров распределения или о сравнительной величине параметров
двух распределений называются параметрическими гипотезами.
Гипотезы
о виде распределения называются непараметрическими гипотезами.
Проверить статистическую гипотезу – это значит проверить, согласуются ли данные,
полученные из выборки с этой гипотезой.
Гипотезу, выдвинутую для проверки ее согласия с
выборочными данными, называют нулевой гипотезой и обозначают H0.
Вместе с гипотезой H0 выдвигается альтернативная
или конкурирующая гипотеза, которая противоречит основной и которая
обозначается H1.
ПРИМЕРЫ
Гипотеза 1. При исследовании местности было
произведено несколько проб древесины и вычислено, что среднее число пораженных
деревьев на 1 га равно . Через некоторое время
произведено повторное исследование, и среднее число пораженных деревьев стало , причем
.
Встает вопрос, расхождение случайно и связано с
недостаточным числом измерений или закономерно и связано с изменением течения
болезни?
Пусть случайная величина Х
−первоначальное состояние всех деревьев;
случайная
величина Y − состояние через некоторое время.
Тогда
.
Гипотеза
2. На акватории в контрольной точке ниже выпуска сточных вод предприятия взяты
пробы воды для определения содержания в воде некоторого загрязняющего вещества.
Полученная средняя концентрация равна ,
причем , где
—
фоновая концентрация загрязняющего вещества, полученная до начала работы
предприятия.
Если
полученное превышение значимо, то предприятие может быть подвергнуто
экономическим санкциям. Поэтому утверждение о превышении фоновой концентрации
должно быть подвергнуто статистической проверки.
Пусть
Х – фоновая концентрация вещества,
Y – концентрация вещества после начала работы
предприятия.
Задача
проверки гипотез имеет вид:
.
Принятие гипотезы в результате проверки
не означает утверждения, что гипотеза верна. Это лишь означает, что результаты
наблюдений не дают оснований её отвергнуть.
Если основная гипотеза отвергается, то
принимается альтернативная гипотеза.
Ошибки принятия
гипотез
Ошибка 1 рода
состоит в том, что будет отвергнута правильная гипотеза.
Ошибка 2 рода
состоит в том, что будет принята неправильная гипотеза.
|
|
принимается |
отвергается |
|
верна |
Решение правильное |
Ошибка 1 рода |
|
неверна |
Ошибка 2 рода |
Решение правльн |
Вероятность допустить ошибку 1
рода называют уровнем значимости.
6. Проверка гипотезы о равенстве дисперсий
На практике задача сравнения дисперсий возникает, если
требуется сравнить точность приборов, инструментов, методов измерений,
технологий.
Очевидно, предпочтительнее взять тот прибор,
инструмент и т.п., который обеспечивает наименьшее рассеяние результатов
измерений, т.е. наименьшую дисперсию.
Проведем
измерения на двух приборах.
Пусть все возможные измерения первым прибором − Х
и этим прибором проведено измерений, и по ним
вычислена − оценка
.
Пусть все возможные измерения первым прибором − Y
и этим прибором проведено измерений, и по ним
вычислена − оценка
,
причем 
Требуется по выборочным средним и заданном проверить значимость этого различия.
Краткое
условие:
Х:
,
Y:
, причем

Сформулируем
гипотезу:
Зададим
или
в
зависимости от конкретной задачи.
Вычислим

где 
а — меньшая дисперсия.
Соответствующая
случайная величина F − статистический критерий данной задачи
− имеет распределение Фишера – Снедекора.
Если


Критическая
область — правосторонняя.
Для
определения найдем степени свободы:
,
где
— объем выборки с большей дисперсией
— объем выборки с меньшей дисперсией
.
По
таблице 7 определим
.
Сравниваем


—
если
,
принимаем
, (различие в оценках дисперсии
незначимо и точности обоих приборов одинаковы);
—
если
,
принимаем
. (отклоняем гипотезу
. Второй прибор точнее.)
Задача
6.
Для проверки точности дозировки двух автоматов по упаковке химического вещества
отобраны от первого автомата 12 проб, от второго – 15 проб. По отобранным
пробам рассчитаны оценки дисперсии: 11,41 и 6,52 соответственно. Можно ли на
основе сделанных измерений и по уровню значимости 0,05 сделать вывод, что
второй прибор точнее.
Краткое
условие:
Х: 
=11,41
Y: =15
=6,52,
Согласно
условию 
Решение.
.
Так
как 

Для
определения определим
.
По
таблице 7
.
Так
как
принимаем
.
Это
означает, что точности автоматов по упаковке химического вещества одинаковы.
Схема
решения:
|
Ho |
H1 |
Статистика критерия |
Критические точки |
Условие принятия Ho |
|
|
|
|
|
таблица |
|
|
|
|
|
7. Проверка
гипотезы о числовом значении среднего нормального распределения
Рассмотрим производство, при котором автоматически
должен соблюдаться некоторый параметр производимых изделий.
Значение параметра для каждого отдельного изделия
может, естественно, как отклоняться от заданного номинала.
Очевидно, что для того, чтобы проверить правильность
настройки станка, надо убедиться в том, что среднее значение параметра у
производимых на нем изделий будет соответствовать номиналу, т.е. проверить
гипотезу

Здесь Х – нормально распределенная генеральная
совокупность значений этого параметра.
Гипотезы о
числовом значении среднего нормального распределения
(случай известной дисперсии)
Предположение о том, что дисперсия известна, оправдано
для случай большой выборки. Так же это оправдано, если данным методом ранее уже
было произведено множество измерений и дисперсия определена.
Пусть из совокупности Х с известной
дисперсией сделана выборка объемом
, и по наблюдениям вычислено
. Пусть
—
предполагаемое значение для М(Х) и .
Требуется по выборочным средним и заданном уровне значимости проверить
значимость этого различия.
Кратко:
Х:
известна.
Для
поставленной задачи выдвинем гипотезу
.
Альтернативная
гипотеза может иметь вид:
а) или
,
б) .
Случайная величина N имеет
нормальное распределение N(O,1),
По
выборке вычисляем

Случайная величина N имеет
нормальное распределение N(O,1),
Схема
решения:
|
Ho |
H1 |
Статистика критерия |
Критические точки |
Условие принятия Ho |
|
|
|
таблица 2 |
|
|
|
|
|
Задача
7. Установлено, что средний вес таблетки лекарства
сильного действия должен быть равен мг. Выборочная
проверка 121 таблетки полученной партии лекарства показала, что средний вес
таблетки этой партии мг. Требуется проверить
значимость этого превышения нормы при уровне значимости 0,01. Многократными
предварительными опытами по взвешиванию таблеток, поставляемых фармацевтическим
заводом, было установлено, что вес таблеток распределен нормально со средним
квадратичным отклонением мг.
Решение.
Кратко:
Х: =121
=0,53
.
Для
поставленной задачи выдвинем гипотезы
.
По
выборке вычисляем

Критическая
точка является решением уравнения

и
по таблице 2 находим =2,34.
Так
как

отвергаем
гипотезу и принимаем гипотезу

значимо.
А
это значит, что партия таблеток не может быть пущена в продажу.
Фармацевтическая фирма терпит убытки.
Если
бы эти таблетки были пущены в продажу, то была бы совершена ошибка 2 рода, и
она могла бы иметь очень серьезные последствия для здоровья людей.
Гипотезы о
числовом значении среднего нормального распределения
(случай неизвестной дисперсии)
Схема
решения:
|
Ho |
H1 |
Статистика критерия |
Критические точки |
Условие принятия Ho |
|
|
|
|
|
таблица 6 |
|
|
|
|
|
9. Проверка гипотезы
о равенстве средних двух нормальных совокупностей
(зависимые выборки)
Ранее при сравнении средних двух серий измерений
предполагалось, что эти измерения проводятся независимо друг от друга.
Такое условие не выполняется, если следим за развитием
болезни у одних и тех же больных.
Пусть, например, группа объектов подвергается какому-то
воздействию. Измеряется некоторый признак до и после воздействия.
Требуется проверить влияние воздействия на данный
признак.
В этом случае задачу сравнения средних двух
совокупностей можно переформулировать.
Будем рассматривать разность значений признака до и
после лечения у одних и тех же объектов.
Тогда это значение предположительно равно нулю
(нулевая гипотеза) и можно применить весь аппарат проверки гипотезы о равенстве
среднего предполагаемому значению.
Пусть значение признака в первой серии взяты из
генеральной совокупности Х, а во второй – Y.
Из этих совокупностей произведены выборки одинакового
объема , варианты которых равны
и
.
Рассмотрим случайную величину
D= Y
—X,
варианты
которой имеют значения

Тогда условие задачи сводится к проверке гипотезы
.
Задача
8. Пусть 10 пациентов получали изучаемый метод лечения,
и у каждого пациента измерялось значение признака до после лечения:
|
до |
0,8 |
0,9 |
2,5 |
1,2 |
1,3 |
1,5 |
1,6 |
2,1 |
2,0 |
1,0 |
|
после |
4,8 |
5,9 |
6,5 |
4,7 |
6,3 |
6,5 |
5,1 |
6,1 |
4,0 |
6,0 |
Требуется,
при проверить оказало ли лечение влияние на
изучаемый признак.
Решение.
Вычислим значения разностей :
|
di |
4,0 |
5,0 |
4,0 |
3,5 |
5,0 |
5,0 |
3,5 |
4,0 |
2,0 |
5,0 |
и
рассчитаем требуемые числовые характеристики:


По
полученным данным рассчитаем

Определим границы
двусторонней критической области:
,
.
Так как
, то принимаем гипотезу
. Следовательно, лечение оказало влияние
на изучаемый признак.
Аналогичные задачи возникают,
если одни и те же пробы почвы анализируются разными методами.
10. Точечные статистические оценки
параметров двумерных совокупностей
Пусть требуется обработать результаты наблюдений двух
величин X и Y.
Таблицы наблюдений
Если число наблюдений n небольшое,
то результаты наблюдений представляются в
виде таблицы наблюдений
|
|
|
|
. . . |
|
|
|
|
|
. . . |
|
Для вычисления числовых характеристик в этом случае
таблицу наблюдений удобно дополнить до следующей таблицы:
|
№ |
1 |
2 |
n |
суммы |
|
|
xi |
x1 |
x2 |
… |
xn |
|
|
yi |
y1 |
y2 |
… |
yn |
|
|
xi2 |
x12 |
x22 |
… |
xk2 |
|
|
yi2 |
y12 |
y22 |
… |
yn2 |
|
|
xi yi |
x1y1 |
x2y2 |
… |
xnyn |
|
Используя последний столбец таблицы, находим оценки
числовых характеристик.
Оценками математических ожиданий являются выборочные
средние значения


Несмещенные
оценки дисперсий 



Расчетные
формулы:


Несмещенная оценка корреляционного момента называется эмпирический
корреляционный момент:

Оценка
коэффициента корреляции:

и

Расчетные
формулы:

или

и

Замечание. Применяются также выборочные оценки дисперсий:


и выборочный
корреляционный момент
или
При
этом


Выборочный корреляционный момент и выборочные
дисперсии являются смещенными оценками корреляционного момента и дисперсий.
Пример. Дана таблица наблюдений
|
номер наблюдения |
x |
y |
|
1 |
1 |
3,3 |
|
2 |
1,4 |
2,0 |
|
3 |
1,8 |
5,8 |
|
4 |
2,2 |
4,1 |
|
5 |
2,6 |
5,2 |
|
6 |
3 |
7,3 |
Решение:
Для вычисления оценок
числовых характеристик заполним следующую таблицу
|
номер наблюдения |
1 |
2 |
3 |
4 |
5 |
6 |
суммы |
|
xi |
1,0 |
1,4 |
1,8 |
2,2 |
2,6 |
3,0 |
12,0 |
|
yi |
3,3 |
2,0 |
5,8 |
4,1 |
5,2 |
7,3 |
27,7 |
|
xi2 |
1,00 |
1,96 |
3,24 |
4,84 |
6,76 |
9,00 |
26,8 |
|
yi2 |
10,89 |
4,00 |
33,64 |
16,81 |
27,04 |
53,29 |
145,67 |
|
xi |
3,30 |
2,80 |
10,44 |
9,02 |
13,52 |
21,90 |
60,98 |
По суммам в последнем столбце
рассчитаем числовые характеристики




Проверка значимости коэффициента корреляции
Пусть известно, что проведены наблюдения для нормально
распределенной двумерной характеристики (X; Y).
При между переменами
отсутствует линейная корреляция. Если оценка , то,
так как число наблюдений ограничено, нельзя заключить, что коэффициент
корреляции 
Тем самым требуется проверить, действительно ли
величины X и Y линейно коррелированны или это вызвано случайными
факторами.
Для этого при заданном уровне значимости проводится проверка гипотезы

.
При
справедливости гипотезы статистический
критерий

имеет
распределение Стьюдента с степенями свободы.
Поэтому
гипотеза 

а
значения 
11. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
Пусть исходная информация
задана таблицей наблюдений
|
|
|
|
. . . |
|
|
|
|
|
. . . |
|
Тогда

В основе метода
наименьших квадратов (метод МНК) лежит критерий минимизации суммы
квадратов ошибок ., т.е.

1)
Линейная регрессия.
Пусть
(4)
где и
— некоторые параметры. Тогда задача
(2) имеет вид

Нахождение минимума функции
двух переменных сводится к решению системы
уравнений

или
Раскрыв скобки, и проведя
преобразования, получим
систему

Решая эту систему, найдем,
что

(8)
т.е. получим коэффициенты выборочного
уравнения линейной регрессии. тем самым прямая, построенная по методу МНК
совпадает с выборочным уравнением линейной регрессии.
2) Квадратичная регрессия
Пусть
(9)
где ,
и
—
некоторые параметры. Тогда задача (2) имеет вид

Нахождение минимума функции
двух переменных сводится к решению системы
уравнений

или

3)
Другие виды функции регрессии.
Если диаграмма рассеяния
имеет вид
то
функцию регрессии ищут в виде
Поиск
неизвестных коэффициентов и
производится путем логарифмирования
уравнения:
Обозначим
,
и
. Тогда в новых переменных уравнение
регрессии примет линейный вид:
,
и
коэффициенты А и В ищем методом МНК для линейной регрессии.
Пример.
В результате многолетних исследований толщины слоя ила после разлива на
пойменных лугах в зависимости от толщины снежного покрова получены следующие
данные
|
толщина снежного покрова , |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
толщина слоя ила, см |
0,5 |
1,0 |
1,4 |
1,7 |
1,8 |
1,9 |
2,0 |
Требуется
найти зависимость между толщиной снежного покрова и толщиной слоя ила.
Решение. Пусть x – толщина слоя снега, а y – толщина
слоя ила. Предполагаем, что зависимость между ними имеет вид
Введя обозначения ,
и
, для линейной регрессии:
,
Система (7) имеет вид

составим таблицу
|
|
|
|
|
|
0,5 |
-0,3010 |
1 |
-0,3010 |
|
2 |
1,0 |
0 |
4 |
0 |
||||
|
3 |
1,4 |
0,1461 |
9 |
0,4383 |
||||
|
4 |
1,7 |
0,2304 |
16 |
0,9216 |
||||
|
5 |
1,8 |
0,2553 |
25 |
1,2765 |
||||
|
6 |
1,9 |
0,2788 |
36 |
1,6728 |
||||
|
7 |
2,0 |
0,3010 |
49 |
2,1070 |
||||
|
|
10,3 |
0,9106 |
140 |
6,1152 |
Система (13) тогда имеет вид

Решив систему, и сделав
преобразование ,


Следовательно,
уравнение регрессии для зависимости толщины слоя ила от толщины снежного
покрова имеет вид:
.
Если диаграмма рассеяния
имеет вид
то функцию регрессии ищем в
виде
Это уравнение также может
быть линеаризовано путем перехода к переменным
,
в которых уравнение имеет вид
.
Если диаграмма рассеяния
имеет вид
то зависимость между
переменными можно искать в виде
которое может быть
линеаризовано, положив 
имеет вид
.
12. Выборочная линейная
регрессия
Определение. Выборочным уравнением линейной регрессии Y на X называется уравнение

где
— значения линии регрессии, причем
величина

называется
коэффициентом линейной регрессии Y на X.
Выборочное уравнение линейной регрессии (1) может быть
приведено к виду
, (3)
в
котором
и
. (4)
Рассмотрим положение точек наблюдения относительно выборочной линейной
регрессии.
Если
, то
Если
, то
Если
, то
Если
, то
Если
, то
Чем ближе 
«теснее» расположены точки наблюдений относительно выборочного уравнения
линейной регрессии.
Тогда выборочное уравнение линейной регрессии может
приближенно описывать функцию регрессии ,
т.е. считаться её оценкой.
Чем меньше 
«облако» наблюдений, тем в меньшей степени уравнение линейной регрессии
отражает связь между наблюдениями.
Коэффициент корреляции является
показателем тесноты линейной зависимости между переменными.
13. Доверительный
интервал для линейной регрессии
Пусть — измерения величины
y при различных значениях независимой
величины x.
Считаем, что Y –
случайная величина, а X – неслучайная.
По этим измерениям ищем функцию регрессии , предполагая, что она линейная.
Оценим функцию регрессии с помощью выборочной линейной
функцией регрессии:
Для любых пар наблюдений можно
записать соотношение

где
— случайные ошибки измерений, а

Пусть случайные ошибки измерений удовлетворяют
условиям:
1)
они независимы;
2)

что означает отсутствие систематической ошибки измерений;
3)
,
что означает, что разброс ошибок измерений не зависит от значения x.
4)
Случайные ошибки измерений
распределены по нормальному закону.
Воздействие
случайных ошибок определяется с помощью остаточной дисперсии

Выборочное линейное уравнение регрессии приближенно
описывает зависимость у от x:
.
ЗАДАЧА: определить область на плоскости, в которой с
заданной вероятностью находится функция регрессии
.
Данная область называется доверительный интервал
для условного математического ожидания и
определяется неравенством

где

и определяется по таблице 3 по формуле

или
по формуле
, (10)
используя
таблицу 6.
Используя
уже полученные оценки, формулу (8) можно преобразовать к виду

откуда
находим

Величина доверительного интервала зависит от значения .
Построение доверительного интервала
Введем
обозначения для значений нижней и верхней границ доверительного интервала при
значениях :

(14)
Для построения доверительного интервала добавим строки
в таблицу для вычисления точечных оценок:
Таблица
|
№ |
1 |
2 |
n |
суммы |
|
|
xi |
x1 |
x2 |
… |
xn |
|
|
yi |
y1 |
y2 |
… |
yn |
|
|
xi2 |
x12 |
x22 |
… |
xk2 |
|
|
yi2 |
y12 |
y22 |
… |
yn2 |
|
|
xi |
x1y1 |
x2y2 |
… |
xnyn |
|
|
|
|
|
… |
|
|
|
|
|
|
… |
|
|
|
|
|
|
… |
|
|
|
|
|
|
… |
|
|
|
|
|
|
… |
|
График линейной регрессии строится по двум точкам,
причем точка 
доверительного интервала имеют форму гиперболы, причем наименьшее расстояние
между ветвями имеет место в точке .
Ошибка! Ошибка связи.
Заметим, что отдельные наблюдения могут выходить за
пределы построенной области.
По
мере удаления x от величина
доверительного интервала увеличивается.
Таким
образом, прогноз значений зависимой переменной y по
уравнению регрессии оправдан, если значение независимой переменной x
не выходит за диапазон ее значений по выборке.
14.
Проверка гипотез об однородности выборок с помощью
критерия «хи-квадрат» (задача с последнего семинара).
16. Критерий Вилкоксона проверки однородности двух
выборок (лекция 12).
23. Ориентированные графы. Матрица смежности вершин.
Если
в графе G все элементы множества U — дуги, то граф называется ориентированным
(орграфом).
Матрицей
смежности обыкновенного графа
(орграфа), содержащего n вершин, называется квадратная матрица An´n , каждый
элемент которой aij , i,j=1,…,n,
определяется следующим образом:
, если существует ребро (дуга),
соединяющее вершины xi и xj ;
, в противном случае.
Матрица
смежности ориентированного графа.
24. Знаковый и взвешенный
орграф.
Взвешенный граф можно задать с
помощью специальной матрицы смежности, в которой при наличии ребра (дуги),
соединяющего вершины xi и xj в качестве соответствующего
элемента указывается вес этого ребра (дуги).
При изображении графа его вершины можно располагать
произвольно и по своему усмотрению выбирать форму соединяющих их линий. В тех
случаях, если имена вершин несущественны. естественно не различать графы,
отличающиеся лишь именами (порядком) вершин. О таких графах говорят, что они изоморфны.
Матрица
смежности взвешенного неориентированного графа
Знаковый
орграф и его матрица.
…,Х„, т.е. под Х, будем понимать значение с.в. Х в г-м опыте. Случайные величины Хыхз,…,Մ— независимы, закон распределения любой из них совпадает с законом распределения с.в. Х (т.е. Х, М(а, н)). А это значит, что Мхг = Мхз = … = МХ„= МХ = а, вх =вх =…=вх„=вх. Выборочное среднее я Х =Х=~1~ Х; также будет распределено по нормальному закону (примем без доказательства). Параметры распределения Х таковы: М(Х) = а, В(Х) = (72 = —.
Действительно, н(х)=м(„-‘~х,) =„-‘ ~мх, а(х) = а(„-‘~х,) = — ‘, ~ах, = 1=1 ,=1 — „’ ~мх= 1=1 ~вх = „— ‘. МХ = а, н вх = —. и ‘ Таким образом, Х М а, Следовательно, пользуясь формулой Р()Х вЂ” а( < Ц = 2Фо (о) 2Ф® — 1 Доверительный интервал для математического ожидания при известной дисперсии Глава 7. Элементы теории оценок и проверки гипотез ‘ 205 (формула (2.47)), можно записать ‘у = р(~Х вЂ” а~ < е) = 2Фо ~, ~ = 2Фо(1) /Е Ъ/й~ е,/и где ~ = . Из последнего равенства находим (7.3) поэтому у = р /Х вЂ” а/ < — ‘~ = 2Фо(1) или ,Я) р Х вЂ” 1 < а < Х+1 ° = 2Фо(1) = у. (7.4) т/и /ч В соответствии с определением доверительного интервала получаем,что доверительный интервал для а = МХ есть Х вЂ” ~ ~,Х+1 (7.5) где 1 определяется из равенства (7.4), т.е. из уравнения Ф~(~) = 7 (7.б) 1+ у (или Ф(1) = ); при заданном у по таблице функции Лапласа находим аргумент 8.
Заметим, что из равенства (7.3) следует: с возрастанием объема выборки тт число е убывает и, значит, точность оценки увеличивается; увеличение надежности у влечет уменьшение точности оценки. Находим сначала х,: х = — ( — 25+ 34 — 20 + 10+ 21) = 4, т.е. — — 1 7 х = 4. Учитывая, что у = 0,95 и Фо(1) = —, получаем Фо(1) = 0,475. По таблице (см. Приложение) выясняем, что 1 = 1т — — 1,9б. Тогда е = 1,9б 20 17,5 (формула (7.3)). Доверительный интервал для а = тг’5 = МХ (согласно (7.б)) таков: (4 — 17,5;4+ 17,5), т.е.
( — 13,5; 21,5). ° Пример 7.5. Произведено 5 независимых наблюдений над с.в. Х 1У(а,20). Результаты наблюдений таковы: х1 = — 25, хт = 34, хз = = — 20, х4 = 10, хз = 21. Найти оценку для а = МХ, а также построить для него 95%-й доверительный интервал. 206 ° Раздел второй. Основы математической статистики Доверительный интервал для математического ожидания при неизвестной дисперсии Пусть с. в.
Х М(а, и), и — неизвестна, т — задана. Найдем такое число е, чтобы выполнялось соотношение р(Х вЂ” е < а < Х + е1 = т или р()Х вЂ” а) < е) = т. (7.7) Введем случайную величину где Я вЂ” исправленное среднее квадратическое отклонение с. в. Х, вычисленное по выборке: Доказывается, что с.в. Т имеет распределение Стьюдента (см. п. 4.3) с и — 1 степенью свободы. Плотность этого распределения имеет вид: где Г(р) = ог е «Ии — гамма-функция; ~т(~, и — 1) — четная о функция.
Перейдем в левой части равенства (7.7) от с. в. Х к с. в. Т: ~~/й ) или р )Т) < — ) = т или р()Т! < Й,,1 = у, где (7.8) Глава 7. Элементытеорииоценоки проверки гипотез ‘ 207 Величина 8т находится из условия -гт т.е. из равенства 2 /7(1,п — 1) й =.~. о Пользуясь таблицей квантилей распределения Стьюдента (см. приложение 4 на с.
252), находим значение 1 в зависимости от доверительной вероятности 7 и числа степеней свободы и — 1 (1т — квантиль уровня 1 — 7). Определив значение 1 из равенства (7.8), находим значение е: (7.9) Следовательно, равенство (7.7) принимает вид р Х вЂ” Ст < а < Х+~7. ;/т~ тг’и ) А это значит, что интервал Х -47 ~,Х+~т покрывает а = МХ с вероятностью 7, т.е.
является доверительным интервалом для неизвестного математического ожидания с. в. Х. Пример 7.6. По условию примера 7.5, считая, что с.в. Х М(а,~т), П построить для неизвестного МХ = а доверительный интервал. Считать .у = 0,95. О Оценку З для МХ уже знаем: х = 4. Находим значение Я: У = — (( — 25 — 4)з 1+ (34 — 4)~+ ( — 20 — 4)з + (10 — 4)з+ (21 — 4)з) = = бб0,5; Я 25,7. По таблицедля у = 0,95 ип — 1 = 4 находим 17 = 2,78. 25,7 Слецовательно, г = 2,78 — 4 = 31,9. Доверительный интервал таков: (-27,9; 35,9). 208 ° Раздел второй. Основы математической статистики Доверительный интервал для среднего квадратического отклонения нормального распределения < 1Н. Я> 1Н ~0~ Хг Х1 ) г 1 где и — объем выборки, оог = — 2 <Х; — а)г, а г г, г г Х1 = Х1ет ‘ Хг = Х1 —.„ ,и г —;ь г являются квантилями Хг-распределения с и степенями свободы <см. п.
4.3), определяемые по таблице квантилей Хг„„распределения Хг <см. приложение 3 на с. 251). Если а = МХ неизвестпно, то доверительный интервал для неизвестного о имеет вид: с ъ/и — 1 Я 1/и — 1 Я’1 Хг ‘ Х1 /’ в где и — объем выборки, Я г 1 х р <Х, — Х) — исправленное — 1 2 и=1 среднее квадратическое отклонение, квайтили г г Х1 = Х1~-т —;0-1 г г г Хг =Х1-„ в;л-1 г 1+т 1 — 7 определяются по таблице Хг ь при Й = и — 1 и г1 = 2 2 И Г1 = соответственно. Пример 7.7. Для оценки параметра нормально распределенной слу- чайной величины была сделана выборка объема в 30 единиц и вычи- слено Я = 1,5.
Найти доверительный интервал, покрывающий ц с ве- роятностью 7 = 0,90. Имеем и = 30, 7 = 0,9. По таблице Хг ь находим Х1 = Х1 + 0,0 = Х <0,95; 29) = 17,7, ;30 — 1 Пусть с.в. Х 111<а,ц), ц — неизвестно, 7 задано. Можно показать, что если МХ = а известно, то доверительный интервал для среднего квадратического отклонения о имеет вид: Глава 7. Элементы теории оценок и проверки гипотез ° 209 / ° ‘1~ъгм 0 д: ~~ (О 05~ 29): 42 б. ;30-1 Доверительный интервал имеет вид: ~/42,6 ‘ т/17,7 или 1,238 < о < 1,920. Скажем несколько слов о доверительном интервале для оценки вероятности успеха при большом числе испытаний Бернулли. Доверительный интервал, который с надежностью 7 покрывает оцениваемый параметр р при больших значениях и (порядка сотен), имеет вид (рмрд), где Р1 =р* — 1 и и Рг =Р» +1 и, (7.10) Р*(1 — Р*) „ Р*(1 — Р*) где р = — — относительная частота события А; 1 определяется из пА равенства 2Ф0(~) = ~.
Для оценки приближенного равенства р р» можно использовать / е ~/й’1 равенство р(~р* — р( < е) = 2Ф0 ( ) (см. п. 4.1). Упражнения 1. Глубина моря измеряется прибором, систематическая ошибка которого равна нулю, а случайные ошибки распределены нормально с о = 15 м. Сколько надо сделать независимых измерений, чтобы определить глубину моря с ошибкой не более 5 м при надежности 7 = О 9? 2. По условию примера 6.3 найти точечную оценку и доверительный интервал для среднего роста студентов, считать у = 0,95. 3. Производятся независимые испытания с одинаковой, но с неизвестной вероятностью р появления события А в каждом испытании.
Найти доверительный интервал для оценки р с надежностью 0,95, если в 400 испытаниях события А появилось 80 раз. 210 ° Раздел второй. Основы математической статистики 7.5. Проверка статистических гипотез Задачи статистической проверки гипотез Одна из часто встречающихся на практике задач, связанных с применением статистических методов, состоит в решении вопроса о том, должно ли на основании данной выборки быть принято или, напротив, отвергнуто некоторое предположение (гипотеза) относительно генеральной совокупности (случайной величины).
Например, новое лекарство испытано на определенном числе людей. Можно ли сделать по данным результатам лечения обоснованный вывод о том, что новое лекарство более эффективно, чем применявшиеся ранее методы лечения? Аналогичный вопрос логично задать, говоря о новом правиле поступления в вуз, о новом методе обучения, о пользе быстрой ходьбы, о преимуществах новой модели автомобиля или технологического процесса и т. д. Процедура сопоставления высказанного предположения (гипотезы) с выборочными данными называется проверкой гипотез. Задачи статистической проверки гипотез ставятся в следующем виде: относительно некоторой генеральной совокупности высказываечся та или иная гипотеза Н.
Из этой генеральной совокупности извлекается выборка. Требуется указать правило, при помощи которого можно было бы по выборке решить вопрос о том, следует ли отклонить гипотезу Н или принять ее. Следует отметить, что статистическими методами гипотезу можно только опровергнуть или не опровергнуть, но не доказать. Например, для проверки утверждения (гипотеза Н) автора, что «в рукописи нет ошибок», рецензент прочел (изучил) несколько страниц рукописи. Если он обнаружил хотя бы одну ошибку, то гипотеза Н отвергается, в противном случае — не отвергается, говорят, что «результат проверки с гипотезой согласуется».
Распределения
Читайте также:
|
Статистической оценкой неизвестного параметра теоретического распределения называют его приближенное значение, зависящее от данных выборки.
Статистическая оценка является случайной величиной.
Обозначим θ – оцениваемый параметр теоретического распределения, θ*— его статистическую оценку. Величина 
Оценка параметра называется несмещенной, если ее математическое ожидание 


Оценка θ*— называется состоятельной,если при любом

Оценка θ* называется эффективной, если при заданном объеме выборки n она имеет наименьшую дисперсию.
Теорема 1. Выборочная средняя 
Теорема 2. Исправленная выборочная дисперсия S2 является несмещенной и состоятельной оценкой дисперсии.
Рассмотренные статистические оценки называются
точечными, т.к. они выражаются одним числом. Точечными оценками пользуются обычно при большом объеме выборки.
При небольшой выборке пользуются интервальными оценками.
Надежностью(доверительной вероятностью) оценки q по q* называется вероятность 


Перейдем к двойному неравенству, тогда можно записать 
Интервал 

Замечание. Все основанные на теории вероятностей правила статистической оценки параметров действуют лишь с определенным уровнем значимости 

Доверительный интервал для математического ожидания нормального распределения при известном среднем квадратическом отклонении 


Точность оценки 
Замечание. Если необходимо найти минимальный объем выборки для оценки математического ожидания с заданной точностью 


Доверительный интервал для математического ожидания нормального распределения при неизвестном 

где 



Пример 5. Глубина моря измеряется прибором, систематическая ошибка которого равна нулю, а случайные ошибки распределены нормально со средним квадратическим отклонением 
Решение: По условию задачи дано :
Найдем t из условия, что 

Итак , если ошибка 
Пример 6. Найти доверительный интервал для оценки с надежностью 0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение 

Решение: необходимо найти доверительный интервал

Найдем значение t.
По таблице находим t=1,96 .
— искомый доверительный интервал.
Пример 7. По данным 16 независимых равноточных измерений некоторой физической величины найдены 
Оценить истинное значение измеряемой величины с надежностью 0,999.
Решение: Истинное значение измеряемой величины равно ее математическому ожиданию а. Поэтому требуется найти доверительный интервал для оценки а при неизвестном значении 
Найдем 



Тогда
— искомый доверительный интервал.
Дата добавления: 2015-08-13; просмотров: 700 | Нарушение авторских прав
Читайте в этой же книге: З А Д А Ч И | Непрерывной называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка. | Математическое ожидание называют также средним значением случайной величины или центром распределения. | Функция дискретных случайных величин. | Числовые характеристики. | Случайной величины. | Задача 2. | Нормальное распределение. | Теорема Бернулли. | Статистическим распределением называют вариационный ряд значений выборки и соответствующих им частот niили относительных частот Wi. |
mybiblioteka.su — 2015-2023 год. (0.034 сек.)








































































