Решение задач

19. 2.3.Повторная и бесповторная выборки.Теория вероятностей.

§2.3. Повторная и бесповторная выборки.


Повторной называют выборку, при которой "отобранный объект /перед отбором следующего / возвращается в генеральную совокупность.

Бесповторной называют выборку , при которой отобранный объект в генеральную совокупность не возвращается.

Для того, чтобы по данной выборке можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли,т.е. выборка должна быть репрезентативной / представительной/.

В силу закона больших чисел, можно утверждать, что выборка будет репрезентативной, если её осуществлять случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.

Выборочный метод дает возможность сделать приближенные оценки неизвестных характеристик генеральной совокупности:


Так как выборочные оценки являются приближенными, то для того чтобы с помощью статистических данных сделать правильные научные и практические выводы , нужно знать точность и надежность этих оценок.

Поэтов необходимо уметь определять надежность заданного отклонения к построению доверительных интервалов для генеральных параметров.

Бели дана большая выборка (х, ,х2.....х^из генеральной совокупности, определяющей случайную величину X » У которой известны математическое ожидание & и дисперсия Cj*' , то вероятность того, что выборочная средняя 7 будет находится в доверительном интервале

 

 определяется

из закона больших чисел по формуле

Так как выборочные оценки являются приближенными, то для того чтобы с помощью статистических данных сделать правильные научные и практические выводы , нужно знать точность и надежность этих оценок.

Поэтому необходимо уметь определять надежность заданного откло¬нения к построению доверительных интервалов для генеральных парамет¬ров.

Если дана большая выборка (х, ,х4,... .х^из генеральной сово¬купности, определяющей случайную величину X » У которой известны математическое ожидание Д, и дисперсия Cj4, , то вероятность того, что выборочная средняя Т будет находится в доверительном интервале I X-ft\ * А ( а- & < х < ) определяется из закона больших чисел по формуле

Найти с вероятностью 0,995 границы средней мощности трактор¬ного парка для всей совокупности колхозов, если выборка: а/повторная,

б/ бесповторная.

Решение.

Вероятность 0,995 границы средней мощности определяется фор¬мулой (зл) Неравенство |х-аЛ эквивалентно двойному неравенству

по которому и определяются доверительные границы для математического ожидания / генеральной средней / (L . Для их определения нужно знать выборочную среднюю и предельную ошибку выборки Л По условию р = 0,395" .следовательно

По таблице значений функции Лапласа /см.приложение I / находим, что

Радение.

Сначала вычисляем среднюю арифметическую вариационного ряда приняв 3а значения признака X; середины интервалов:

** 

где для повторной выборки               .

* v ц (3.2)

для «есловторной выборки

 

(3.3)

Здесь обозначено: - генеральная дисперсия ^ - выборочная дисперсия, w - число элементов выборки, И/ - число элементов генеральной совокупности, Ф(у) - функция Лапласа фОО = Jj= \ i* к

Найти с вероятностью 0,995 границы средней мощности трактор¬ного парка для всей совокупности колхозов, если выборка: а/повторная,

б/ бесповторная.

Решение.

 

Вероятность 0,995 границы средней мощности определяется фор¬мулой (зл)

Неравенство |х-аЛ эквивалентно двойному неравенству X -А * 0, * X *А,

по которому и определяются доверительные границы для математического ожидания / генеральной средней / (L . Для их определения нужно знать выборочную среднюю и предельную ошибку выборки Л По условию р = 0,395" .следовательно

 

 

По таблице значений функции Лапласа /см.приложение I / находим, что

Радение.

Сначала вычисляем среднюю арифметическую вариационного ряда приняв 3а значения признака X; середины интервалов:

Дисперсия равна: I

где для повторной выборки

 

 (3.2)

для «есловторной выборки

                           (3.3)

Здесь обозначено: - генеральная дисперсия ^ - выборочная дисперсия, w - число элементов выборки, И/ - число элементов генеральной совокупности, Ф(у) - функция Лапласа

 

 

Пример. Для изучения мощности тракторных парков выборочным путем было обследовано 250 колхозов из 2500. Их распределение по мощности тг

Мощность в тыс,л.с. )актоуных 0,6-1,0 А

1,0-3;, 4 1,4-1,8 1,0-2,2 2,2-2,6 2,6-3 3-3,4

Следовательно

Средняя квадратичная ошибка определяется формулами (3.2) ,(3.3) Таким образом, определение- доверительных границ генеральной средней сводится к определению выборочных -средних X и дисперсии (Гг Для их вычисления составляется расчетная таблица. За значения вариантов х; -принимаются середины заданных- интервалов мошнрсти тракторных парков. , '

Замечание I. Расчет выборочной средней вариационного ряда ряда вычисляется по формуле v \ 1

' (ЗА)

Однако, на практике, использование формулы(3.4) приводит к ; большим вычислительным трудностям, поэтбму , используя свойства математического ожидания , удобно вводить так называемые условные варианты /обычно это вариант, имеющий наибольшую частоту/.

Для этого формулу (3.4) преобразуем следующим образом:

так называемые условные варианты,

где шаг таблицы.

Аналогично для выборочной дисперсии получаем формулу с ис¬пользованием условных вариантов:

(3.6)

Шаг нашей таблицы равен

В качестве С выберем 2, т.еС =2, тогда условные варианты

Выполняя аналогичные расчеты для,остальных вариантов X; .полу¬чим условные варианты U* и всю расчетную таблицу:

Группы Середина- вариантов jy VI;

Выполняя аналогичные расчеты для,остальных вариантов X; .полу­чим условные варианты U* и всю расчетную таблицу:

Группы

Середина- вариантов                 jy               

VI;

< * ’

HI

 

 

 

0,6-1,0

0,8

3

—3

-9

27

12

1,0-1,4

1,2

22 -

-2

-44

88

22

1,4-1,8

1,6

43

-i

-43'

43

o'

1,8-2,2

2,0

86

N

0

0

0

' 86

2,2-2,6

2,4

61.

I

61

61

244

2,6-3,0

2,8

28

> 2

56

• 112

252

3,0-3,4

3,2

7

3~

21

63

112

Z

 

250

-

42

394

728

Последний столбец составляется для контроля таблицы. Если она составлена правильно, то выполняется тождество

В данном случае /сумма по последней строке /

^ожд^ство выполнено, следовательно в таблице ошибок нет. Используя таблицу^найдем выборочную среднюю по формуле (3.5)

Выборочная.дисперсия, найденная по формуле (3.6) .равна:

^Среднеквадратичные ошибки выборки составляют: а/ для повторной выборки 0,.П?С 2 ■

б/ для бесповторной выборки / п, =250, Л/ =2500 /

Тецерь можно определить предельные ошибк

б/ для бесповторной выборки

С надежностью 0,995 неизвестное математическое ожидание будет заключено в границах: а/ для повторной выборки

б/ для бесповторной выборки

или

Так как , исходные данные имеют точность до 0,1, то, округляя полученные границы до 0,1, получим

2,0 < д. £ 2fl

и для повторной и для бесповторной выборок. Этого следовало ожидать, так как объем выборки мал, по сравнению с объемом генеральной совокуп¬ности ( £ - “ *о,о1

<<А)«

Таким образом>средняя мощность тракторного парка для всех 2500 колхозов с вероятностью 0,995 заключена в драницах от 2,6 до 2,2 тыс.  

 

Популярные репетиторы:

Рейтинг 5 из 5: 45 отзывов
 
Я грезил собрать воедино два моих основных страстей: Математику, Информатику и Обучение, c самого начала своего продвижения по службе, когда еще учился в аспирантуре.

Успешный математик для школьников и студентов, PhD, педагогический стаж более 16 лет, с быстротой   подготовит контрольной работе по математике на 2 курс с помощью конфиденциальных схем по формированию памяти и ускорению мышления. Помощь в оформлении докладов.

Свободно программирует на Haskell, Rast и Node. Участвует в ведущих научных симпозиумах WWW, CVPR и CIKM . Консультирование по математическим пакетам Maple, Maxima и JupyterLab . Некоторое время поработал по развитию в стартапе по Машинному обучению и Big Data.

Занятия проводятся по TeamViewer и  в Москве м. Китай-город. Более 320 учащихся  поступили «на бюджет» в ВУЗы Москвы: МГУ, Школа Анализа Данных Яндекса, ФИ и МГТУ и т.д.. Опыт учителя по математике для студентов более 20 лет. Hij spreekt Nederlands.

Запись на занятия

Ваше сообщение отправлено