<<
>>

§ 22.2. ПРОСТАЯ СЛУЧАЙНАЯ ВЫБОРКА

При простой случайной выборке отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности в форме случайного отбора, при кото-

ром каждой единице генеральной совокупности обеспечивается

одинаковая вероятность (возможность) быть выбранной.

Единица отбора совпадает с единицей наблюдения. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.

Случайный отбор может быть проведен в двух формах: в форме возвратной (повторной) выборки и в форме безвозвратной (бесповторной) выборки. При повторном отборе вероятность попадания каждой единицы генеральной совокупности остается постоянной, так как после отбора какой-то единицы она снова возвращается в генеральную совокупность и может быть выбранной. При бесповторном отборе выбранная единица не возвращается в генеральную совокупность и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).

Применение простой случайной повторной выборки на практике весьма ограниченно; обычно используется бесповторная выборка.

Теорема П. Л. Чебышева утверждает принципиальную возможность определения генеральной средней по данным случайной повторной выборки. Теорема Чебышева дополняется теоремой А. М. Ляпунова, которая позволяет рассчитать максимальную ошибку выборочной средней при данном достаточно большом числе независимых наблюдений. Согласно этой теореме при достаточно большом числе независимых наблюдений в гене-ральной совокупности с конечной средней и ограниченной дис-персией вероятность того, что расхождение между выборочной и генеральной средней (х - х) не превзойдет по абсолютной вели-чине некоторую величину ґц, равна интегралу Лапласа. Это можно записать так:

где Величина t\K, обозначаемая Д, называется предельной ошибкой выборки.

Следовательно,

Дг = fa ¦ Ар - t\ip,

где Ах — предельная (максимально возможная) ошибка средней; Ар — предельная (максимально возможная) ошибка доли; ц — величина средней квадратической стандартной ошибки; t — коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки.

В зависимости от принятой вероятности Р определяется значение коэффициента кратности (t) по удвоенной нормированной функции Лапласа. В учебниках по общей теории статистики зна-чения функции приведены в приложении.

Приведем наиболее часто употребляемые уровни доверительной вероятности и соответствующие значения t для выборок до-статочно большого объема (п > 30): t 1,00 1,96 2,00 2,58 3,00 ф(0 0,683 0,950 0,954 0,990 0,997

Величина средней ошибки в условиях большой выборки (п > 30) рассчитывается по известным из теории вероятностей формулам: а) при случайной повторной выборке:

ру-р).

п

б) при случайной бесповоротной выборке:

p(i - Р)

И4х(1-?> ^

При расчете ошибок возникает существенное затруднение: величины о и р по генеральной совокупности неизвестны. Эти величины в условиях большой выборки заменяют величинами S (выборочная дисперсия) и w (выборочная доля), рассчитанными по выборочным данным. В табл. 22.1 приведены формулы расчета ошибок простой случайной выборки.

Таблица 22.1. Формулы ошибок простой случайной выборки Способ отбора единиц повторный бесповторный Средняя ошибка ц: для средней Р-х ш\ ? п V-х -Д 2 О для доли И)(1 - w) л w(l-w) п п U N> Предельная ошибка Д: для средней Дг- П S2 п Ах - п для доли w( 1 - W) лР ¦ п д р-П и>(1 - w)^ п ч п (1 N'

Формулы предельной ошибки позволяют решать задачи трех

видов:

Определение пределов генеральных характеристик с заданной степенью надежности (доверительной вероятностью) на основе показателей, полученных по данным выборки.

Доверительные интервалы для генеральной средней:

х = х ± Aj ; х — А* <х<х + Ах .

Доверительные интервалы для генеральной доли: р - w ± Ар, w - Ар < р < w + Ар.

Определение доверительной вероятности того, что генеральная характеристика может отличаться от выборочной не более чем на определенную заданную величину.

Доверительная вероятность является функцией от t, определяемой по формуле:

По величине t определяется доверительная вероятность по удвоенной нормированной функции Лапласа.

3. Определение необходимого объема выборки, который с практической вероятностью обеспечивает заданную точность выборки.

Для расчета объема выборки необходимо иметь следующие данные:

а) размер доверительной вероятности (Я);

б) коэффициент t, зависящий от принятой вероятности;

в) величину о2 (или pq) в генеральной совокупности; они заменяются величинами, полученными в предшествующих обследованиях или при пробных выборках;

г) величину максимально допустимой ошибки (Aj или Ар);

д) объем генеральной совокупности (N).

Необходимый объем выборки определяется на основе допустимой величины ошибки:

Д* = : Др "

В табл. 22.2 приведены формулы для расчета численности простой случайной выборки.

Таблица 22.2. Формулы для определения численности простой случайной выборки Способ отбора единиц повторный бесповторный Численность выборки (п):

для средней t2S2 Д X t2NS2 A%N ¦ t2S2 для доли* t2w( 1 - w) t2Nw{ 1 - w) п ' О

Д2р A2pN * t2w( 1 - w) * В случаях, когда частость w даже приблизительно неизвестна, в расчет вводят максимальную величину дисперсии доли, равную 0,25 (если w - 0.5, то а>(1 - w) - 0,25).

<< | >>
Источник: Яковлев Г. А.. Экономика и статистика туризма: Учебное пособие. 2-е изд., перераб. и доп. — М.: Издательство РДЛ,2004. — 376 с.. 2004

Еще по теме § 22.2. ПРОСТАЯ СЛУЧАЙНАЯ ВЫБОРКА: