§ 22.1. СУЩНОСТЬ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
При строгом соблюдении условий случайности и достаточно большой численности отобранных единиц выборочное наблюде-ние репрезентативно (представительно).
По результатам изучения определенной части единиц с достаточной для практики степенью точности можно судить о всей совокупности. Однако вычисленные по материалам выборочного наблюдения статистические показатели-не будут точно совпадать с соответствующими характеристиками для всей совокупности (генеральной совокупности). Величина этих отклонений называется ошибкой наблюдения, которая складывается из ошибок двоякого рода: ошибки регистрации (точности) и ошибки репрезентативности.Ошибки регистрации свойственны любому наблюдению (сплошному и несплошному). Они вызываются несовершенством измерительных приборов, недостаточной квалификацией работников, неточностью подсчетов и т. п. Однако при выборочном наблюдении они значительно меньше, так как в этом случае используются более подготовленные кадры.
Ошибки репрезентативности свойственны только несплошным наблюдениям. Они характеризуют размер расхождений между величинами показателя, полученного в выборочной и генеральной совокупности в условиях одинаковой точности единичных наблюдений. Ошибки репрезентативности могут быть сис-тематическими и случайными. Систематические ошибки возника-ют при нарушении установленных правил отбора единиц. Слу-чайные ошибки репрезентативности возникают в результате недостаточно равномерного представления в выборочной совокупности различных категорий единиц генеральной совокупности.
Для проверки близости теоретического и эмпирического распределений используются специальные показатели, называемые критериями согласия.
Наиболее распространенным является критерий согласия К. Пирсона х2 («хи-квадрат»), исчисляемый по формуле:x'-z^A
где / — эмпирические частоты (частости) в интервале; /' — тео-ретические частоты (частости) в интервале.
Полученное значение критерия (х расч) сравнивается с табличным значением (х2Табл)- Последнее определяется по специальной таблице в зависимости от принятой вероятности (Р) и числа степеней свободы k (для нормального распределения k равно числу групп в ряду распределения минус 3).
Если х2расч - Х табл- то гипотеза о близости эмпирического распределения к нормальному не отвергается.
При расчете критерия Пирсона необходимо соблюдать условия: число наблюдений должно быть достаточно велико (п > 50); если теоретические частоты в некоторых интервалах меньше 5, то интервалы объединяют так, чтобы частоты были больше 5.
Используя величину х2. В. И. Романовский предложил оценивать близость эмпирического распределения кривой нормального распределения по отношению:
Х2-(т-3) І 2(т - 3) '
где m — число групп; т - 3 — число степеней свободы при исчислении частот нормального распределения.
Если X < ^ то можно принять гипотезу о нормаль
ну 2 (т - 3)
ном характере эмпирического распределения. .
Распространенным критерием согласия является критерий А. Н. Колмогорова:
І п
где D — максимальное значение разности между накопленными эмпирическими и теоретическими частотами; п — сумма эмпирических частот.
По таблице значений вероятностей Х-критерия находят соответствующую вероятность (Р). Если найденной величине к соответствует значительная по величине вероятность (Р), то расхождения между эмпирическим и теоретическим распределениями несущественны.
В ряде случаев относительные и средние величины совокупности рассчитываются на основе данных выборочного наблюдения, получившего в настоящее время широкое применение в работе органов государственной статистики, научно-исследовательских институтов и предприятий.
При строгом соблюдении условий случайности и достаточно большой численности отобранных единиц выборочное наблюдение репрезентативно (представительно). По результатам изучения определенной части единиц с достаточной для практики степенью точности можно судить о всей совокупности.
Однако вычисленные по материалам выборочного наблюдения статистические показатели-не будут точно совпадать с соответствующими характеристиками для всей совокупности (генеральной совокупности). Величина этих отклонений называется ошибкой наблюдения, которая складывается из ошибок двоякого рода: ошибки регистрации (точности) и ошибки репрезентативности.Ошибки регистрации свойственны любому наблюдению (сплошному и несплошному). Они вызываются несовершенством измерительных приборов, недостаточной квалификацией работников, неточностью подсчетов и т. п. Однако при выборочном наблюдении они значительно меньше, так как в этом случае используются более подготовленные кадры.
Ошибки репрезентативности свойственны только не-сплошным наблюдениям. Они характеризуют размер расхожде-ний между величинами показателя, полученного в выборочной и генеральной совокупности в условиях одинаковой точности еди-ничных наблюдений. Ошибки репрезентативности могут быть систематическими и случайными. Систематические ошибки возникают при нарушении установленных правил отбора единиц. Случайные ошибки репрезентативности возникают в результате недостаточно равномерного представления в выборочной совокупности различных категорий единиц генеральной совокупности.
Максимально возможная ошибка — это такая величина отклонения выборочной средней (доли) от генеральной, вероятность превышения которой вследствие случайных причин в условиях данной выборки очень мала.
Величина случайной ошибки репрезентативности зависит от степени колеблемости изучаемого признака в генеральной совокупности, способа формирования выборочной совокупности и объема выборки.
По степени охвата единиц исследуемой совокупности различают большие и малые выборки. По способу формирования выборочной совокупности различают следующие виды выборочного наблюдения: простая случайная (собственно случайная) выборка, расслоенная (типическая или районированная), серийная, механическая, комбинированная, ступенчатая, многофазная.
Совокупность единиц, из которых производится отбор, принято называть генеральной совокупностью.
Совокупность отобранных единиц из генеральной совокупности называется выборочной совокупностью.Далее будем использовать следующие обозначения: N — объем генеральной совокупности (число входящих в нее единиц);
п — объем выборочной совокупности (число единиц, попавших в выборку);
х — генеральная средняя (среднее значение признака в генеральной совокупности);
х — выборочная средняя (среднее значение признака в выборочной совокупности);
р — генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности);
w — выборочная доля (доля единиц, обладающих данным при- . знаком в выборочной совокупности);
о2 — генеральная дисперсия (дисперсия признака в генеральной совокупности);
S2 — выборочная дисперсия (дисперсия признака в выборочной совокупности);
а — среднее квадратическое отклонение признака в генераль-ной совокупности;
S — среднее квадратическое отклонение признака в выборочной совокупности.