Понятие о малой выборки
Однако в практике статистического исследования в условиях рыночной экономики все чаще приходится сталкиваться с малыми выборками.
Малой выборкой называется такое выборочное наблюдение, численность единиц которого не превышает 30.
Разработка теории малой выборки была начата английским статистиком В.
С. ГОССЕТОМ (печатавшимся под псевдонимом СТЬЮДЕНТ). Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения.Таблица 4 - Необходимый объем выборки для некоторых способов форми- рования выборочной совокупности
Повторный отбор
Бесповторный отбор
Вид выборочного на-блюдения
Собственно - случайная выборка:
n =
а) при определении среднего размера признака
n
б) при определении доли признака
Механическая выборка Типичная выборка:
n=
а) при определении среднего размера признака
n =
б) при определении доли признака
Серийная выборка:
а) при определении среднего размера признака
б) при определении доли признака
ф 2 2
t 'ах
n
Д2
t2 • W (1 - W)
n =
Д
W
то же
t •а~
n
Д2
t2 • W (1 - W)
n
Д:
W
t2 d
r
Д2
t2 • Wr (1 - Wr)
к =
Д:
W
t2 а- • N
Д2~ • n +12 а-
t2 • W (1 - W) • N • N +12 • W (1 - W)
то же
t2 • а~2 • N
д2~ • N +12 •а~2
t2 • W (1 - W) • N • N +12 • W (1 - W)
t2d- • Я
r =
д2~ • я +12 •d
t2 • Wr (1 - Wr) • Я
r =
Д^ • Я +12 •Wr(1 -Wr)
При оценке результатов малой выборки величина генеральной совокупности не используется.
Для определения возможных пределов ошибки поль-зуются критерием Стьюдента, определяемым по формулеx x
t
G
М мв
где г^ мв
л/n -1
средняя ошибка малой выборки..
Величина ст вычисляется на основе данных выборочного наблюдения. Она равна
2
( 7 )
G
I(X,- ~)
n
Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки ст в генеральной совокупности.
Предельная ошибка малой выборки (Амв) в зависимости от средней ошиб- ки( ммв) представляется как
Амв = t*M мв ( 8 )
Однако для малой выборки величина коэффициента доверия t по другому связана с вероятностной оценкой, чем при большой выборке (так как, закон распределения отличается от нормального).
Согласно установленному Стьюдентом закону распределения, вероятная ошибка распределения зависит как от величины коэффициента доверия t , так и от объема выборки В таблице 5 приведен фрагмент таблицы распределения Стьюдента.
Таблица 5 - Распределение вероятностей в малых выборках в зависимости от коэффициента доверия t и объема выборки n/t 4 5 6 7 8 9 10 15 20 X 0,5 348 356 362 366 368 370 372 376 378 383 1.0 608 626 636 644 650 654 656 666 670 683 1,5 770 792 806 816 832 828 832 846 850 865 2,0 860 884 908 908 914 920 924 932 940 954 2,5 933 946 955 959 963 966 968 975 978 988 3,0 942 960 970 976 980 938 984 992 992 977 Примечание. 1. Для определения вероятности соответствующие табличные значения необходимо разделить на 1000
2. При n = х приведены вероятности нормального распределения.
Как видно из табл. 5, при увеличении n распределение стремиться к нормальному и уже при n = 20 практически от него не отличается.
Пример. Предположим, что выборочное обследование 10 рабочих мест малого предприятия показало, что на выполнение одной из производственных операций рабочие затрачивали времени (мин.):
3,4 ; 4,7 ; 1,8 ; 3,9 ; 4,2; 3,9 ; 3,7 ; 3,2; 2,2; 3,9 Алгоритм расчета характеристик малой выборки. 1. Определяем выборочную среднюю затраты времени на производство
технологической операции
~ = ( 3,4 + 4,7 + ...+ 3,9 ) / 10 = 3,49 мин.
Рассчитываем выборочную дисперсию
а- = (( 3,4 - 3,49)2 + ( 4,7 - 3,49)2 + ...+ ( 3,9 -3,49)2 ) / 10 = 0,713.
Определяем среднюю ошибку малой выборки
Цмв = V0,713/ ( 10 -1) = 0,28 мин.
Принимаем коэффициент доверия t =2 и по таблице Стьюдента для n = 10 вероятность 0,924.
Вывод. С вероятностью 0,924 можно утверждать, что расхождение между выборкой и генеральной совокупностью находится в пределах от -2ц, до
+2ц, т.е разность X - X не превысит по абсолютной величине значение 0,56 ( 2*0,28). Следовательно, средние затраты времени во всей совокупности будут находится в пределах от 2, 93 до 4,05 мин. Вероятность того, что данный вывод не буден выполняться. Рана 1 - 0,924 = 0,076 «7,6 %.