Статистические оценки параметров распределения
1. Точечные оценки
Статистической оценкой неизвестного параметра
в теоретического распределения называют функцию
от наблюдаемых случайных величин
.
Точечной называют статистическую оценку, которая определяется одним числом , где
– результаты n наблюдений над количественным признаком X (выборка).
Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.
Смещенной называют точечную оценку, математическое ожидание которой не равно оцениваемому параметру.
Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя
где – варианта выборки,
– частота варианты
,
– объем выборки.
Замечание 1. Если первоначальные варианты – большие числа, то для упрощения расчета целесообразно вычесть из каждой варианты одно и то же число С, т. е. перейти к условным вариантам
(в качестве С выгодно принять число, близкое к выборочной средней; поскольку выборочная средняя неизвестна, число С выбирают «на глаз»).
Смещенной оценкой генеральной дисперсии служит выборочная дисперсия
Более удобна формула
Замечание 2. Если первоначальные варианты – большие числа, то целесообразно вычесть из всех вариант одно и то же число С, равное выборочной средней или близкое к ней, т. е. перейти к условным вариантам
(дисперсия при этом не изменится). Тогда
Замечание 3. Если первоначальные варианты являются десятичными дробями с k десятичными знаками после запятой, то, чтобы избежать действий с дробями, умножают первоначальные варианты на постоянное число т.е. переходят к условным вариантам
. При этом дисперсия увеличится в
раз. Поэтому, найдя дисперсию условных вариант, надо разделить ее на
:
Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия
Более удобна формула
В условных вариантах она имеет вид
причем если , то
; если
, то
.
2. Метод моментов
Метод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов соответствующим эмпирическим моментам того же порядка. Если распределение определяется одним параметром, то для его отыскания приравнивают одни теоретический момент одному эмпирическому моменту того же порядка. Например, можно приравнять начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка:. Учитывая, что
и
, получим
Математическое ожидание является функцией от неизвестного параметра заданного распределения, поэтому, решив уравнение относительно неизвестного параметра, тем самым получим его точечную оценку.
Если распределение определяется двумя параметрами, то приравнивают два теоретических момента двум соответствующим эмпирическим моментам того же порядка. Например, можно приравнять начальный теоретический момент первого порядка начальному эмпирическому моменту первого порядка и центральный теоретический момент второго порядка центральному эмпирическому моменту второго порядка:
Учитывая, что ,
,
,
, имеем
Левые части этих равенств являются функциями от неизвестных параметров, поэтому, решив систему относительно неизвестных параметров, тем самым получим их точечные оценки.
Разумеется, для вычисления выборочной средней и выборочной дисперсии
надо располагать выборкой
.
3. Метод наибольшего правдоподобия
Метод наибольшего правдоподобия точечной оценки неизвестных параметров заданного распределения сводится к отысканию максимума функции одного или нескольких оцениваемых параметров.
Дискретные случайные величины.
Пусть X—дискретная случайная величина, которая в результате n опытов приняла возможные значения . Допустим, что вид закона распределения величины X задан, но неизвестен параметр
, которым определяется этоу закон; требуется найти его точечную оценку
.
Обозначим вероятность того, что в результате испытания величина X примет значение через
.
Функцией правдоподобия дискретной случайной величины X называют функцию аргумента :
Оценкой наибольшего правдоподобия параметра называют такое его значение
, при котором функции правдоподобия достигает максимума.
Функции и
достигают максимума при одном и том жезначении
, поэтому вместо отыскания максимума функции
ищут, что удобнее, максимум функции
.
Логарифмической функцией правдоподобия называют функцию .
Точку максимума функции аргумента
можно искать, например, так:
1. Найти производную .
2. Приравнять производную нулю и найти критическую точку – корень полученного уравнения (его называют уравнением правдоподобия).
3. Найти вторую производную ,; если вторая производная при
отрицательна, то
– точка максимума.
Найденную точку максимума принимают в качестве оценки наибольшего правдоподобия параметра
.
Непрерывные случайные величины.
Пусть X – непрерывная случайная величина, которая в результате n испытаний приняла значения . Допустим, что вид плотности распределения – функции
– задан, но неизвестен параметр
, которым определяется эта функция.
Функцией правдоподобия непрерывной случайной величины X называют функцию аргумента :
Оценку наибольшего правдоподобия неизвестного параметра распределения непрерывной случайной величины ищут так же, как в случае дискретной случайной величины.
Если плотность распределения непрерывной случайной величины определяется двумя неизвестными параметрами
и
, то функция правдоподобия есть функция двух независимых аргументов
и
:
Далее находят логарифмическую функцию правдоподобия и для отыскания ее максимума составляют и решают систему
4. Интервальные оценки
Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр.
Доверительным называют интервал, который с заданной надежностью покрывает заданный параметр.
Интервальной оценкой (с надежностью ) математического ожидания
нормально распределенного количественного признака X по выборочной средней
при известном среднем квадратическом отклонении
генеральной совокупности служит доверительный интервал
где – точность оценки,
– бъем выборки,
– значение аргумента функции Лапласа
(см. приложение 2), при котором
; при неизвестном
(и объеме выборки n < 30)
где s—«исправленное» выборочное среднее квадратическое отклонение, находят по таблице приложения 4 по заданным .
и
.
Интервальной оценкой (с надежностью ) среднего квадратического отклонения
нормально распределенного количественного признака X по «исправленному» выборочному среднему квадратическому отклонению s служит доверительный интервал
где находят по таблице приложения 5 по заданным
и
.
Интервальной оценкой (с надежностью ) неизвестной вероятности р биномиального распределения по относительной частоте
служит доверительный интервал (с приближенными концами
и
)
где
где – общее число испытаний;
– число появлений события;
– относительная частота, равная отношению
;
– значение аргумента функции Лапласа
(см. приложение 2), при котором
(
– заданная надежность).
Замечание. При больших значениях (порядка сотен) можно принять в качестве приближенных границ доверительного
интервала
Пример. В результате 10 независимых измерений некоторой случайной величины Х, выполненных с одинаковой точностью, получены опытные данные, приведенные в таблице.
X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 |
1,9 | 1,8 | 2,0 | 2,1 | 1,7 | 2,3 | 2,0 | 2,1 | 1,8 | 1,9 |
Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение Х при помощи доверительного интервала, покрывающего истинное значение величины Х с доверительной вероятностью 0,95.
Решение: Поскольку в задаче имеется выборка малого объема, применим распределение Стьюдента. Требуется построить доверительный интервал для оценки математического ожидания а при неизвестном значении среднеквадратического отклонения из нормально распределенной генеральной совокупности.
Требуется отыскать такое число , для которого верно равенство
В этой формуле:
– выборочное среднее
S – стандартное (среднеквадратическое) отклонение
a – математическое ожидание
n – объем выборки (n =10)
– доверительная вероятность (
=0,95)
Величину (в нашем случае
) находим по таблицам распределения Стьюдента. Она равна 2,26.
Находим выборочное среднее как среднее арифметическое
Рассчитаем среднеквадратическое отклонение через исправленную выборочную дисперсию:.
Тогда . Получаем:
Ответ: истинное значение случайной величины лежит в доверительном интервале (1,833; 2,087) с доверительной вероятностью 0,95.