ОСНОВНЫЕ ПОНЯТИЯ, ИСПОЛЬЗУЕМЫЕ ПРИ ОЦЕНИВАНИИ.

Оценивание – это определение приближенного значения неизвестной характеристики или параметра распределения (генеральной совокупности), иной оцениваемой составляющей математической модели реального (экономического, технического и др.) явления или процесса по результатам наблюдений. Иногда формулируют более коротко: оценивание – это определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений. При этом параметром генеральной совокупности может быть либо число, либо набор чисел (вектор), либо функция, либо множество или иной объект нечисловой природы. Например, по результатам наблюдений, распределенных согласно биномиальному закону, оценивают число – параметр р (вероятность успеха). По результатам наблюдений, имеющих гамма-распределение, оценивают набор из трех чисел – параметры формы а, масштаба b и сдвига с. Способ оценивания функции распределения дается теоремами В.И. Гливенко и А.Н. Колмогорова. Оценивают также плотности вероятности, функции, выражающие зависимости между переменными, включенными в вероятностные модели экономических, управленческих или технологических процессов, и т.д. Целью оценивания может быть нахождение упорядочения инвестиционных проектов по экономической эффективности или технических изделий (объектов) по качеству, формулировка правил технической или медицинской диагностики и т.д. (Упорядочения в математической статистике называют также ранжировками. Это – один из видов объектов нечисловой природы.)

Оценивание проводят с помощью оценок – статистик, являющихся основой для оценивания неизвестного параметра распределения. В ряде литературных источников термин «оценка» встречается в качестве синонима термина «оценивание». Употреблять одно и то же слово для обозначения двух разных понятий нецелесообразно: оценивание – это действие, а оценка – статистика (функция от результатов наблюдений), используемая в процессе указанного действия или являющаяся его результатом.

Оценивание бывает двух видов – точечное оценивание и оценивание с помощью доверительной области.

Точечное оценивание — способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения.

Пример 2. Пусть результаты наблюдений x1, x2,…, xn рассматривают в вероятностной модели как случайную выборку из нормального распределения N(m,?). Т.е. считают, что результаты наблюдений моделируются как реализации n независимых одинаково распределенных случайных величин, имеющих функцию нормального распределения N(m,?) с некоторыми математическим ожиданием m и средним квадратическим отклонением ?, неизвестными статистику. Требуется оценить параметры m и ? (или ?2) по результатам наблюдений. Оценки обозначим m* и (?2)* соответственно. Обычно в качестве оценки m* математического ожидания m используют выборочное среднее арифметическое

, а в качестве оценки (?2)* дисперсии ?2 используют выборочную дисперсию s2, т.е.

m* =

, (?2)* = s2.

Для оценивания математического ожидания m могут использоваться и другие статистики, например, выборочная медиана

, полусумма минимального и максимального членов вариационного ряда

m** = [x(1)+x(n)]/и др. Для оценивания дисперсии ?2 также имеется ряд оценок, в частности,

(см. выше) и оценка, основанная на размахе R, имеющая вид

(?2)** = [a(n)R]2,

где коэффициенты a(n) берут из специальных таблиц. Эти коэффициенты подобраны так, чтобы для выборок из нормального распределения

M[a(n)R] = ?.

Наличие нескольких методов оценивания одних и тех же параметров приводит к необходимости выбора между этими методами.

Как сравнивать методы оценивания между собой? Сравнение проводят на основе таких показателей качества методов оценивания, как состоятельность, несмещенность, эффективность и др.

Рассмотрим оценку ?n числового параметра ?, определенную при n = 1, 2, … Оценка ?n называется состоятельной, если она сходится по вероятности к значению оцениваемого параметра ? при безграничном возрастании объема выборки. Выразим сказанное более подробно. Статистика ?n является состоятельной оценкой параметра ? тогда и только тогда, когда для любого положительного числа ? справедливо предельное соотношение

Пример 3. Из закона больших чисел следует, что ?n =

является состоятельной оценкой ? = М(Х) (в приведенной выше теореме Чебышёва предполагалось существование дисперсии D(X); однако, как доказал А.Я. Хинчин , достаточно выполнения более слабого условия – существования математического ожидания М(Х)).

Пример 4. Все указанные выше оценки параметров нормального распределения являются состоятельными.

Вообще, все (за редчайшими исключениями) оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются состоятельными.

Пример 5. Так, согласно теореме В.И. Гливенко, эмпирическая функция распределения Fn(x) является состоятельной оценкой функции распределения результатов наблюдений F(x).

При разработке новых методов оценивания следует в первую очередь проверять состоятельность предлагаемых методов.

Второе важное свойство оценок – несмещенность. Несмещенная оценка ?n – это оценка параметра ?, математическое ожидание которой равно значению оцениваемого параметра: М(?n) = ?.

Пример 6. Из приведенных выше результатов следует, что

и

являются несмещенными оценками параметров m и ?2 нормального распределения. Поскольку М(

) = М(m**) = m, то выборочная медиана

и полусумма крайних членов вариационного ряда m** — также несмещенные оценки математического ожидания m нормального распределения. Однако

поэтому оценки s2 и (?2)** не являются состоятельными оценками дисперсии ?2 нормального распределения.

Оценки, для которых соотношение М(?n) = ? неверно, называются смещенными. При этом разность между математическим ожиданием оценки ?n и оцениваемым параметром ?, т.е. М(?n) – ?, называется смещением оценки.

Пример 7. Для оценки s2, как следует из сказанного выше, смещение равно

М(s2) — ?2 = — ?2/n.

Смещение оценки s2 стремится к 0 при n > ?.

Оценка, для которой смещение стремится к 0, когда объем выборки стремится к бесконечности, называется асимптотически несмещенной. В примере 7 показано, что оценка s2 является асимптотически несмещенной.

Практически все оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются либо несмещенными, либо асимптотически несмещенными. Для несмещенных оценок показателем точности оценки служит дисперсия – чем дисперсия меньше, тем оценка лучше. Для смещенных оценок показателем точности служит математическое ожидание квадрата оценки М(?n – ?)2. Как следует из основных свойств математического ожидания и дисперсии,

(3)

т.е. математическое ожидание квадрата ошибки складывается из дисперсии оценки и квадрата ее смещения.

Для подавляющего большинства оценок параметров, используемых в вероятностно-статистических методах принятия решений, дисперсия имеет порядок 1/n, а смещение – не более чем 1/n, где n – объем выборки. Для таких оценок при больших n второе слагаемое в правой части (3) пренебрежимо мало по сравнению с первым, и для них справедливо приближенное равенство

(4)

где с – число, определяемое методом вычисления оценок ?n и истинным значением оцениваемого параметра ?.

С дисперсией оценки связано третье важное свойство метода оценивания – эффективность. Эффективная оценка – это несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра.

Доказано , что

и

являются эффективными оценками параметров m и ?2 нормального распределения. В то же время для выборочной медианы

справедливо предельное соотношение

Другими словами, эффективность выборочной медианы, т.е. отношение дисперсии эффективной оценки

параметра m к дисперсии несмещенной оценки

этого параметра при больших n близка к 0,637. Именно из-за сравнительно низкой эффективности выборочной медианы в качестве оценки математического ожидания нормального распределения обычно используют выборочное среднее арифметическое.

Понятие эффективности вводится для несмещенных оценок, для которых М(?n) = ? для всех возможных значений параметра ?. Если не требовать несмещенности, то можно указать оценки, при некоторых ? имеющие меньшую дисперсию и средний квадрат ошибки, чем эффективные.

Пример 8. Рассмотрим «оценку» математического ожидания m1 ? 0. Тогда D(m1) = 0, т.е. всегда меньше дисперсии D(

) эффективной оценки

. Математическое ожидание среднего квадрата ошибки dn(m1) = m2, т.е. при

имеем dn(m1) < dn(

). Ясно, однако, что статистику m1 ? 0 бессмысленно рассматривать в качестве оценки математического ожидания m.

Пример 9. Более интересный пример рассмотрен американским математиком Дж. Ходжесом:

Ясно, что Tn – состоятельная, асимптотически несмещенная оценка математического ожидания m, при этом, как нетрудно вычислить,

Последняя формула показывает, что при m ? 0 оценка Tn не хуже

(при сравнении по среднему квадрату ошибки dn), а при m = 0 – в четыре раза лучше.

Подавляющее большинство оценок ?n, используемых в вероятностно-статистических методах принятия решений, являются асимптотически нормальными, т.е. для них справедливы предельные соотношения:

для любого х, где Ф(х) – функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Это означает, что для больших объемов выборок (практически — несколько десятков или сотен наблюдений) распределения оценок полностью описываются их математическими ожиданиями и дисперсиями, а качество оценок – значениями средних квадратов ошибок dn(?n).

Наилучшими асимптотически нормальными оценками, сокращенно НАН-оценками, называются те, для которых средний квадрат ошибки dn(?n) принимает при больших объемах выборки наименьшее возможное значение, т.е. величина с = с(?n,?) в формуле (4) минимальна. Ряд видов оценок – так называемые одношаговые оценки и оценки максимального правдоподобия – являются НАН-оценками, именно они обычно используются в вероятностно-статистических методах принятия решений.

Какова точность оценки параметра? В каких границах он может лежать? В нормативно-технической и инструктивно-методической документации, в таблицах и программных продуктах наряду с алгоритмами расчетов точечных оценок даются правила нахождения доверительных границ.

Они и указывают точность точечной оценки. При этом используются такие термины, как доверительная вероятность, доверительный интервал. Если речь идет об оценивании нескольких числовых параметров, или же функции, упорядочения и т.п., то говорят об оценивании с помощью доверительной области.

Доверительная область – это область в пространстве параметров, в которую с заданной вероятностью входит неизвестное значение оцениваемого параметра распределения. «Заданная вероятность» называется доверительной вероятностью и обычно обозначается ?. Пусть ? – пространство параметров. Рассмотрим статистику ?1 = ?1(x1, x2,…, xn) – функцию от результатов наблюдений x1, x2,…, xn, значениями которой являются подмножества пространства параметров ?. Так как результаты наблюдений – случайные величины, то ?1 – также случайная величина, значения которой – подмножества множества ?, т.е. ?1 – случайное множество. Напомним, что множество – один из видов объектов нечисловой природы, случайные множества изучают в теории вероятностей и статистике объектов нечисловой природы.

В ряде литературных источников, к настоящему времени во многом устаревших, под случайными величинами понимают только те из них, которые в качестве значений принимают действительные числа. Согласно справочнику академика РАН Ю.В.Прохорова и проф. Ю.А.Розанова случайные величины могут принимать значения из любого множества. Так, случайные вектора, случайные функции, случайные множества, случайные ранжировки (упорядочения) – это отдельные виды случайных величин. Используется и иная терминология: термин «случайная величина» сохраняется только за числовыми функциями, определенными на пространстве элементарных событий, а в случае иных областей значений используется термин «случайный элемент». (Замечание для математиков: все рассматриваемые функции, определенные на пространстве элементарных событий, предполагаются измеримыми.)

Статистика ?1 называется доверительной областью, соответствующей доверительной вероятности ?, если

(5)

Ясно, что этому условию удовлетворяет, как правило, не одна, а много доверительных областей. Из них выбирают для практического применения какую-либо одну, исходя из дополнительных соображений, например, из соображений симметрии или минимизируя объем доверительной области, т.е. меру множества ?1.

При оценке одного числового параметра в качестве доверительных областей обычно применяют доверительные интервалы (в том числе лучи), а не иные типа подмножеств прямой. Более того, для многих двухпараметрических и трехпараметрических распределений (нормальных, логарифмически нормальных, Вейбулла-Гнеденко, гамма-распределений и др.) обычно используют точечные оценки и построенные на их основе доверительные границы для каждого из двух или трех параметров отдельно. Это делают для удобства пользования результатами расчетов: доверительные интервалы легче применять, чем фигуры на плоскости или тела в трехмерном пространстве.

Как следует из сказанного выше, доверительный интервал – это интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения. Границы доверительного интервала называют доверительными границами. Доверительная вероятность ? – вероятность того, что доверительный интервал накроет действительное значение параметра, оцениваемого по выборочным данным. Оцениванием с помощью доверительного интервала называют способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала.

Для числового параметра ? рассматривают верхнюю доверительную границу ?В, нижнюю доверительную границу ?Н и двусторонние доверительные границы – верхнюю ?1В и нижнюю ?1Н. Все четыре доверительные границы – функции от результатов наблюдений x1, x2,…, xn и доверительной вероятности ?.

Верхняя доверительная граница ?В – случайная величина ?В = ?В(x1, x2,…, xn; ?), для которой Р(?

Нижняя доверительная граница ?Н – случайная величина ?Н = ?Н(x1, x2,…, xn; ?), для которой Р(?>?H) = ?, где ? – истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид [?H; +?).

Двусторонние доверительные границы — верхняя ?1В и нижняя ?1Н — это случайные величины ?1В = ?1В(x1, x2,…, xn; ?) и ?1Н = ?1Н(x1, x2,…, xn; ?) такие, что Р(?1H

Вероятности, связанные с доверительными границами, можно записать в виде частных случаев формулы (5):

В нормативно-технической и инструктивно-методической документации, научной и учебной литературе используют два типа правил определения доверительных границ – построенных на основе точного распределения и построенных на основе асимптотического распределения некоторой точечной оценки ?n параметра ?. Рассмотрим примеры.

Пример 10. Пусть x1, x2,…, xn – выборка из нормального закона N(m, ?), параметры m и ? неизвестны. Укажем доверительные границы для m.

Известно , что случайная величина

имеет распределение Стьюдента с (т-1) степенью свободы, где

— выборочное среднее арифметическое и s0 – выборочное среднее квадратическое отклонение. Пусть

и

— квантили указанного распределения порядка ? и 1-? соответственно. Тогда

P{Y < t?(n-1)} = ?, P{Y > t1-?(n-1)} = ?.

Следовательно,

,

т.е. в качестве нижней доверительной границы ?Н, соответствующей доверительной вероятности ?, следует взять

. (6)

Аналогично получаем, что

.

Поскольку распределение Стьюдента симметрично относительно 0, то

= —

. Следовательно, в качестве верхней доверительной границы ?В для m, соответствующей доверительной вероятности ?, следует взять

. (7)

Как построить двусторонние доверительные границы? Положим

где ?1Н и ?1В заданы формулами (6) и (7) соответственно. Поскольку неравенство ?1Н < m < ?1В выполнено тогда и только тогда, когда

,

то

P{?1H < m < ?1B} = ?1 + ?2 - 1,

(в предположении, что ?1 > 0,5; ?2 > 0,5). Следовательно, если ? = ?1 + ?2 – 1, то ?1Н и ?1В – двусторонние доверительные границы для m, соответствующие доверительной вероятности ?. Обычно полагают ?1 = ?2, т.е. в качестве двусторонних доверительных границ ?1Н и ?1В, соответствующих доверительной вероятности ?, используют односторонние доверительные границы ?Н и ?В, соответствующие доверительной вероятности (1+?)/2.

Другой вид правил построения доверительных границ для параметра ? основан на асимптотической нормальности некоторой точечной оценки ?n этого параметра. В вероятностно-статистических методах принятия решений используют, как уже отмечалось, несмещенные или асимптотически несмещенные оценки ?n, для которых смещение либо равно 0, либо при больших объемах выборки пренебрежимо мало по сравнению со средним квадратическим отклонением оценки ?n. Для таких оценок при всех х

,

где Ф(х) – функция нормального распределения N(0;1). Пусть u? – квантиль порядка ? распределения N(0;1). Тогда

(8)

Поскольку неравенство

равносильно неравенству

,

то в качестве ?Н можно было бы взять левую часть последнего неравенства. Однако точное значение дисперсии D(?n) обычно неизвестно. Зато часто удается доказать, что дисперсия оценки имеет вид

(с точностью до пренебрежимо малых при росте n слагаемых), где h(?) – некоторая функция от неизвестного параметра ?. Справедлива теорема о наследовании сходимости [7, §2.4], согласно которой при подстановке в h(?) оценки ?n вместо ? соотношение (8) остается справедливым, т.е.

.

Следовательно, в качестве приближенной нижней доверительной границы следует взять

,

а в качестве приближенной верхней доверительной границы —

.

С ростом объема выборки качество приближенных доверительных границ улучшается, т.к. вероятности событий {? > ?H} и {?

При обработке экономических, управленческих или технических статистических данных обычно используют значение доверительной вероятности ? = 0,95. Применяют также значения ? = 0,99 или ? = 0,90. Иногда встречаются значения ? = 0,80, ? = 0,975, ? = 0,98 и др.

Для дискретных распределений, таких, как биномиальное, гипергеометрическое или распределение Пуассона (а также распределения статистики Колмогорова

и других непараметрических статистик), функции распределения имеют скачки. Поэтому для заданного заранее значения ?, например, ?= 0,95, нельзя указать доверительные границы, поскольку уравнения, с помощью которых вводятся доверительные границы, не имеют ни одного решения. Так, рассмотрим биномиальное распределение

,

где Y – число осуществлений события, n – объем выборки. Для него нельзя указать статистику K(Y, n) такую, что

P{p < K(Y, n)} = ?,

поскольку K(Y, n) – функция от Y и может принимать не больше значений, чем принимает Y, т.е. n + 1, а для ? имеется бесконечно много возможных значений – столько, сколько точек на отрезке. Сказанная означает, что верхней доверительной границы в случае биномиального распределения не существует.

Для дискретных распределений приходится изменить определения доверительных границ. Покажем изменения на примере биномиального распределения. Так, в качестве верхней доверительной границы ?В используют наименьшее K(Y, n) такое, что

P{p < K(Y, n)} > ?.

Аналогичным образом поступают для других доверительных границ и других распределений. Необходимо иметь в виду, что при небольших n и p истинная доверительная вероятность P{p < K(Y, n)} может существенно отличаться от номинальной ?, как это подробно продемонстрировано в работе. Поэтому наряду с величинами типа K(Y, n) (т.е. доверительных границ) при разработке таблиц и компьютерных программ необходимо предусматривать возможность получения и величин типа P{p < K(Y, n)} (т.е. достигаемых доверительных вероятностей).

Январь 24, 2019 Психология труда, инженерная психология, эргономика
Еще по теме
ОСНОВНЫЕ ПОНЯТИЯ, ИСПОЛЬЗУЕМЫЕ ПРИ ПРОВЕРКЕ ГИПОТЕЗ.
9.2. Информация, используемая человеком при опознании эмоций других людей
ОСНОВНЫЕ ПОНЯТИЯ
Часть ОСНОВНЫЕ ПОНЯТИЯ
1. Основные понятия
8.1. НЕКОТОРЫЕ ОСНОВНЫЕ ПОНЯТИЯ
1. Основные понятия
ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ
ОСНОВНЫЕ ПОНЯТИЯ ИННОВАЦИОННОГО МЕНЕДЖМЕНТА.
ОСНОВНЫЕ ПОНЯТИЯ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ
ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОГО МЕТОДА
СЛОВАРЬ ОСНОВНЫХ ПСИХОЛОГИЧЕСКИХ И ФИЗИОЛОГИЧЕСКИХ ПОНЯТИЙ
4.1.1. ОСНОВНЫЕ ПОНЯТИЯ ОБЩЕЙ ТЕОРИИ МОДЕЛИРОВАНИЯ
1.1.3. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ
1. Общие понятия, необходимые при исследовании инновационной сферы
Основные характеристики субъекта как философского понятия.
ОСНОВНЫЕ ПОНЯТИЯ УПРАВЛЕНИЯ КОНФЛИКТАМИ «ПРОФИЛАКТИКА» КОНФЛИКТНОСТИ
1.2. Основные разделы психологии труда. Понятие "эргономика"
Добавить комментарий