ИНТЕРВАЛЬНЫЕ ДАННЫЕ В ЗАДАЧАХ ОЦЕНИВАНИЯ ПАРАМЕТРОВ (НА ПРИМЕРЕ ГАММА-РАСПРЕДЕЛЕНИЯ)

Рассмотрим классическую в прикладной математической статистике параметрическую задачу оценивания. Исходные данные – выборка x1 , x2 ,…, xn, состоящая из n действительных чисел. В вероятностной модели простой случайной выборки ее элементы x1 , x2 ,…, xn считаются набором реализаций n независимых одинаково распределенных случайных величин. Будем считать, что эти величины имеют плотность f(x). В параметрической статистической теории предполагается, что плотность f(x) известна с точностью до конечномерного параметра, т.е.,

при некотором

Это, конечно, весьма сильное предположение, которое требует обоснования и проверки; однако в настоящее время параметрическая теория оценивания широко используется в различных прикладных областях.

Все результаты наблюдений определяются с некоторой точностью, в частности, записываются с помощью конечного числа значащих цифр (обычно 2 – 5). Следовательно, все реальные распределения результатов наблюдений дискретны. Обычно считают, что эти дискретные распределения достаточно хорошо приближаются непрерывными. Уточняя это утверждение, приходим к уже рассматривавшейся модели, согласно которой статистику доступны лишь величины

yj = xj +

j , j = 1, 2,… , n ,

где xi – «истинные» значения,

погрешности наблюдений (включая погрешности дискретизации). В вероятностной модели принимаем, что n пар

образуют простую случайную выборку из некоторого двумерного распределения, причем x1 , x2 ,…, xn — выборка из распределения с плотностью

. Необходимо учитывать, что

и

— реализации зависимых случайных величин (если считать их независимыми, то распределение yi будет непрерывным, а не дискретным). Поскольку систематическую ошибку, как правило, нельзя полностью исключить [26, с.141], то необходимо рассматривать случай

Нет оснований априори принимать и нормальность распределения погрешностей (согласно сводкам экспериментальных данных о разнообразии форм распределения погрешностей измерений, приведенным в [26, с.148] и [27, с.71-77], в подавляющем большинстве случаев гипотеза о нормальном распределении погрешностей оказалась неприемлемой для средств измерений различных типов). Таким образом, все три распространенных представления о свойствах погрешностей не адекватны реальности. Влияние погрешностей наблюдений на свойства статистических моделей необходимо изучать на основе иных моделей, а именно, моделей интервальной статистики.

Пусть

— характеристика величины погрешности, например, средняя квадратическая ошибка

.

В классической математической статистике

считается пренебрежимо малой (

) при фиксированном объеме выборки n. Общие результаты доказываются в асимптотике

. Таким образом, в классической математической статистике сначала делается предельный переход

, а затем предельный переход

. В статистике интервальных данных принимаем, что объем выборки достаточно велик (

), но всем измерениям соответствует одна и та же характеристика погрешности

. Полезные для анализа реальных данных предельные теоремы получаем при

. В статистике интервальных данных сначала делается предельный переход

, а затем предельный переход

. Итак, в обеих теориях используются одни и те же два предельных перехода:

и

, но в разном порядке. Утверждения обеих теорий принципиально различны.

Изложение ниже идет на примере оценивания параметров гамма-распределения, хотя аналогичные результаты можно получить и для других параметрических семейств, а также для задач проверки гипотез (см. ниже) и т.д. Наша цель – продемонстрировать основные черты подхода статистики интервальных данных. Его разработка была стимулирована подготовкой ГОСТ 11.011-83.

Отметим, что постановки статистики объектов нечисловой природы соответствуют подходу, принятому в общей теории устойчивости [3,27]. В соответствии с этим подходом выборке x = (x1 , x2 ,…, xn ) ставится в соответствие множество допустимых отклонений G(x), т.е. множество возможных значений вектора результатов наблюдений y = (y1 , y2 ,…, yn ). Если известно, что абсолютная погрешность результатов измерений не превосходит

, то множество допустимых отклонений имеет вид

Если известно, что относительная погрешность не превосходит

, то множество допустимых отклонений имеет вид

Теория устойчивости позволяет учесть «наихудшие» отклонения, т.е. приводит к выводам типа минимаксных, в то время как конкретные модели погрешностей позволяют делать заключения о поведении статистик «в среднем».

Январь 24, 2019 Психология труда, инженерная психология, эргономика
Еще по теме
2.3.3. ИНТЕРВАЛЬНЫЕ ДАННЫЕ В ЗАДАЧАХ ОЦЕНИВАНИЯ ХАРАКТЕРИСТИК РАСПРЕДЕЛЕНИЯ
ОЦЕНКИ ПАРАМЕТРОВ ГАММА-РАСПРЕДЕЛЕНИЯ.
2.3.6. ИНТЕРВАЛЬНЫЕ ДАННЫЕ В ЗАДАЧАХ ПРОВЕРКИ ГИПОТЕЗ
2.3.5. СРАВНЕНИЕ МЕТОДОВ ОЦЕНИВАНИЯ ПАРАМЕТРОВ
ЗАВИСИМОСТЬ ПРОЦЕССА РЕШЕНИЯ ТЕСТОВЫХ ЗАДАЧ И ЗАДАЧ-ГОЛОВОЛОМОК ("МАЛЫХ ТВОРЧЕСКИХ ЗАДАЧ") ОТ ПАРАМЕТРОВ КОГНИТИВНОГО РЕСУРСА
ЗАДАЧИ ОЦЕНИВАНИЯ.
1.1.1. ПРИМЕР ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЯ
2.3. СТАТИСТИКА ИНТЕРВАЛЬНЫХ ДАННЫХ
ИНТЕРВАЛЬНАЯ МАТЕМАТИКА И СИД.
2.3.1. О РАЗВИТИИ СТАТИСТИКИ ИНТЕРВАЛЬНЫХ ДАННЫХ
ИНТЕРВАЛЬНАЯ ШКАЛА
2.3.8. ИНТЕРВАЛЬНЫЙ ДИСКРИМИНАНТНЫЙ АНАЛИЗ
2.3.2. ОСНОВНЫЕ ИДЕИ АСИМПТОТИЧЕСКОЙ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ИНТЕРВАЛЬНЫХ ДАННЫХ
Добавить комментарий