geladen: разбросало кучу #6, внеочередной выпуск (интервал доверия)

Entry tags:

вероятность, возликуй зануда, ликбез, разбросало кучу

разбросало кучу #6, внеочередной выпуск (интервал доверия)
В СВЫПУНАЛЬ будет часто использоваться выражение "доверительный интервал", вокруг которого часто возникает путаница (вплоть до лабов по физике на третьем курсе, припоминаю, разные преподаватели подразумевали под ДИ немного разные вещи).

В нашем альманахе тоже, у ДИ будет два определения, одно из которых, строго говоря -- неправильное (но очень удобное).

Правильное, каноническое определение, в применении к нашему случаю, означает примерно следующее:

Предположим, некий гражданин Г. отстрелялся по мишени, с целью выяснить кучность винтовки. Замерил гражданин Г., в зависимости от метода подсчёта, всякие свои кучи, координаты отдельных пробоин, 50% разброс по вертикали-горизонтали, ну или мало ли что ещё люди придумали для САМЕВИК. Из замеров вывел значение для разброса -- оценил сигму, R50 чи R95, т. е. некий реальный инженерно-значимый параметр своей винтовки и прикинул по некоей формуле, соответствующей методу отстрела, доверительный интервал.

К примеру, из расчётов получилось, что R50 на этой дистанции = одна угловая минута, а по расчётам доверительного интервала с 95% уровнем доверия, ДИ равен ±20%, т. е. 0.8 - 1.2 МОА. Что это значит?

Это значит, что если гражданин Г. отстреляется ещё много раз ровно по тому же протоколу, и для каждого замера вычислит интервал доверия, в 95% случаев реальное значение измеряемой величины будет попадать в ДИ (а, соответственно, в 5% случаев -- выходить за ДИ). Не больше, не меньше.

* Это НЕ значит, что для данного конкретного замера с 95% вероятностью R50 находится в ДИ. (R50 -- величина не случайная, она там либо находится, либо нет.)
* Это НЕ значит, что 95% значений, составляющих данный конкретный замер, лежат в ДИ.
* Это НЕ значит, что для последующих замеров вычисленный результат с 95% вероятностью будет попадать в ДИ, полученный для этого замера.
* etc. (за примеры спасибо уикипэдии)

При всём вышесказанном, интуитивное понимание ДИ -- правильное. ДИ -- действительно можно воспринимать как интервал вокруг экспериментально полученного значения, в котором с большой вероятностью лежит настоящее значение, которое мы пытаемся определить опытным путём.

Про ДИ нужно отметить несколько важных моментов:
* ДИ вычисляется из данных конкретного эксперимента. При повторении эксперимента ДИ может быть другой.
* ДИ вычисляется для конкретного уровня доверия. Как правило, в инженерных применениях используется 95% (своего рода, уровень доверия "по умолчанию"). Если снизить уровень доверия, интервал ДИ сужается; понятно почему -- если, например, при уровне доверия в 95% искомое значение "вылетает" за интервал только в одним из 20 случаев, то с УД в 90% -- уже в одном из 10.
* Не сто́ит путать уровень доверия с характеристиками разброса или иными параметрами изучаемого феномена. УД в определении ДИ характеризует только требование к точности эксперимента. Значение УД -- например 95% -- задаёт сам Учоный, совершенно от балды, в меру своих представлений об "уверенности".
* ДИ не обязательно является симметричным вокруг экспериментально полученного значения, как, например, плюс-минус 20%. Может вполне быть, скажем, плюс 15%, минус 25%.
* ДИ для заданного УД -- не единственный. Может быть несколько разных интервалов доверия вокруг экспериментально полученного значения, каждый из которых будет удовлетворять определению.

А теперь -- неправильное, но тоже полезное определение:

Предположим имеется некий метод вычисления кучности из экспериментальных пробоин в мишени (напр., среднее из максимального разброса 2 серий по 5 выстрелов). Истинное значение (в данном случае -- ~3.06σ) можно получить путём усреднения результатов от бесконечного количества экспериментов; экспериментальные данные попадают к нему более или менее близко.

Если задать некий "уровень доверия", напр. в 95%, неправильное, но тоже полезное, определение доверительного интервала звучит так: промежуток, в который при данном методе вычислений попадёт УД% экспериментальных результатов.

ДИ, в таком случае, характеризует метод вычислений, а не конкретный эксперимент, что очень полезно именно для сравнения методов и выбора наилучшего.

В конкретном эксперименте, подобный "неправильный" ИД говорит нам только то, что следует из определения, и тут он ВНЕЗАПНО приближается к "правильному" (в случае ~ симметричных распределений). Если мы, к примеру, знаем (см. СВЫПУНАЛЬ), что 95% экспериментов по "методу ганзы" лежат в ±37.3% от истины, путём смелого логического хода, мы можем заключить, что в 95% отстрелов 2х5, истина находится где-то в ±37.3% от результата. (75% колебаний результата, бонжур реальность).

Какое определение ДИ используется, будет совершенно понятно из контекста.

Остерегайся СВЫПУНАЛЬ, дорогой читатель, там в засаде сидят срыв покровов и разгром наголову.