lqp - Вероятность максимума.
July 17th, 2019
03:11 am

[Link]

Previous Entry Add to Memories Tell A Friend Next Entry
Вероятность максимума.
Вопрос к френдам с математическим образованием. Проверьте пожалуйста мои рассуждения. Вопрос, я понимаю, школьный, но меня как-то удивляет результат.

Дана выборка X=[x_1,,,X_{n-1},X_n] из n вещественных случайных величин с непрерывной функцией распределения f(x), произвольной но одной и той же для всех x_i.

Вопрос - какова вероятность, что x_n больше чем все предшествующие величины x_1,,,x_{n-1}?

Мои рассуждения: возьмем только две величины x_j и x_n. У нас есть две вероятности P1= P(x_j>x_n) и P2=P(x_n>x_j). Поскольку функция распределения у них одна и та же, то P1=P2. Также P1+P2=1 поскольку P(x_j==x_n) асимптотически равна нулю в силу непрерывности f(x). Следовательно P2=1/2. x_n больше всех предыдущих элементов последовательности, есил он больше каждого из них. Значит P(x_n == max X)=(1/2)^(n-1).

Меня как-то удивляет, что это вероятность никак не зависит от f(x).

(12 comments | Leave a comment)

Comments
 
[User Picture]
From:[info]aculeata
Date:July 16th, 2019 - 05:55 pm
(Link)
По-моему, это неверно, потому что неаккуратно обращается
с независимостью событий. Ну и скажем вероятность того,
что x_i больше всех остальных, одинакова для любого i,
события эти (с точностью до ситуаций меры нуль) попарно
взаимоисключающие, так что сумма таких вероятностей
по всем i равна единице. Вроде получается 1 / n
и от функции распределения действительно не зависит
(что как раз не очень-то удивительно).
[User Picture]
From:[info]tiphareth
Date:July 16th, 2019 - 06:26 pm
(Link)
звучит разумно
From:[info]lqp
Date:July 16th, 2019 - 06:48 pm
(Link)
Звучит убедительно, но меня беспокоит физический смысл.

Получается, что с ростом n, вероятность P(X_n=max) будет падать ооочень медленно. Причем даже в том случае, когда область определения f(x) ограничена.
[User Picture]
From:[info]aculeata
Date:July 16th, 2019 - 07:08 pm
(Link)
Про это, по-моему, лучше думать квантовомеханически, что ли --
тогда проблем с физическим смыслом нет. "Классическая"
интуиция на самом деле (мне кажется) неявно заставляет
тебя искать ответ на вопрос примерно -- какова вероятность
того, сегодня весь день (всю милисекунду) у меня последнее
x оказывается наибольшим? Но, может быть, я чего-то
не понимаю,
[User Picture]
From:[info]aculeata
Date:July 16th, 2019 - 07:10 pm
(Link)
"того, что" и "миллисекунду" подразумевается, простите
нам наш маразмий
[User Picture]
From:[info]iskramivpeople
Date:July 16th, 2019 - 07:12 pm
(Link)
Эдак вы до теоремы Гливенко-Кантелли додумаетесь

https://en.wikipedia.org/wiki/Glivenko%E2%80%93Cantelli_theorem


From:(Anonymous)
Date:July 16th, 2019 - 06:55 pm
(Link)
ну тогда пусть х_i равен только 0 или 1, с вероятностью 1/2.
тогда как раз предложенная формула 1/2^n срабатывает для требуемой последовательности 0000...001. а вот в 1/n как-то слабо верится
[User Picture]
From:[info]aculeata
Date:July 16th, 2019 - 07:01 pm
(Link)
В исходном рассуждении (которое в посте) явственно сделано
предположение, что совпадать значения x_i и x_j при i != j
могут только с вероятностью ноль (распределение непрерывное).
При дискретном распределении это, очевидно, весьма далеко
от истины.
From:(Anonymous)
Date:July 16th, 2019 - 10:42 pm
(Link)
Вообще-то вероятность 1/n. Просто из n! перестановок нам подходит (n-1)!
И от функции распределения это уж точно не зависит
From:(Anonymous)
Date:July 17th, 2019 - 07:51 am

( from lj:thread2 )

(Link)
Если мы оговорим, что величины независимы ( исключая, например, случаи вроде x1 == 2 * x2 ), то распределение максимума последней величины является таким же, как распределение максимума любой другой; одно значение у нас всегда будет больше (не превышать) остальных, так что в силу симметрии такая вероятность должна быть 1/n .

Что до рассуждения -- то я не уверен, что на последнем шаге у нас будет именно произведение. ( Впрочем, у меня заканчивается грипп и я ни в чем сейчас не уверен. Тем не менее -- )

Дело в том, что даже если предположить независимость величин, можно перемножать вероятности, заданные этими величинами независимо. Здесь же речь идет о парных сочетаниях.

Например, если взять две величины, равномерно и независимо распределенные на (0,1), то вероятность y>x будет площадью треугольника ; если же добавить к ним третью аналогично распределенную -- то у нас получится пирамида высоты 1 и площадью с основанием квадрата. И так далее.
From:(Anonymous)
Date:July 18th, 2019 - 09:42 pm
(Link)
> Мои рассуждения: возьмем только две величины x_j и x_n. У нас есть две вероятности P1= P(x_j>X_n) и P2=P(x_n>X_j). Поскольку функция распределения у них одна и та же, то P1=P2.

Неправильно. P1 не равно P2 если x_n не равно x_j

Возьмём например Гауссиану, x_n очень маленькое, x_j очень большое. Тогда
P1 почти единица, а P2 почти ноль.

(Вербицкий точно математик? Это же позор какой-то такое пропустить)
From:[info]lqp
Date:July 19th, 2019 - 03:55 pm
(Link)
Это у меня опечатка. Поправил.
Powered by LJ.Rossia.org