lqp - Вероятность максимума.
[Recent Entries][Archive][Friends][User Info]
03:11 am
[Link] |
Вероятность максимума. Вопрос к френдам с математическим образованием. Проверьте пожалуйста мои рассуждения. Вопрос, я понимаю, школьный, но меня как-то удивляет результат.
Дана выборка X=[x_1,,,X_{n-1},X_n] из n вещественных случайных величин с непрерывной функцией распределения f(x), произвольной но одной и той же для всех x_i.
Вопрос - какова вероятность, что x_n больше чем все предшествующие величины x_1,,,x_{n-1}?
Мои рассуждения: возьмем только две величины x_j и x_n. У нас есть две вероятности P1= P(x_j>x_n) и P2=P(x_n>x_j). Поскольку функция распределения у них одна и та же, то P1=P2. Также P1+P2=1 поскольку P(x_j==x_n) асимптотически равна нулю в силу непрерывности f(x). Следовательно P2=1/2. x_n больше всех предыдущих элементов последовательности, есил он больше каждого из них. Значит P(x_n == max X)=(1/2)^(n-1).
Меня как-то удивляет, что это вероятность никак не зависит от f(x).
|
|
|
По-моему, это неверно, потому что неаккуратно обращается с независимостью событий. Ну и скажем вероятность того, что x_i больше всех остальных, одинакова для любого i, события эти (с точностью до ситуаций меры нуль) попарно взаимоисключающие, так что сумма таких вероятностей по всем i равна единице. Вроде получается 1 / n и от функции распределения действительно не зависит (что как раз не очень-то удивительно).
From: | lqp |
Date: | July 16th, 2019 - 06:48 pm |
---|
| | | (Link) |
|
Звучит убедительно, но меня беспокоит физический смысл.
Получается, что с ростом n, вероятность P(X_n=max) будет падать ооочень медленно. Причем даже в том случае, когда область определения f(x) ограничена.
Про это, по-моему, лучше думать квантовомеханически, что ли -- тогда проблем с физическим смыслом нет. "Классическая" интуиция на самом деле (мне кажется) неявно заставляет тебя искать ответ на вопрос примерно -- какова вероятность того, сегодня весь день (всю милисекунду) у меня последнее x оказывается наибольшим? Но, может быть, я чего-то не понимаю,
"того, что" и "миллисекунду" подразумевается, простите нам наш маразмий
From: | (Anonymous) |
Date: | July 16th, 2019 - 06:55 pm |
---|
| | | (Link) |
|
ну тогда пусть х_i равен только 0 или 1, с вероятностью 1/2. тогда как раз предложенная формула 1/2^n срабатывает для требуемой последовательности 0000...001. а вот в 1/n как-то слабо верится
В исходном рассуждении (которое в посте) явственно сделано предположение, что совпадать значения x_i и x_j при i != j могут только с вероятностью ноль (распределение непрерывное). При дискретном распределении это, очевидно, весьма далеко от истины.
From: | (Anonymous) |
Date: | July 16th, 2019 - 10:42 pm |
---|
| | | (Link) |
|
Вообще-то вероятность 1/n. Просто из n! перестановок нам подходит (n-1)! И от функции распределения это уж точно не зависит
From: | (Anonymous) |
Date: | July 17th, 2019 - 07:51 am |
---|
| | ( from lj:thread2 ) | (Link) |
|
Если мы оговорим, что величины независимы ( исключая, например, случаи вроде x1 == 2 * x2 ), то распределение максимума последней величины является таким же, как распределение максимума любой другой; одно значение у нас всегда будет больше (не превышать) остальных, так что в силу симметрии такая вероятность должна быть 1/n .
Что до рассуждения -- то я не уверен, что на последнем шаге у нас будет именно произведение. ( Впрочем, у меня заканчивается грипп и я ни в чем сейчас не уверен. Тем не менее -- )
Дело в том, что даже если предположить независимость величин, можно перемножать вероятности, заданные этими величинами независимо. Здесь же речь идет о парных сочетаниях.
Например, если взять две величины, равномерно и независимо распределенные на (0,1), то вероятность y>x будет площадью треугольника ; если же добавить к ним третью аналогично распределенную -- то у нас получится пирамида высоты 1 и площадью с основанием квадрата. И так далее.
From: | (Anonymous) |
Date: | July 18th, 2019 - 09:42 pm |
---|
| | | (Link) |
|
> Мои рассуждения: возьмем только две величины x_j и x_n. У нас есть две вероятности P1= P(x_j>X_n) и P2=P(x_n>X_j). Поскольку функция распределения у них одна и та же, то P1=P2.
Неправильно. P1 не равно P2 если x_n не равно x_j
Возьмём например Гауссиану, x_n очень маленькое, x_j очень большое. Тогда P1 почти единица, а P2 почти ноль.
(Вербицкий точно математик? Это же позор какой-то такое пропустить)
From: | lqp |
Date: | July 19th, 2019 - 03:55 pm |
---|
| | | (Link) |
|
Это у меня опечатка. Поправил. |
|