Порядковая статистика

Порядковые статистики в математической статистике — это упорядоченная по неубыванию выборка одинаково распределённых независимых случайных величин и её элементы, занимающие строго определенное место в ранжированной совокупности.

Определение

Пусть X 1 , … , X n {displaystyle X_{1},ldots ,X_{n}} — конечная выборка из распределения P X {displaystyle mathbb {P} ^{X}} , определённая на некотором вероятностном пространстве ( Ω , F , P ) {displaystyle (Omega ,{mathcal {F}},mathbb {P} )} . Пусть ω ∈ Ω {displaystyle omega in Omega } и x i = X i ( ω ) , i = 1 , … , n {displaystyle x_{i}=X_{i}(omega ),;i=1,ldots ,n} . Перенумеруем последовательность { x i } i = 1 n {displaystyle {x_{i}}_{i=1}^{n}} в порядке неубывания, так что

x ( 1 ) ≤ x ( 2 ) ≤ ⋯ ≤ x ( n − 1 ) ≤ x ( n ) {displaystyle x_{(1)}leq x_{(2)}leq cdots leq x_{(n-1)}leq x_{(n)}} .

Эта последовательность называется вариационным рядом. Вариационный ряд и его члены являются порядковыми статистиками. Случайная величина X ( k ) ( ω ) = x ( k ) {displaystyle X_{(k)}(omega )=x_{(k)}} называется k {displaystyle k} -ой порядковой статистикой исходной выборки. Порядковые статистики являются основой непараметрических методов.

Замечания

Очевидно из определения:

X ( 1 ) = min ( X 1 , … , X n ) {displaystyle X_{(1)}=min(X_{1},ldots ,X_{n})} ;
X ( n ) = max ( X 1 , … , X n ) {displaystyle X_{(n)}=max(X_{1},ldots ,X_{n})} .

Порядковые статистики абсолютно непрерывного распределения

Пусть дана независимая выборка X 1 , … , X n {displaystyle X_{1},ldots ,X_{n}} из абсолютно непрерывного распределения, задаваемого плотностью распределения f X {displaystyle f_{X}} и функцией распределения F X {displaystyle F_{X}} . Тогда порядковые статистики также имеют абсолютно непрерывные распределения, и их плотности распределения имеют вид:

f X ( k ) ( x ) = n ! ( n − k ) ! ( k − 1 ) ! [ F X ( x ) ] k − 1 [ 1 − F X ( x ) ] n − k f X ( x ) {displaystyle f_{X_{(k)}}(x)={frac {n!}{(n-k)!(k-1)!}}[F_{X}(x)]^{k-1}[1-F_{X}(x)]^{n-k}f_{X}(x)} .

Случайный вектор ( X ( j ) , X ( k ) ) ⊤ {displaystyle left(X_{(j)},X_{(k)} ight)^{ op }} , где 1 ≤ j < k ≤ n {displaystyle 1leq j<kleq n} также имеет абсолютно непрерывное распределение, и совместная плотность распределения имеет вид:

f X ( j ) , X ( k ) ( x j , x k ) = { n ! ( j − 1 ) ! ( k − j − 1 ) ! ( n − k ) ! [ F X ( x j ) ] j − 1 [ F X ( x k ) − F X ( x j ) ] k − j − 1 [ 1 − F X ( x k ) ] n − k f X ( x j ) f X ( x k ) , x j ≤ x k 0 , x j > x k {displaystyle f_{X_{(j)},X_{(k)}}(x_{j},x_{k})=left{{egin{matrix}{frac {n!}{(j-1)!(k-j-1)!(n-k)!}}[F_{X}(x_{j})]^{j-1}[F_{X}(x_{k})-F_{X}(x_{j})]^{k-j-1}[1-F_{X}(x_{k})]^{n-k}f_{X}(x_{j})f_{X}(x_{k}),&x_{j}leq x_{k},&x_{j}>x_{k}end{matrix}} ight.} .

Пример

Пусть U 1 , … , U n ∼ U [ 0 , 1 ] {displaystyle U_{1},ldots ,U_{n}sim mathrm {U} [0,1]} - выборка из стандартного непрерывного равномерного распределения. Тогда

f U ( k ) ( u ) = n ! ( n − k ) ! ( k − 1 ) ! u k − 1 [ 1 − u ] n − k , u ∈ [ 0 , 1 ] {displaystyle f_{U_{(k)}}(u)={frac {n!}{(n-k)!(k-1)!}}u^{k-1}[1-u]^{n-k},quad uin [0,1]} ,

то есть U ( k ) ∼ B ( k , n − k + 1 ) {displaystyle U_{(k)}sim mathrm {B} (k,n-k+1)} , где B {displaystyle mathrm {B} } - бета-распределение;

f U ( j ) , U ( k ) ( u j , u k ) = n ! ( j − 1 ) ! ( k − j − 1 ) ! ( n − k ) ! u j j − 1 [ u k − u j ] k − j − 1 [ 1 − u k ] n − k , j < k , 0 ≤ u j ≤ u k ≤ 1 {displaystyle f_{U_{(j)},U_{(k)}}(u_{j},u_{k})={frac {n!}{(j-1)!(k-j-1)!(n-k)!}}u_{j}^{j-1}[u_{k}-u_{j}]^{k-j-1}[1-u_{k}]^{n-k},quad j<k,quad 0leq u_{j}leq u_{k}leq 1} ;
f U ( 1 ) , … , U ( n ) ( u 1 , … , u n ) = n ! , 0 ≤ u 1 ≤ ⋯ ≤ u n ≤ 1 {displaystyle f_{U_{(1)},ldots ,U_{(n)}}(u_{1},ldots ,u_{n})=n!,quad 0leq u_{1}leq cdots leq u_{n}leq 1} .