Порядковые статистики в математической статистике — это упорядоченная по неубыванию выборка одинаково распределённых независимых случайных величин и её элементы, занимающие строго определенное место в ранжированной совокупности.
Определение
Пусть X 1 , … , X n {displaystyle X_{1},ldots ,X_{n}} — конечная выборка из распределения P X {displaystyle mathbb {P} ^{X}} , определённая на некотором вероятностном пространстве ( Ω , F , P ) {displaystyle (Omega ,{mathcal {F}},mathbb {P} )} . Пусть ω ∈ Ω {displaystyle omega in Omega } и x i = X i ( ω ) , i = 1 , … , n {displaystyle x_{i}=X_{i}(omega ),;i=1,ldots ,n} . Перенумеруем последовательность { x i } i = 1 n {displaystyle {x_{i}}_{i=1}^{n}} в порядке неубывания, так что
x ( 1 ) ≤ x ( 2 ) ≤ ⋯ ≤ x ( n − 1 ) ≤ x ( n ) {displaystyle x_{(1)}leq x_{(2)}leq cdots leq x_{(n-1)}leq x_{(n)}} .Эта последовательность называется вариационным рядом. Вариационный ряд и его члены являются порядковыми статистиками. Случайная величина X ( k ) ( ω ) = x ( k ) {displaystyle X_{(k)}(omega )=x_{(k)}} называется k {displaystyle k} -ой порядковой статистикой исходной выборки. Порядковые статистики являются основой непараметрических методов.
Замечания
Очевидно из определения:
- X ( 1 ) = min ( X 1 , … , X n ) {displaystyle X_{(1)}=min(X_{1},ldots ,X_{n})} ;
- X ( n ) = max ( X 1 , … , X n ) {displaystyle X_{(n)}=max(X_{1},ldots ,X_{n})} .
Порядковые статистики абсолютно непрерывного распределения
- Пусть дана независимая выборка X 1 , … , X n {displaystyle X_{1},ldots ,X_{n}} из абсолютно непрерывного распределения, задаваемого плотностью распределения f X {displaystyle f_{X}} и функцией распределения F X {displaystyle F_{X}} . Тогда порядковые статистики также имеют абсолютно непрерывные распределения, и их плотности распределения имеют вид:
- Случайный вектор ( X ( j ) , X ( k ) ) ⊤ {displaystyle left(X_{(j)},X_{(k)} ight)^{ op }} , где 1 ≤ j < k ≤ n {displaystyle 1leq j<kleq n} также имеет абсолютно непрерывное распределение, и совместная плотность распределения имеет вид:
Пример
Пусть U 1 , … , U n ∼ U [ 0 , 1 ] {displaystyle U_{1},ldots ,U_{n}sim mathrm {U} [0,1]} - выборка из стандартного непрерывного равномерного распределения. Тогда
- f U ( k ) ( u ) = n ! ( n − k ) ! ( k − 1 ) ! u k − 1 [ 1 − u ] n − k , u ∈ [ 0 , 1 ] {displaystyle f_{U_{(k)}}(u)={frac {n!}{(n-k)!(k-1)!}}u^{k-1}[1-u]^{n-k},quad uin [0,1]} ,
то есть U ( k ) ∼ B ( k , n − k + 1 ) {displaystyle U_{(k)}sim mathrm {B} (k,n-k+1)} , где B {displaystyle mathrm {B} } - бета-распределение;
- f U ( j ) , U ( k ) ( u j , u k ) = n ! ( j − 1 ) ! ( k − j − 1 ) ! ( n − k ) ! u j j − 1 [ u k − u j ] k − j − 1 [ 1 − u k ] n − k , j < k , 0 ≤ u j ≤ u k ≤ 1 {displaystyle f_{U_{(j)},U_{(k)}}(u_{j},u_{k})={frac {n!}{(j-1)!(k-j-1)!(n-k)!}}u_{j}^{j-1}[u_{k}-u_{j}]^{k-j-1}[1-u_{k}]^{n-k},quad j<k,quad 0leq u_{j}leq u_{k}leq 1} ;
- f U ( 1 ) , … , U ( n ) ( u 1 , … , u n ) = n ! , 0 ≤ u 1 ≤ ⋯ ≤ u n ≤ 1 {displaystyle f_{U_{(1)},ldots ,U_{(n)}}(u_{1},ldots ,u_{n})=n!,quad 0leq u_{1}leq cdots leq u_{n}leq 1} .