Statistiche degli ordini | Cosa sono le statistiche sugli ordini??

Contenuti

introduzione

La statistica degli ordini è un concetto molto utile nella scienza statistica. Hanno una vasta gamma di applicazioni, inclusa la modellazione delle aste, auto da corsa e polizze assicurative, ottimizzazione dei processi produttivi, Stima di parametri di distribuzioni, et al. Attraverso questo articolo, capiremo l'idea delle statistiche degli ordini. Prima capiremo il suo significato e gradualmente procederemo alla sua distribuzione., eventualmente coprendo concetti più avanzati.

Supponiamo di avere un insieme di variabili casuali X1, X2, …, XNord, indipendenti e identicamente distribuiti (iid). Per l'indipendenza, intendiamo che il valore assunto da un variabile non è influenzato dai valori assunti da altre variabili aleatorie. Per distribuzione identica, intendiamo che la funzione di densità di probabilità (PDF) (o equivalente, la funzione di distribuzione cumulativa, CDF) per le variabili casuali è lo stesso. il Kns La statistica dell'ordine per questo insieme di variabili casuali è definita come kns valore del campione più piccolo.

Per capire meglio questo concetto, prenderemo 5 variabili casuali X1, X2, X3, X4, X5. Osserveremo una realizzazione / risultato casuale della distribuzione di ciascuna di queste variabili casuali. Supponiamo di ottenere i seguenti valori:

14444cattura01-min-8688645

il Kns la statistica dell'ordine per questo esperimento è kns valore più piccolo dell'insieme {4, 2, 7, 11, 5}. Quindi, il 1Ns la statistica dell'ordine è 2 (valore minimo), il 2Nord Dakota la statistica dell'ordine è 4 (il prossimo più piccolo), e così via. Il 5ns la statistica dell'ordine è il quinto valore più piccolo (il valore più grande), Che cos'è 11. Ripetiamo questo processo molte volte, vale a dire, estraiamo campioni dalla distribuzione di ciascuna di queste variabili casuali iid e troviamo il kns valore minimo per ogni insieme di osservazioni. La distribuzione di probabilità di questi valori dà la distribuzione di kns statistiche degli ordini.

Generalmente, se ordiniamo variabili casuali X1, X2, …, XNord in ordine crescente, poi il kns la statistica dell'ordine viene visualizzata come:

58274cattura02-min-7203541

La notazione generale del kns la statistica dell'ordine è X(K). Nota X(K) è diverso da XK. XK è il kns variabile casuale del nostro insieme, mentre X(K) è il kns ordine statistico del nostro insieme. X(K) assume il valore di XK si XK è il kns Variabile casuale quando le realizzazioni sono ordinate in ordine crescente.

Il 1Ns Statistica dell'ordine X(1) è l'insieme dei valori minimi della realizzazione dell'insieme di 'n’ variabili casuali. Dopons Statistica dell'ordine X(Nord) è l'insieme dei valori massimi (ennesimo valore minimo) della realizzazione dell'insieme di 'n’ variabili casuali. Possono essere espressi come:

11926cattura03-min-4227227

Distribuzione delle statistiche degli ordini

Ora proveremo a scoprire la distribuzione delle statistiche dell'ordine. Descriveremo prima la distribuzione di nns statistiche degli ordini, poi lui 1Ns ordine statistico e infine il kns statistiche generali sull'ordine.

UN) Distribuzione di nns Statistiche degli ordini:

Sia la funzione di densità di probabilità (PDF) e la funzione di distribuzione cumulativa (CDF) le nostre variabili casuali lasciano fX(X) y FX(X) rispettivamente. Per definizione di CDF,

82261cattura04-min-8907724

Poiché le nostre variabili casuali sono distribuite in modo identico, avere lo stesso PDF fX(X) y CDF FX(X). Ora calcoleremo il CDF di nns statistiche degli ordini (FNord(X)) come segue:

91898cattura05-min-1932533

Variabili casuali X1, X2, …, XNord sono anche indipendenti. Perciò, per proprietà di indipendenza,

71167cattura06-min-7598051

Il PDF del nns ordine statistico (FNord(X)) è calcolato come segue:

82826cattura07-min-4983818

Perciò, l'espressione per PDF e CDF di nns La statistica dell'ordine è stata ottenuta.

B) Distribuzione di 1Ns Statistiche degli ordini:

Il CDF di una variabile casuale può anche essere calcolato come quello meno la probabilità che la variabile casuale X assuma un valore maggiore o uguale a x. Matematicamente,

47335cattura08-min-6746054

Determinare il CDF di 1Ns statistiche degli ordini (F1(X)) come segue:

51217cattura09-min-4314011

Un'altra volta, usando la proprietà di indipendenza delle variabili casuali,

56291cattura10-min-6261394

Il PDF del 1Ns ordine statistico (F1(X)) è calcolato come segue:

92517cattura11-min-5947183

Perciò, l'espressione per PDF e CDF di 1Ns La statistica dell'ordine è stata ottenuta.

C) Distribuzione del kns Statistiche degli ordini:

Forchettans statistiche degli ordini, generalmente, la seguente equazione descrive il tuo CDF (FK(X)):

61621cattura12-min-2601707

Il PDF di kns ordine statistico (FK(X)) è espresso come:

63589cattura13-min-3525477

Per evitare confusioni, useremo prove geometriche per capire l'equazione. Come discusso sopra, l'insieme delle variabili casuali ha lo stesso PDF (FX(X)). Il grafico seguente mostra un PDF di esempio con il kns Statistica dell'ordine ottenuta da campionamento casuale:

58258cattura14-min-2854158

Quindi, il PDF delle variabili casuali fX(X) è definito tra l'intervallo [un,B]. La statistica dell'ordine k-esimo per un campione casuale è mostrata con la linea rossa. Le altre realizzazioni variabili (per il campione casuale) mostrato dalle piccole linee nere sull'asse x.

Ci sono esattamente (K – 1) osservazioni di variabili casuali che cadono nella regione gialla del grafico (la regione tra & Kns statistiche degli ordini). La probabilità che una particolare osservazione rientri in questa regione è data dal CDF delle variabili casuali (FX(X)). Ma siamo consapevoli che (K – 1) le osservazioni sono diminuite nella regione, cosa ci dà il termine (per l'indipendenza) (FX(X))(K – 1).

Ci sono esattamente (n – K) osservazioni di variabili casuali che cadono nella regione blu del grafico (la regione tra kns ordine statistico & B). La probabilità che una particolare osservazione cada in questa regione è data dal 1 – CDF delle variabili casuali (1- FX(X)). Ma siamo consapevoli che (n – K) le osservazioni sono diminuite nella regione, cosa ci dà il termine (per l'indipendenza) (1-FX(X))(n – K).

Finalmente, Esattamente 1 l'osservazione cade esattamente sulla statistica di ordine k-esimo con probabilità fX(X). Perciò, il prodotto di 3 termini ci dà un'idea del significato geometrico dell'equazione per PDF della statistica di ordine k-esimo. Ma, Da dove viene il termine fattoriale?? Lo scenario di cui sopra ha mostrato solo uno dei tanti ordini. Ci possono essere molte di queste combinazioni. Il numero totale di tali combinazioni è mostrato di seguito:

56727cattura15-min-5188837

Perciò, il prodotto di tutti questi termini ci dà la distribuzione generale di kns statistiche degli ordini.

Utili funzioni di statistica ordini

Le statistiche degli ordini portano a diverse funzioni utili. Tra loro, Tra le più importanti vi sono l'intervallo del campione e il mediano del campione.

1) Gamma di campioni: È definita come la differenza tra il valore più grande e il più piccolo. Si esprime come segue:

67901cattura16-min-3026387

2) Mediana del campione: La mediana campionaria divide il campione casuale (realizzazioni dell'insieme delle variabili casuali) in due metà, uno contenente i campioni di valore più basso e l'altro contenente i campioni di valore più alto. È come la statistica dell'ordine medio / centrale. È matematicamente definito come:

54935cattura17-min-7664566

Set di statistiche sugli ordini PDF

Una funzione di densità di probabilità congiunta può aiutarci a comprendere meglio la relazione tra due variabili casuali (statistiche a due ordini
nel nostro caso). Il PDF congiunto per qualsiasi statistica di 2 X ordini(un) & X(B), tale che 1 ≤ a ≤ b ≤ n è dato dalla seguente equazione:

57960cattura18-min-9865168

Esempio

Useremo un esempio molto semplice per illustrare la distribuzione delle statistiche dell'ordine: la distribuzione uniforme standard (tu[0, 1] distribuzione). noi prenderemo 5 variabili casuali X1, X2, X3, X4, X5, tutti hanno l'U[0, 1] distribuzione. Per questo insieme di variabili casuali, calcoleremo e disegneremo il 1Ns, 3rd (la mediana del campione) e 5ns (Nordns) statistiche degli ordini. Quanto segue figura Mostra U[0, 1] distribuzione:

14549cattura19-min-7605626

Estrarremo campioni casuali come segue e troveremo il 1Ns, 3rd & 5ns statistica dell'ordine per ogni campione. Di seguito sono riportati due dei campioni:

84551cattura20-min-5655291

La distribuzione uniforme standard PDF e CDF sono dati come:

40491cattura21-min-6236281

Useremo queste informazioni e calcoleremo X(1), X(3) & X(5) usando le formule che abbiamo derivato. Prenderemo il caso solo quando x è compreso tra 0 e 1 (per altri casi, la statistica dell'ordine è zero poiché PDF è zero).

UN) Per 1Ns statistiche degli ordini:

88253cattura22-min-5826320

Trama per f1(X):

97189cattura23-min-5582206

B) Per 3rd statistiche degli ordini:

36859cattura24-min-6027432

Trama per f5(X):

88539cattura25-min-1884985

C) Per 5ns statistiche degli ordini:

69523cattura26-min-4975531

Trama per f5(X):

94366cattura27-min-6960818

conclusione

Perciò, abbiamo approfondito i concetti di statistica dell'ordine. Un'ampia gamma di processi fisici può essere modellata attraverso le statistiche degli ordini, sfruttando le sue proprietà, in particolare le loro distribuzioni.

Il supporto mostrato in questo articolo non è di proprietà di DataPeaker e viene utilizzato a discrezione dell'autore.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.