Statistiques de commande | Quelles sont les statistiques de commande?

Contenu

introduction

La statistique des commandes est un concept très utile en science statistique. Ils ont un large éventail d'applications, y compris la modélisation d'enchères, courses automobiles et polices d'assurance, optimisation des processus de production, estimación de paramètres de distribuciones, et al. A travers cet article, on comprendra l'idée de statistiques de commandes. Nous allons d'abord comprendre sa signification et procéder progressivement à sa diffusion., couvrant éventuellement des concepts plus avancés.

Supposons que nous ayons un ensemble de variables aléatoires X1, X2, …, XNord, indépendantes et distribuées de manière identique (iid). Pour l'indépendance, queremos decir que el valor tomado por una variable aleatoria no está influenciado por los valores tomados por otras variables aleatorias. Par répartition identique, nous voulons dire que la fonction de densité de probabilité (PDF) (ou équivalent, la fonction de distribution cumulative, CDF) pour les variables aléatoires c'est pareil. Le Ke La statistique d'ordre pour cet ensemble de variables aléatoires est définie comme ke plus petite valeur d'échantillon.

Pour mieux comprendre ce concept, nous prendrons 5 variables aléatoires X1, X2, X3, X4, X5. On observera une réalisation / résultat aléatoire de la distribution de chacune de ces variables aléatoires. Supposons que nous obtenions les valeurs suivantes:

14444capture01-min-8688645

Le Ke la statistique d'ordre pour cette expérience est ke plus petite valeur de l'ensemble {4, 2, 7, 11, 5}. Ensuite, les 1S t la statistique de commande est 2 (plus petite valeur), la 2Dakota du nord la statistique de commande est 4 (le plus petit suivant), et ainsi de suite. Le 5e la statistique d'ordre est la cinquième plus petite valeur (la plus grande valeur), Qu'est que c'est 11. Nous répétons ce processus plusieurs fois, c'est-à-dire, nous extrayons des échantillons de la distribution de chacune de ces variables aléatoires iid et trouvons le ke plus petite valeur pour chaque ensemble d'observations. La distribution de probabilité de ces valeurs donne la distribution de ke statistiques de commande.

En général, si on commande des variables aléatoires X1, X2, …, XNord Dans l'ordre croissant, puis le ke la statistique de la commande est affichée comme:

58274capture02-min-7203541

La notation générale du ke la statistique de commande est X(k). Remarque X(k) est différent de Xk. Xk est le ke variable aléatoire de notre ensemble, tandis que X(k) est le ke ordre statistique de notre ensemble. X(k) prend la valeur de Xk oui Xk est le ke Variable aléatoire lorsque les réalisations sont triées par ordre croissant.

Le 1S t statistique d'ordre X(1) est l'ensemble des valeurs minimales de la réalisation de l'ensemble de 'n’ Variables aléatoires. Alorse statistique d'ordre X(Nord) est l'ensemble des valeurs maximales (nième valeurs minimales) de la réalisation de l'ensemble de 'n’ Variables aléatoires. Ils peuvent être exprimés comme:

11926capture03-min-4227227

Distribution des statistiques de commande

Nous allons maintenant essayer de connaître la répartition des statistiques de commande. Nous allons d'abord décrire la distribution des ne statistiques de commande, Puis il 1S t ordre statistique et enfin le ke statistiques générales sur les commandes.

UNE) Répartition de ne Statistiques de commande:

Soit la fonction de densité de probabilité (PDF) et la fonction de distribution cumulative (CDF) nos variables aléatoires laisser fX(X) oui FX(X) respectivement. Par définition de CDF,

82261capture04-min-8907724

Puisque nos variables aléatoires sont distribuées de manière identique, avoir le même PDF fX(X) y CDF FX(X). Nous allons maintenant calculer la CDF de ne statistiques de commande (FNord(X)) comme suit:

91898capture05-min-1932533

Variables aléatoires X1, X2, …, XNord ils sont aussi indépendants. Pourtant, par propriété d'indépendance,

71167capture06-min-7598051

Le PDF du ne ordre statistique (FNord(X)) est calculé comme suit:

82826capture07-min-4983818

Donc, l'expression pour PDF et CDF de ne La statistique de commande a été obtenue.

B) Distribution de 1S t Statistiques de commande:

Le CDF d'une variable aléatoire peut également être calculé comme le un moins la probabilité que la variable aléatoire X prenne une valeur supérieure ou égale à x. Mathématiquement,

47335capture08-min-6746054

Nous déterminerons le CDF de 1S t statistiques de commande (F1(X)) comme suit:

51217capture09-min-4314011

Une fois de plus, en utilisant la propriété d'indépendance des variables aléatoires,

56291capture10-min-6261394

Le PDF du 1S t ordre statistique (F1(X)) est calculé comme suit:

92517capture11-min-5947183

Donc, l'expression pour PDF et CDF de 1S t La statistique de commande a été obtenue.

C) Répartition du ke Statistiques de commande:

Fourchettee statistiques de commande, en général, l'équation suivante décrit votre CDF (Fk(X)):

61621capture12-min-2601707

Le PDF de ke ordre statistique (Fk(X)) est exprimé comme:

63589capture13-min-3525477

Pour éviter les confusions, nous utiliserons des preuves géométriques pour comprendre l'équation. Comme discuté ci-dessus, l'ensemble des variables aléatoires a le même PDF (FX(X)). Le graphique ci-dessous montre un exemple de PDF avec le ke Statistique d'ordre obtenue à partir d'un échantillonnage aléatoire:

58258capture14-min-2854158

Ensuite, le PDF des variables aléatoires fX(X) est défini entre l'intervalle [une,b]. La statistique d'ordre k pour un échantillon aléatoire est indiquée par la ligne rouge. Les autres réalisations variables (pour l'échantillon aléatoire) représenté par les petites lignes noires sur l'axe des x.

Il y a exactement (k – 1) observations de variables aléatoires qui tombent dans la région jaune du graphique (la région entre & ke statistiques de commande). La probabilité qu'une observation particulière tombe dans cette région est donnée par le CDF des variables aléatoires (FX(X)). Mais nous sommes conscients que (k – 1) les observations sont tombées dans la région, ce qui nous donne le terme (pour l'indépendance) (FX(X))(k – 1).

Il y a exactement (m – k) observations de variables aléatoires qui tombent dans la région bleue du graphique (la région entre ke ordre statistique & b). La probabilité qu'une observation particulière tombe dans cette région est donnée par le 1 – CDF des variables aléatoires (1- FX(X)). Mais nous sommes conscients que (m – k) les observations sont tombées dans la région, ce qui nous donne le terme (pour l'indépendance) (1-FX(X))(m – k).

Finalement, exactement 1 l'observation tombe exactement sur la statistique d'ordre k avec une probabilité fX(X). Donc, le produit de 3 termes nous donne une idée de la signification géométrique de l'équation pour PDF de la statistique d'ordre k. Mais, D'où vient le terme factoriel? Le scénario ci-dessus n'a montré qu'une des nombreuses commandes. Il peut y avoir plusieurs de ces combinaisons. Le nombre total de ces combinaisons est indiqué ci-dessous:

56727capture15-min-5188837

Pourtant, le produit de tous ces termes nous donne la distribution générale de ke statistiques de commande.

Fonctions utiles des statistiques de commandes

Les statistiques de commande mènent à plusieurs fonctions utiles. Entre eux, los notables incluyen el rango de la muestra y la médian de la muestra.

1) Gamme d'échantillons: Il est défini comme la différence entre la plus grande et la plus petite valeur. Il s'exprime comme suit:

67901capture16-min-3026387

2) Médiane de l'échantillon: La médiane de l'échantillon divise l'échantillon aléatoire (réalisations de l'ensemble des variables aléatoires) en deux moitiés, l'un contenant les échantillons de valeur la plus faible et l'autre contenant les échantillons de valeur la plus élevée. C'est comme la statistique d'ordre intermédiaire / central. Il est mathématiquement défini comme:

54935capture17-min-7664566

Ensemble de statistiques de commande PDF

Une fonction de densité de probabilité conjointe peut nous aider à mieux comprendre la relation entre deux variables aléatoires (statistiques à deux ordres
dans notre cas). L'ensemble PDF pour toutes les statistiques de 2 X commandes(une) & X(B), tel que 1 ≤ a ≤ b ≤ n est donné par l'équation suivante:

57960capture18-min-9865168

Exemple

Nous allons utiliser un exemple très simple pour illustrer la répartition des statistiques de commandes: la distribution uniforme standard (U[0, 1] Distribution). Nous prendrons 5 variables aléatoires X1, X2, X3, X4, X5, tout le monde a le U[0, 1] Distribution. Pour cet ensemble de variables aléatoires, nous allons calculer et tracer le 1S t, 3rd (la médiane de l'échantillon) Oui 5e (Norde) statistiques de commande. La siguiente chiffre muestra la U[0, 1] Distribution:

14549capture19-min-7605626

Nous allons tirer des échantillons aléatoires comme suit et trouver le 1S t, 3rd & 5e statistique de commande pour chaque échantillon. Vous trouverez ci-dessous deux des échantillons:

84551capture20-min-5655291

La distribution uniforme standard PDF et CDF sont données comme:

40491capture21-min-6236281

Nous utiliserons ces informations et calculerons X(1), X(3) & X(5) en utilisant les formules que nous avons dérivées. Nous ne prendrons le cas que lorsque x est compris entre 0 Oui 1 (pour les autres cas, la statistique de commande est nulle puisque PDF est nul).

UNE) À 1S t statistiques de commande:

88253capture22-min-5826320

Terrain pour f1(X):

97189capture23-min-5582206

B) À 3rd statistiques de commande:

36859capture24-min-6027432

Terrain pour f5(X):

88539capture25-min-1884985

C) À 5e statistiques de commande:

69523capture26-min-4975531

Terrain pour f5(X):

94366capture27-min-6960818

conclusion

Donc, nous avons exploré les concepts de statistiques d'ordre en profondeur. Un large éventail de processus physiques peut être modélisé grâce aux statistiques de commande, exploiter ses propriétés, en particulier leurs distributions.

Les médias présentés dans cet article ne sont pas la propriété de DataPeaker et sont utilisés à la discrétion de l'auteur.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.