introduction
La statistique des commandes est un concept très utile en science statistique. Ils ont un large éventail d'applications, y compris la modélisation d'enchères, courses automobiles et polices d'assurance, optimisation des processus de production, estimación de paramètresLes "paramètres" sont des variables ou des critères qui sont utilisés pour définir, mesurer ou évaluer un phénomène ou un système. Dans divers domaines tels que les statistiques, Informatique et recherche scientifique, Les paramètres sont essentiels à l’établissement de normes et de standards qui guident l’analyse et l’interprétation des données. Leur sélection et leur manipulation correctes sont cruciales pour obtenir des résultats précis et pertinents dans toute étude ou projet.... de distribuciones, et al. A travers cet article, on comprendra l'idée de statistiques de commandes. Nous allons d'abord comprendre sa signification et procéder progressivement à sa diffusion., couvrant éventuellement des concepts plus avancés.
Supposons que nous ayons un ensemble de variables aléatoires X1, X2, …, XNord, indépendantes et distribuées de manière identique (iid). Pour l'indépendance, queremos decir que el valor tomado por una variableEn statistique et en mathématiques, ongle "variable" est un symbole qui représente une valeur qui peut changer ou varier. Il existe différents types de variables, et qualitatif, qui décrivent des caractéristiques non numériques, et quantitatif, représentation de grandeurs numériques. Les variables sont fondamentales dans les expériences et les études, puisqu’ils permettent l’analyse des relations et des modèles entre différents éléments, faciliter la compréhension de phénomènes complexes.... aleatoria no está influenciado por los valores tomados por otras variables aleatorias. Par répartition identique, nous voulons dire que la fonction de densité de probabilité (PDF) (ou équivalent, la fonction de distribution cumulative, CDF) pour les variables aléatoires c'est pareil. Le Ke La statistique d'ordre pour cet ensemble de variables aléatoires est définie comme ke plus petite valeur d'échantillon.
Pour mieux comprendre ce concept, nous prendrons 5 variables aléatoires X1, X2, X3, X4, X5. On observera une réalisation / résultat aléatoire de la distribution de chacune de ces variables aléatoires. Supposons que nous obtenions les valeurs suivantes:
Le Ke la statistique d'ordre pour cette expérience est ke plus petite valeur de l'ensemble {4, 2, 7, 11, 5}. Ensuite, les 1S t la statistique de commande est 2 (plus petite valeur), la 2Dakota du nord la statistique de commande est 4 (le plus petit suivant), et ainsi de suite. Le 5e la statistique d'ordre est la cinquième plus petite valeur (la plus grande valeur), Qu'est que c'est 11. Nous répétons ce processus plusieurs fois, c'est-à-dire, nous extrayons des échantillons de la distribution de chacune de ces variables aléatoires iid et trouvons le ke plus petite valeur pour chaque ensemble d'observations. La distribution de probabilité de ces valeurs donne la distribution de ke statistiques de commande.
En général, si on commande des variables aléatoires X1, X2, …, XNord Dans l'ordre croissant, puis le ke la statistique de la commande est affichée comme:
La notation générale du ke la statistique de commande est X(k). Remarque X(k) est différent de Xk. Xk est le ke variable aléatoire de notre ensemble, tandis que X(k) est le ke ordre statistique de notre ensemble. X(k) prend la valeur de Xk oui Xk est le ke Variable aléatoire lorsque les réalisations sont triées par ordre croissant.
Le 1S t statistique d'ordre X(1) est l'ensemble des valeurs minimales de la réalisation de l'ensemble de 'n’ Variables aléatoires. Alorse statistique d'ordre X(Nord) est l'ensemble des valeurs maximales (nième valeurs minimales) de la réalisation de l'ensemble de 'n’ Variables aléatoires. Ils peuvent être exprimés comme:
Distribution des statistiques de commande
Nous allons maintenant essayer de connaître la répartition des statistiques de commande. Nous allons d'abord décrire la distribution des ne statistiques de commande, Puis il 1S t ordre statistique et enfin le ke statistiques générales sur les commandes.
UNE) Répartition de ne Statistiques de commande:
Soit la fonction de densité de probabilité (PDF) et la fonction de distribution cumulative (CDF) nos variables aléatoires laisser fX(X) oui FX(X) respectivement. Par définition de CDF,
Puisque nos variables aléatoires sont distribuées de manière identique, avoir le même PDF fX(X) y CDF FX(X). Nous allons maintenant calculer la CDF de ne statistiques de commande (FNord(X)) comme suit:
Variables aléatoires X1, X2, …, XNord ils sont aussi indépendants. Pourtant, par propriété d'indépendance,
Le PDF du ne ordre statistique (FNord(X)) est calculé comme suit:
Donc, l'expression pour PDF et CDF de ne La statistique de commande a été obtenue.
B) Distribution de 1S t Statistiques de commande:
Le CDF d'une variable aléatoire peut également être calculé comme le un moins la probabilité que la variable aléatoire X prenne une valeur supérieure ou égale à x. Mathématiquement,
Nous déterminerons le CDF de 1S t statistiques de commande (F1(X)) comme suit:
Une fois de plus, en utilisant la propriété d'indépendance des variables aléatoires,
Le PDF du 1S t ordre statistique (F1(X)) est calculé comme suit:
Donc, l'expression pour PDF et CDF de 1S t La statistique de commande a été obtenue.
C) Répartition du ke Statistiques de commande:
Fourchettee statistiques de commande, en général, l'équation suivante décrit votre CDF (Fk(X)):
Le PDF de ke ordre statistique (Fk(X)) est exprimé comme:
Pour éviter les confusions, nous utiliserons des preuves géométriques pour comprendre l'équation. Comme discuté ci-dessus, l'ensemble des variables aléatoires a le même PDF (FX(X)). Le graphique ci-dessous montre un exemple de PDF avec le ke Statistique d'ordre obtenue à partir d'un échantillonnage aléatoire:
Ensuite, le PDF des variables aléatoires fX(X) est défini entre l'intervalle [une,b]. La statistique d'ordre k pour un échantillon aléatoire est indiquée par la ligne rouge. Les autres réalisations variables (pour l'échantillon aléatoire) représenté par les petites lignes noires sur l'axe des x.
Il y a exactement (k – 1) observations de variables aléatoires qui tombent dans la région jaune du graphique (la région entre & ke statistiques de commande). La probabilité qu'une observation particulière tombe dans cette région est donnée par le CDF des variables aléatoires (FX(X)). Mais nous sommes conscients que (k – 1) les observations sont tombées dans la région, ce qui nous donne le terme (pour l'indépendance) (FX(X))(k – 1).
Il y a exactement (m – k) observations de variables aléatoires qui tombent dans la région bleue du graphique (la région entre ke ordre statistique & b). La probabilité qu'une observation particulière tombe dans cette région est donnée par le 1 – CDF des variables aléatoires (1- FX(X)). Mais nous sommes conscients que (m – k) les observations sont tombées dans la région, ce qui nous donne le terme (pour l'indépendance) (1-FX(X))(m – k).
Finalement, exactement 1 l'observation tombe exactement sur la statistique d'ordre k avec une probabilité fX(X). Donc, le produit de 3 termes nous donne une idée de la signification géométrique de l'équation pour PDF de la statistique d'ordre k. Mais, D'où vient le terme factoriel? Le scénario ci-dessus n'a montré qu'une des nombreuses commandes. Il peut y avoir plusieurs de ces combinaisons. Le nombre total de ces combinaisons est indiqué ci-dessous:
Pourtant, le produit de tous ces termes nous donne la distribution générale de ke statistiques de commande.
Fonctions utiles des statistiques de commandes
Les statistiques de commande mènent à plusieurs fonctions utiles. Entre eux, los notables incluyen el rango de la muestra y la médianLa médiane est une mesure statistique qui représente la valeur centrale d’un ensemble de données ordonnées. Pour le calculer, Les données sont organisées de la plus basse à la plus élevée et le numéro au milieu est identifié. S’il y a un nombre pair d’observations, La moyenne des deux valeurs fondamentales est calculée. Cet indicateur est particulièrement utile dans les distributions asymétriques, puisqu’il n’est pas affecté par les valeurs extrêmes.... de la muestra.
1) Gamme d'échantillons: Il est défini comme la différence entre la plus grande et la plus petite valeur. Il s'exprime comme suit:
2) Médiane de l'échantillon: La médiane de l'échantillon divise l'échantillon aléatoire (réalisations de l'ensemble des variables aléatoires) en deux moitiés, l'un contenant les échantillons de valeur la plus faible et l'autre contenant les échantillons de valeur la plus élevée. C'est comme la statistique d'ordre intermédiaire / central. Il est mathématiquement défini comme:
Ensemble de statistiques de commande PDF
Une fonction de densité de probabilité conjointe peut nous aider à mieux comprendre la relation entre deux variables aléatoires (statistiques à deux ordres
dans notre cas). L'ensemble PDF pour toutes les statistiques de 2 X commandes(une) & X(B), tel que 1 ≤ a ≤ b ≤ n est donné par l'équation suivante:
Exemple
Nous allons utiliser un exemple très simple pour illustrer la répartition des statistiques de commandes: la distribution uniforme standard (U[0, 1] Distribution). Nous prendrons 5 variables aléatoires X1, X2, X3, X4, X5, tout le monde a le U[0, 1] Distribution. Pour cet ensemble de variables aléatoires, nous allons calculer et tracer le 1S t, 3rd (la médiane de l'échantillon) Oui 5e (Norde) statistiques de commande. La siguiente chiffre"Chiffre" est un terme utilisé dans divers contextes, De l’art à l’anatomie. Dans le domaine artistique, fait référence à la représentation de formes humaines ou animales dans des sculptures et des peintures. En anatomie, désigne la forme et la structure du corps. En outre, en mathématiques, "chiffre" Il est lié aux formes géométriques. Sa polyvalence en fait un concept fondamental dans de multiples disciplines.... muestra la U[0, 1] Distribution:
Nous allons tirer des échantillons aléatoires comme suit et trouver le 1S t, 3rd & 5e statistique de commande pour chaque échantillon. Vous trouverez ci-dessous deux des échantillons:
La distribution uniforme standard PDF et CDF sont données comme:
Nous utiliserons ces informations et calculerons X(1), X(3) & X(5) en utilisant les formules que nous avons dérivées. Nous ne prendrons le cas que lorsque x est compris entre 0 Oui 1 (pour les autres cas, la statistique de commande est nulle puisque PDF est nul).
UNE) À 1S t statistiques de commande:
Terrain pour f1(X):
B) À 3rd statistiques de commande:
Terrain pour f5(X):
C) À 5e statistiques de commande:
Terrain pour f5(X):
conclusion
Donc, nous avons exploré les concepts de statistiques d'ordre en profondeur. Un large éventail de processus physiques peut être modélisé grâce aux statistiques de commande, exploiter ses propriétés, en particulier leurs distributions.
Les médias présentés dans cet article ne sont pas la propriété de DataPeaker et sont utilisés à la discrétion de l'auteur.
En rapport
Articles Similaires:
- Statistiques pour la science des données | Comprendre les statistiques
- Statistiques dans Excel | 10 fonctions statistiques dans Microsoft Excel
- Statistiques pour la science des données | Guide du débutant en statistiques pour la science des données
- Tests statistiques | Sélection de fonctionnalités à l'aide de tests statistiques