Estadísticas de pedidos | ¿Qué son las estadísticas de pedidos?

Contenidos

Introducción

La estadística de pedidos es un concepto muy útil en las ciencias estadísticas. Tienen una amplia gama de aplicaciones que incluyen modelado de subastas, carreras de autos y pólizas de seguros, optimización de procesos de producción, estimación de parámetros de distribuciones, et al. A través de este artículo, entenderemos la idea de las estadísticas de pedidos. Primero entenderemos su significado y gradualmente procederemos a su distribución, cubriendo eventualmente conceptos más avanzados.

Supongamos que tenemos un conjunto de variables aleatorias X1, X2, …, Xnorte, que son independientes e idénticamente distribuidos (iid). Por independencia, queremos decir que el valor tomado por una variable aleatoria no está influenciado por los valores tomados por otras variables aleatorias. Por distribución idéntica, queremos decir que la función de densidad de probabilidad (PDF) (o de manera equivalente, la función de distribución acumulativa, CDF) para las variables aleatorias es la misma. La Kth La estadística de orden para este conjunto de variables aleatorias se define como kth valor más pequeño de la muestra.

Para comprender mejor este concepto, tomaremos 5 variables aleatorias X1, X2, X3, X4, X5. Observaremos una realización / resultado aleatorio de la distribución de cada una de estas variables aleatorias. Supongamos que obtenemos los siguientes valores:

14444capture01-min-8688645

La Kth la estadística de orden para este experimento es la kth valor más pequeño del conjunto {4, 2, 7, 11, 5}. Entonces, el 1S t la estadística de orden es 2 (valor más pequeño), la 2Dakota del Norte la estadística de orden es 4 (la siguiente más pequeña), y así sucesivamente. El 5th el estadístico de orden es el quinto valor más pequeño (el valor más grande), que es 11. Repetimos este proceso muchas veces, es decir, extraemos muestras de la distribución de cada una de estas iid variables aleatorias y encontramos la kth valor más pequeño para cada conjunto de observaciones. La distribución de probabilidad de estos valores da la distribución de kth estadísticas de pedidos.

En general, si ordenamos variables aleatorias X1, X2, …, Xnorte en orden ascendente, entonces la kth la estadística de orden se muestra como:

58274capture02-min-7203541

La notación general de la kth la estadística de orden es X(k). Nota X(k) es diferente de Xk. Xk es la kth variable aleatoria de nuestro conjunto, mientras que X(k) es la kth orden estadística de nuestro conjunto. X(k) toma el valor de Xk si Xk es la kth Variable aleatoria cuando las realizaciones se ordenan en orden ascendente.

El 1S t estadística de orden X(1) es el conjunto de los valores mínimos de la realización del conjunto de ‘n’ variables aleatorias. Luegoth estadística de orden X(norte) es el conjunto de los valores máximos (n-ésimo valores mínimos) de la realización del conjunto de ‘n’ variables aleatorias. Pueden expresarse como:

11926capture03-min-4227227

Distribución de estadísticas de pedidos

Ahora intentaremos averiguar la distribución de las estadísticas de pedidos. Primero describiremos la distribución de la nth estadística de orden, luego el 1S t orden estadística y finalmente la kth estadística de orden en general.

A) Distribución de la nth Estadística de pedidos:

Dejemos que la función de densidad de probabilidad (PDF) y la función de distribución acumulativa (CDF) nuestras variables aleatorias sean fX(x) y FX(x) respectivamente. Por definición de CDF,

82261capture04-min-8907724

Dado que nuestras variables aleatorias se distribuyen de manera idéntica, tienen el mismo PDF fX(x) y CDF FX(X). Ahora calcularemos la CDF de nth estadística de orden (Fnorte(x)) como sigue:

91898capture05-min-1932533

Las variables aleatorias X1, X2, …, Xnorte también son independientes. Por tanto, por propiedad de la independencia,

71167capture06-min-7598051

El PDF de la nth orden estadístico (fnorte(x)) se calcula de la siguiente manera:

82826capture07-min-4983818

Por lo tanto, la expresión para PDF y CDF de nth Se ha obtenido la estadística de orden.

B) Distribución del 1S t Estadística de pedidos:

La CDF de una variable aleatoria también se puede calcular como el uno menos la probabilidad de que la variable aleatoria X tome un valor mayor o igual que x. Matemáticamente,

47335capture08-min-6746054

Determinaremos el CDF de 1S t estadística de orden (F1(x)) como sigue:

51217capture09-min-4314011

Una vez más, utilizando la propiedad de independencia de las variables aleatorias,

56291capture10-min-6261394

El PDF del 1S t orden estadístico (f1(x)) se calcula de la siguiente manera:

92517capture11-min-5947183

Por lo tanto, la expresión para PDF y CDF de 1S t Se ha obtenido la estadística de orden.

C) Distribución de la kth Estadística de pedidos:

Tenedorth estadística de orden, en general, la siguiente ecuación describe su CDF (Fk(X)):

61621capture12-min-2601707

El PDF de kth orden estadístico (fk(x)) se expresa como:

63589capture13-min-3525477

Para evitar confusiones, usaremos pruebas geométricas para entender la ecuación. Como se discutió anteriormente, el conjunto de variables aleatorias tiene el mismo PDF (fX(X)). El siguiente gráfico muestra un PDF de muestra con la kth Estadística de orden obtenida de un muestreo aleatorio:

58258capture14-min-2854158

Entonces, la PDF de las variables aleatorias fX(x) se define entre el intervalo [a,b]. El estadístico de k-ésimo orden para una muestra aleatoria se muestra con la línea roja. Las otras realizaciones variables (para la muestra aleatoria) se muestran mediante las pequeñas líneas negras en el eje x.

Hay exactamente (k – 1) observaciones de variables aleatorias que caen en la región amarilla del gráfico (la región entre a & kth estadística de orden). La probabilidad de que una observación particular caiga en esta región está dada por la CDF de las variables aleatorias (FX(X)). Pero somos conscientes de que (k – 1) observaciones cayeron en la región, lo que nos da el término (por independencia) (FX(X))(k – 1).

Hay exactamente (n – k) observaciones de variables aleatorias que caen en la región azul del gráfico (la región entre kth orden estadística & b). La probabilidad de que una observación particular caiga en esta región viene dada por el 1 – CDF de las variables aleatorias (1– FX(X)). Pero somos conscientes de que (n – k) observaciones cayeron en la región, lo que nos da el término (por independencia) (1-FX(X))(n – k).

Finalmente, exactamente 1 observación cae exactamente en el estadístico de k-ésimo orden con probabilidad fX(X). Por lo tanto, el producto de los 3 términos nos da una idea del significado geométrico de la ecuación para PDF del estadístico de k-ésimo orden. Pero, ¿de dónde viene el término factorial? El escenario anterior solo mostró uno de los muchos ordenamientos. Puede haber muchas de estas combinaciones. El número total de tales combinaciones se muestra a continuación:

56727capture15-min-5188837

Por tanto, el producto de todos estos términos nos da la distribución general de kth estadística de pedidos.

Funciones útiles de las estadísticas de pedidos

Las estadísticas de pedidos dan lugar a varias funciones útiles. Entre ellos, los notables incluyen el rango de la muestra y la mediana de la muestra.

1) Rango de muestra: Se define como la diferencia entre el valor más grande y el más pequeño. Se expresa de la siguiente manera:

67901capture16-min-3026387

2) Mediana de la muestra: La mediana de la muestra divide la muestra aleatoria (realizaciones del conjunto de variables aleatorias) en dos mitades, una que contiene las muestras con valores más bajos y la otra que contiene las muestras con valores más altos. Es como la estadística de orden medio / central. Se define matemáticamente como:

54935capture17-min-7664566

PDF conjunto de estadísticas de pedidos

Una función de densidad de probabilidad conjunta puede ayudarnos a comprender mejor la relación entre dos variables aleatorias (estadísticas de dos órdenes
en nuestro caso). El PDF conjunto para cualquier estadística de 2 órdenes X(a) & X(B), tal que 1 ≤ a ≤ b ≤ n viene dado por la siguiente ecuación:

57960capture18-min-9865168

Ejemplo

Usaremos un ejemplo muy simple para ilustrar la distribución de las estadísticas de orden: la distribución uniforme estándar (U[0, 1] distribución). Tomaremos 5 variables aleatorias X1, X2, X3, X4, X5, todos tienen la U[0, 1] distribución. Para este conjunto de variables aleatorias, calcularemos y trazaremos el 1S t, 3rd (la mediana de la muestra) y 5th (norteth) estadísticas de pedidos. La siguiente figura muestra la U[0, 1] distribución:

14549capture19-min-7605626

Dibujaremos muestras aleatorias de la siguiente manera y encontraremos el 1S t, 3rd & 5th estadística de orden para cada muestra. A continuación se muestran dos de las muestras:

84551capture20-min-5655291

El PDF y CDF de distribución uniforme estándar se dan como:

40491capture21-min-6236281

Usaremos esta información y calcularemos X(1), X(3) & X(5) usando las fórmulas que derivamos. Tomaremos el caso solo cuando x esté entre 0 y 1 (para otros casos, la estadística de orden es cero ya que PDF es cero).

A) Para 1S t estadística de orden:

88253capture22-min-5826320

Trazar para f1(X):

97189capture23-min-5582206

B) Para 3rd estadística de orden:

36859capture24-min-6027432

Trazar para f5(X):

88539capture25-min-1884985

C) Para 5th estadística de orden:

69523capture26-min-4975531

Trazar para f5(X):

94366capture27-min-6960818

Conclusión

Por lo tanto, hemos explorado los conceptos de estadística de pedidos a fondo. Se puede modelar una amplia gama de procesos físicos a través de estadísticas de pedidos, explotando sus propiedades, particularmente sus distribuciones.

Los medios que se muestran en este artículo no son propiedad de DataPeaker y se utilizan a discreción del autor.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.