La estadística se ocupa de los métodos científicos que se utilizan para: recolectar, organizar, resumir, presentar y analizar datos para obtener conclusiones válidas y tomar decisiones en base a ellas.
Población y Muestra:
Población: es un grupo de personas u objetos el cual puede ser finito o infinito. También se lo conoce como universo.
Muestra: es una pequeña parte de la población que es toma para su estudio y está dada por N.
Muestreo Aleatorio:
El muestreo aleatorio es un método que se emplea para seleccionar una muestra de n objetos de una población, en el que cada miembro de la población es seleccionado estrictamente al azar. Cada miembro de la población tiene la misma probabilidad de ser seleccionado.
Estadística descriptiva: está formada por los métodos gráficos y numéricos utilizados para resumir, procesar los datos y transformarlos en información.
Estadística inferencial: constituye la base para hacer predicciones, previsiones y estimaciones que se utilizan para transformar la información en conocimiento.
Variables numéricas o cuantitativas:
Discreta: puede tener un número finito de valores y usualmente proviene de la acción de contar
Continua: puede tomar cualquier valor de un intervalo dado de números reales y generalmente viene de la acción de medir.
Variables cualitativas:
Nominales: no tienen un orden específico.
Ordinales: siguen un orden estricto.
Las medidas de posición nos indican dónde se posicionan los promedios de una población o muestra.
Las principales medidas de posición son: media, mediana, moda, cuartiles, quintiles, deciles y percentiles. Las tres primeras se denominan medidas de tendencia central, ya que suelen ubicarse hacia el centro de la distribución.
Las Medidas de Variabilidad
Son parámetros que indican la dispersión de los datos o de los valores de la variable.
La dispersión se refiere al grado en la que un dato se aleja o acerca a la media aritmética.
Las principales medidas son: varianza, rango, rango intercuartil, desviación estándar y coeficiente de variabilidad relativa. La varianza es la única que no tiene interpretación.
Varianza: V(x):1/n∗Σ2−µ2
Rango: es la diferencia entre el número menor y mayor de un conjunto.Xmaˊx−Xmin
Rango intercuartil: diferencia entre el primero y tercer cuartil
Desviación estándar: es la variación o dispersión en la que los puntos de datos individuales difieren de la media √σ
Coeficiente de variabilidad relativa: proporción de variabilidad respecto a la media σ/μ
Conteo de puntos muestrales:
Si una operación puede realizarse de n1 maneras y por cada una de ellas una segunda operación puede realizarse de n2 maneras, entonces el número total de formas de realizar la operación es: N = n1*n2
2. Si una operación puede realizarse de n1 formas, y para cada una de ellas puede hacerse una segunda operación, para la cual puede realizarse una tercera operación en n3 formas, así hasta una k-ésima operación, entonces el número total de formas es: N=n1*n2*n3... k
3. El número de permutaciones de n distintos objetos es n! Donde n!
n! = n*(n-1)*(n-2)...*1
4. El número de permutaciones de n distintos objetos tomando r es:
nPr = n!/(n-r)!
5. El número de permutaciones de n objetos tomados en círculo es:
(n-1)!
6. El número de permutaciones n objetos donde n1 son de un tipo, n2 de otro tipo y nk de un késimo tipo:
n!/(n1!n2!nk!)
7. El número de formas de partir un conjunto de n objetos en r celdas con nq elementos en la primera celda, n2 en la segunda, está dada por:
(n/n1, n2... nk) = n!/n1!, n2!, nk!
8. El número de combinaciones de n objetos tomando r cada vez es:
(n/r) = n!/r! (n-r)!
Espacio muestral S: es el conjunto de todos los resultados posibles de un experimento estadístico.
Evento A: es un subconjunto del espacio muestral.
Definición axiomática (kolmogorov)
La probabilidad de un evento A es igual a la suma de los pesos de todos los puntos muestrales de A: 0 < P(A)<1, P(0)=0 y P(S)=1
Definición frecuencialista o a posteriori:
Esta definición nos dice que se debe por ejemplo: lanzar muchas veces un dado para observar en qué proporción caen los resultados antes de asignar las probabilidades. Estima probabilidades en base a estudios a lo largo del tiempo: P(A) = f/n
Definición de Laplace o de a priori:
Si un experimento puede tener N resultados diferentes igualmente factibles y si exactamente n de estos resultados corresponden al evento A, entonces la probabilidad de este último es:P(A) = n/N
n: número de elementos del evento A
N: número de elementos del espacio muestral S.
Se asume que se conocen todos los resultados y que tienen la misma oportunidad de salir.
Reglas activas: se dan para la unión de dos eventos
Probabilidad condicional: es la probabilidad de que ocurra un evento A dado que ha ocurrido un evento B.
Distribución de probabilidad: el conjunto de pared ordenados (x, f(x)) es una función de probabilidad o distribución de probabilidad de la variable aleatoria discreta x; si para cada resultado posible x:
f(x)>0
suma de f(x) = 1
P(X=x) = f(x)
Variable aleatoria: es una función que asocia un número real a cada elemento del espacio muestral.
Se utiliza una letra mayúscula X para designar una variable aleatoria y su correspondiente minúscula x para uno de sus valores.