$$\mathbf{\hbox{Estadística Unidimensional}}$$ $$X= \hbox{ Variable estadística },\hbox{ } n=\hbox{ Tamaño muestral}$$ $$x_1, x_2, \cdots x_k, \hbox{ los distintos valores que toma la variable en dicha muestra, donde } x_1 < x_2 < \cdots < x_k$$ $$\mathbf{\hbox{(Frecuencia absoluta) }} n_i= \hbox{ Nº de veces que se repite el valor } x_i \hbox{ } (\Rightarrow \sum_{i=1}^{k} n_i = n)$$ $$\mathbf{\hbox{(Frecuencia relativa) }} f_i= \frac{n_i}{n} \hbox{ } (\Rightarrow \sum_{i=1}^{k} f_i = 1)$$ $$\mathbf{\hbox{(Frecuencia absoluta acumulada) }} N_i = \sum_{j=1}^{i} n_j$$ $$\mathbf{\hbox{(Frecuencia relativa acumulada) }} F_i = \frac{N_i}{n} = \sum_{j=1}^{i} f_j$$ $$\mathbf{\hbox{Datos agrupados en intervalos, n < 50 }} \left\{\begin{matrix} R = Valor_{máximo}-Valor_{mínimo} \mathbf{\hbox{ (Rango o recorrido) }}\\ N = \sqrt{n} \mathbf{\hbox{ (Nº intervalos, aproximando a las unidades por defecto) }}\\ a = \frac{R}{N} \mathbf{\hbox{ (Amplitud, aproximando a las unidades por exceso) }}\\ I_i = [l_i,L_i) \mathbf{\hbox{ (Intervalos no solapados que cubren todo el rango de datos) }}\\ L_i=l_i + a \mathbf{\hbox{ (Extremo superior del intervalo) }}\\ l_1= Valor_{mínimo} - \left( \frac{a \cdot N - R}{2}\right) \mathbf{\hbox{ (Extremo inferior del primer intervalo) }}\\ x_i = \frac{l_i+L_i}{2} \mathbf{\hbox{ (Marca de clase) }} \\ \end{matrix}\right.$$ $$\mathbf{\hbox{Datos agrupados en intervalos, n }} \geq \mathbf{\hbox{ 50 }} \left\{\begin{matrix} R = Valor_{máximo}-Valor_{mínimo} \mathbf{\hbox{ (Rango o recorrido) }}\\ p = 1 + 3.332 \cdot log (n) \mathbf{\hbox{ (aproximando a las unidades por defecto) }}\\ N=\left\{\begin{matrix} p & si & \hbox{p es impar}\\ p+1 & si & \hbox{p es par}\\ \end{matrix}\right. \mathbf{\hbox{ (Nº intervalos. Fórmula de Sturges) }}\\ a = \frac{R}{N} \mathbf{\hbox{ (Amplitud, aproximando a las unidades por exceso) }}\\ I_i = [l_i,L_i) \mathbf{\hbox{ (Intervalos no solapados que cubren todo el rango de datos) }}\\ L_i=l_i + a \mathbf{\hbox{ (Extremo superior del intervalo) }}\\ l_1= Valor_{mínimo} - \left( \frac{a \cdot N - R}{2}\right) \mathbf{\hbox{ (Extremo inferior del primer intervalo) }}\\ x_i = \frac{l_i+L_i}{2} \mathbf{\hbox{ (Marca de clase) }} \\ \end{matrix}\right.$$ $$\mathbf{\hbox{Representación gráfica }} \left\{\begin{matrix} \mathbf{\hbox{Variables cuantitativas discretas y cualitativas }} & \longrightarrow & \left\{\begin{matrix} \mathbf{\hbox{ Diagrama de barras }} & \mathbf{\hbox{ (polígono de frecuencias) }}\\ \mathbf{\hbox{ Diagrama de sectores }} & \\ \end{matrix}\right.\\ \mathbf{\hbox{Variables cuantitativas continuas}} & \longrightarrow & \begin{matrix} \mathbf{\hbox{Histogramas}} & \mathbf{\hbox{ (polígono de frecuencias) }}\\ \end{matrix}\\ \end{matrix}\right.$$ $$\mathbf{\hbox{Medidas de centralización }} \left\{\begin{matrix} \mathbf{\hbox{ (Media) }} & \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} = \frac{\sum_{i=1}^{k} x_i \cdot n_i}{n}\\ \mathbf{\hbox{ (Moda) }} & \left\{\begin{matrix} \mathbf{\hbox{ Datos no agrupados }} \left.\begin{matrix} Mo = x_i, \hbox{ dato con mayor frecuencia absoluta } n_i\\ \end{matrix}\right.\\ \mathbf{\hbox{ Datos agrupados }} \left\{\begin{matrix} \mathbf{\hbox{ (Intervalo modal) }} I_i=[l_i,L_i), \hbox{ con mayor frecuencia absoluta } n_i\\ Mo = l_i+\frac{n_i-n_{i-1}}{2n_i-n_{i-1}-n_{i+1}}(L_i - l_i)\\ \end{matrix}\right.\\ \end{matrix}\right.\\ \mathbf{\hbox{ (Mediana) }} & \left\{\begin{matrix} Me = \hbox{ Valor que deja por debajo el 50% de los datos}\\ \mathbf{\hbox{ Datos no agrupados }} Me = \left\{\begin{matrix} \frac{x_i+x_{i+1}}{2} & si & N_{i-1} < \frac{n}{2} = N_{i}\\ x_{i} & si & \frac{n}{2} < N_{i}\\ \end{matrix}\right.\\ \mathbf{\hbox{ Datos agrupados }} \left\{\begin{matrix} \mathbf{\hbox{ (Intervalo mediano) }} I_i=[l_i,L_i) & si & N_{i-1} < \frac{n}{2} \leq N_{i}\\ Me = l_i+\frac{\frac{n}{2}-N_{i-1}}{n_i}(L_i - l_i) & & \\ \end{matrix}\right.\\ \end{matrix}\right. \end{matrix}\right.$$ $$\mathbf{\hbox{Medidas de posición }} \left\{\begin{matrix} \mathbf{\hbox{ (Cuantil) }} & \hbox{Valor que deja por debajo el } \frac{100 \cdot r}{k} \hbox{% de los datos, } r=1,\cdots,k-1\\ \mathbf{\hbox{ (Cuartil) }} k=4,r=1,2,3 & \left\{\begin{matrix} \mathbf{\hbox{ Datos no agrupados }} Q_r = \left\{\begin{matrix} \frac{x_i+x_{i+1}}{2} & si & N_{i-1} < \frac{r \cdot n}{4} = N_{i}\\ x_{i} & si & \frac{r \cdot n}{4} < N_{i}\\ \end{matrix}\right.\\ \mathbf{\hbox{ Datos agrupados }} \left\{\begin{matrix} \mathbf{\hbox{ (Intervalo del cuartil) }} I_i=[l_i,L_i) & si & N_{i-1} < \frac{r \cdot n}{4} \leq N_{i}\\ Q_r = l_i+\frac{\frac{r \cdot n}{4}-N_{i-1}}{n_i}(L_i - l_i) & & \\ \end{matrix}\right.\\ \end{matrix}\right.\\ \mathbf{\hbox{ (Decil) }} k=10, r=1,\cdots,9 & \left\{\begin{matrix} \mathbf{\hbox{ Datos no agrupados }} D_r = \left\{\begin{matrix} \frac{x_i+x_{i+1}}{2} & si & N_{i-1} < \frac{r \cdot n}{10} = N_{i}\\ x_{i} & si & \frac{r \cdot n}{10} < N_{i}\\ \end{matrix}\right.\\ \mathbf{\hbox{ Datos agrupados }} \left\{\begin{matrix} \mathbf{\hbox{ (Intervalo del decil) }} I_i=[l_i,L_i) & si & N_{i-1} < \frac{r \cdot n}{10} \leq N_{i}\\ D_r = l_i+\frac{\frac{r \cdot n}{10}-N_{i-1}}{n_i}(L_i - l_i) & & \\ \end{matrix}\right.\\ \end{matrix}\right.\\ \mathbf{\hbox{ (Centil) }} k=100, r=1,\cdots,99 & \left\{\begin{matrix} \mathbf{\hbox{ Datos no agrupados }} P_r = \left\{\begin{matrix} \frac{x_i+x_{i+1}}{2} & si & N_{i-1} < \frac{r \cdot n}{100} = N_{i}\\ x_{i} & si & \frac{r \cdot n}{100} < N_{i}\\ \end{matrix}\right.\\ \mathbf{\hbox{ Datos agrupados }} \left\{\begin{matrix} \mathbf{\hbox{ (Intervalo del centil) }} I_i=[l_i,L_i) & si & N_{i-1} < \frac{r \cdot n}{100} \leq N_{i}\\ P_r = l_i+\frac{\frac{r \cdot n}{100}-N_{i-1}}{n_i}(L_i - l_i) & & \\ \end{matrix}\right.\\ \end{matrix}\right.\\ \end{matrix}\right.$$ $$\mathbf{\hbox{Medidas de dispersión }} \left\{\begin{matrix} \mathbf{\hbox{ (Rango o recorrido) }} & R = Valor_{máximo} - Valor_{mínimo}\\ \mathbf{\hbox{ (Rango intercuartílico) }} & RIC = Q_3 - Q_1\\ \mathbf{\hbox{ (Desviación media) }} & D_m = \frac{\sum_{i=1}^{k} |x_i - \bar{x}| \cdot n_i}{n}\\ \mathbf{\hbox{ (Varianza) }} & V = \sigma^{2} = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n} = \frac{\sum_{i=1}^{k} x_i^2 \cdot n_i}{n} - \bar{x}^2\\ \mathbf{\hbox{ (Desviación típica) }} & \sigma = \sqrt{V}\\ \mathbf{\hbox{ (Coeficiente de variación de Pearson) }} & CV = \frac{\sigma}{|\bar{x}|} \cdot 100 \mathbf{\hbox{ (%) }}\\ \end{matrix}\right.$$
$$\mathbf{\hbox{Diagrama de Cajas y bigotes}}$$