Clasificación


Variables y tipos de problemas


  1. Si la variable dependiente es cualitativa, el tipo de problema es de clasificación.
  2. Si la variable dependiente es cuantitativa, el problema es de regresión.
  3. Si NO hay variable dependientes, el problema es de agrupamiento.

Varianza


Promedio de la diferencia, entre todas las observaciones (n) , respecto de su media.

$var(X)=\sum_{i=1}^{n} \frac{(x_i-\vec{x})^2}{n}$

Covarianza


Es un valor que indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias. No importa su módulo, sino su signo. Es el dato básico para determinar si existe una dependencia entre ambas variables y además es el dato necesario para estimar otros parámetros básicos, como el coeficiente de correlación lineal o la recta de regresión.

Untitled

Desvío estándar


Es una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto de datos numéricos. Se calcula como la raíz de la varianza.