<aside> 💡 Pueden ser de clasificación o regresión.
</aside>
La salida del algoritmo ID3 se representa como un grafo en forma de árbol, cuyos componentes son:

Es una mejora del ID3: soporta variables numéricas/rangos continuos y datos faltantes. Algoritmo de poda.
Valores faltantes: Los marca con “?”. Los valores faltantes de los atributos simplemente no se usan en los cálculos de la ganancia y la entropía (Técnicas para construir árboles de decisión).
Rango continuo-variables numéricas: Se convierten en campos booleanos.
Si un atributo A (ej: temperatura), tiene un rango continuo de valores el algoritmo puede, dinámicamente crear un campo Booleano tal que si A < C Ac = TRUE, sino Ac = FALSE**.**
Vamos a cortar el rango de forma que C ****nos quede con la mayor ganancia de información.
Poda: Pasos:
Entropía de la información:
Es la medida de la impureza o aleatoriedad en los datos**.**
$Entropía = \sum_{i=1}^n{-p_ilog_2p_i}$ donde $p_i$ es la probabilidad de que ocurra cada valor $i.$

En los puntos con y=0 la muestra es totalmente homogénea por lo que la entropía es 0 y en el máximo de la parábola está 50/50 por lo que la entropía es 1.
La entropía nos sirve para calcular la ganancia de información.