Los diagramas de caja son una medida de qué tan bien se distribuyen los datos en un conjunto de datos. Divide el conjunto de datos en tres cuartiles. Este gráfico representa el mÃnimo, el máximo, la mediana, el primer cuartil y el tercer cuartil del conjunto de datos. También es útil al comparar la distribución de datos entre conjuntos de datos dibujando diagramas de caja para cada uno.
Boxplot se puede dibujar usando llamadas Series.box.plot () y DataFrame.box.plot () o DataFrame.boxplot () para visualizar la distribución de valores en cada columna.
Por ejemplo, aquà hay un diagrama que representa cinco ensayos de 10 observaciones de una variable aleatoria homogénea en[01)[01)[01)[01)
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E']) df.plot.box(grid='True')
Su Salida como sigue –
🚫