Plotly – Histograma

Un histograma, presentado por Karl Pearson, es una representación precisa de la distribución de datos numéricos, que es una estimación de la distribución de probabilidad de una variable continua (CORAL). Esto es similar a un histograma, pero un histograma vincula dos variables, mientras que un histograma vincula solo una.

El histograma requiere compartimiento (o Cubeta), que divide todo el rango de valores en una serie de contenedores y luego cuenta cuántos valores se encuentran dentro de cada contenedor. Los contenedores se especifican generalmente como intervalos variables consecutivos que no se superponen. Los contenedores deben ser adyacentes y, a menudo, del mismo tamaño. Se erige un rectángulo sobre la celda con una altura proporcional a la frecuencia, el número de observaciones en cada celda.

Devuelve el objeto de seguimiento de histograma ir.Histograma () función. Su personalización se realiza mediante diversos argumentos o atributos. Uno de los argumentos importantes es establecer xoy en una lista, matriz numpy o Objeto de marco de datos de Pandas que debe distribuirse entre las cajas.

De forma predeterminada, Plotly distribuye puntos de datos en celdas de tamaño automático. Sin embargo, puede definir su propio tamaño de cesta. Para esto, debe establecer autobins en falso, especificar nbins (número de celdas), sus valores y tamaño inicial y final.

El siguiente código genera un gráfico de barras simple que muestra la distribución de las calificaciones de los estudiantes entre los grupos de grados (tamaño automáticamente):

import numpy as np
x1 = np.array([22,87,5,43,56,73,55,54,11,20,51,5,79,31,27])
data = [go.Histogram(x = x1)]
fig = go.Figure(data)
iplot(fig)

El resultado se muestra a continuación:

Histnorm

EN ir.Histograma () la función toma histormque indica el tipo de normalización utilizado para esta curva de histograma. Por defecto, «», el rango de cada banda corresponde al número de ocurrencias (es decir, el número de puntos de datos que se encuentran dentro de los bins). Si es asignado «Porcentaje» / «probabilidad», el rango de cada banda corresponde al porcentaje / proporción de ocurrencias en relación al número total de puntos muestrales. Si es igual «densidad«, el rango de cada banda corresponde al número de ocurrencias en la celda dividido por el tamaño del espaciado de celda.

También hay histfunc parámetro, valor predeterminado pensar… Como resultado, la altura del rectángulo sobre la celda corresponde al número de puntos de datos. Se puede configurar en cantidad, promedio, mínimo o máximo.

EN gráfico de barras () la función se puede configurar para mostrar la distribución acumulativa de valores en celdas consecutivas. Para hacer esto, necesita instalar propiedad colectiva a incluido. El resultado se puede ver a continuación:

data=[go.Histogram(x = x1, cumulative_enabled = True)]
fig = go.Figure(data)
iplot(fig)

Resultado como se indica a continuación:

Co-propiedad

🚫