La prueba de chi-cuadrado es un método estadÃstico para determinar si dos variables categóricas están significativamente correlacionadas entre sÃ. Ambas variables deben pertenecer a la misma población y deben ser categóricas, por ejemplo: Sà / No, Hombre / Mujer, Rojo / Verde, etc. Por ejemplo, podemos construir un conjunto de datos con observaciones de personas que compran helado y probar para hacer coincidir el género de la persona con el sabor del helado que prefieren. Si se encuentra una correlación, podemos planificar un stock adecuado de gustos conociendo el número de personas que nos visitan por género.
Estamos usando varias funciones en la biblioteca numpy para realizar la prueba de chi-cuadrado.
from scipy import stats import numpy as np import matplotlib.pyplot as plt x = np.linspace(0, 10, 100) fig,ax = plt.subplots(1,1) linestyles = [':', '--', '-.', '-'] deg_of_freedom = [1, 4, 7, 6] for df, ls in zip(deg_of_freedom, linestyles): ax.plot(x, stats.chi2.pdf(x, df), linestyle=ls) plt.xlim(0, 10) plt.ylim(0, 0.4) plt.xlabel('Value') plt.ylabel('Frequency') plt.title('Chi-Square Distribution') plt.legend() plt.show()
Su Salida como sigue –
🚫