Regresión logística en Python Рpruebas

Necesitamos probar el clasificador creado anteriormente antes de ponerlo en producción. Si las pruebas muestran que el modelo no cumple con la precisión deseada, tendremos que volver al proceso descrito anteriormente, seleccionar un conjunto diferente de funciones (campos de datos), construir el modelo nuevamente y probarlo. Este será un paso iterativo hasta que el clasificador cumpla con los requisitos de precisión deseados. Así que probemos nuestro clasificador.

Predicción de datos de prueba

Para probar el clasificador, utilizamos datos de prueba generados en una etapa anterior. Llamamos predecir para el objeto creado y pase X una matriz de datos de prueba como se muestra en el siguiente comando:

In [24]: predicted_y = classifier.predict(X_test)

Esto crea una matriz unidimensional para todo el conjunto de datos de entrenamiento dando una predicción para cada fila en la matriz X. Puede examinar esta matriz usando el siguiente comando:

In [25]: predicted_y

A continuación se muestra el resultado de los dos comandos anteriores:

Out[25]: array([0, 0, 0,..., 0, 0, 0])

El resultado muestra que los primeros y √ļltimos tres clientes no son candidatos potenciales para el puesto Dep√≥sito temporal… Puede explorar toda la matriz para ordenar sus clientes potenciales. Para hacer esto, use el siguiente fragmento de c√≥digo de Python:

In [26]: for x in range(len(predicted_y)):
   if (predicted_y[x] == 1):
      print(x, end="t")

El resultado de ejecutar el código anterior se muestra a continuación:

Depósito temporal

El resultado muestra los índices de todas las filas que probablemente sean candidatas para una suscripción TD. Ahora puede pasar este resultado al equipo de marketing del banco, que recopilará la información de contacto de cada cliente en la línea seleccionada y continuará su trabajo.

Antes de poner este modelo en producción, debemos verificar la precisión del pronóstico.

Verificación de precisión

Para comprobar la precisión del modelo, utilice el método de puntuación en el clasificador como se muestra a continuación:

In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))

La salida de pantalla de la ejecución de este comando se muestra a continuación:

Accuracy: 0.90

Muestra que la precisi√≥n de nuestro modelo es del 90%, lo que se considera muy bueno en la mayor√≠a de las aplicaciones. Por lo tanto, no se requiere ninguna configuraci√≥n adicional. Nuestro cliente ahora est√° listo para lanzar la pr√≥xima campa√Īa, obtener una lista de clientes potenciales y perseguirlos para abrir un TD con una probabilidad alta de √©xito.

ūüöę