Regresión logística en Python: una introducción

La regresión logística es un método estadístico para clasificar objetos. Este capítulo dará una introducción a la regresión logística con algunos ejemplos.

Clasificación

Para comprender la regresión logística, debe saber qué significa clasificación. Veamos los siguientes ejemplos para entenderlo mejor:

  • El m√©dico clasifica el tumor como maligno o benigno.
  • La transacci√≥n bancaria puede ser fraudulenta o genuina.

Durante muchos a√Īos, las personas han realizado este tipo de tareas, aunque con tendencia a cometer errores. La pregunta es, ¬Ņpodemos ense√Īar a las m√°quinas a realizar estas tareas con mayor precisi√≥n?

Un ejemplo de una m√°quina de clasificaci√≥n es el correo electr√≥nico. Cliente en su computadora, que clasifica cada correo entrante como ¬ęspam¬Ľ o ¬ęno spam¬Ľ y lo hace con una precisi√≥n bastante alta. El m√©todo de regresi√≥n log√≠stica estad√≠stica se ha aplicado con √©xito en un cliente de correo electr√≥nico. En este caso, entrenamos nuestra m√°quina para resolver el problema de clasificaci√≥n.

La regresión logística es solo una pieza del aprendizaje automático que se utiliza para resolver este tipo de problema de clasificación binaria. Hay varios otros métodos de aprendizaje automático ya desarrollados y utilizados en la práctica para resolver otros tipos de problemas.

Si observa, en todos los ejemplos anteriores, el resultado del predicado tiene solo dos valores: Sí o No. Las llamamos clases, para decir que nuestro clasificador clasifica los objetos en dos clases. Desde un punto de vista técnico, podemos decir que la variable de resultado o variable objetivo es dicotómica.

Hay otros problemas de clasificación en los que la salida se puede dividir en más de dos clases. Por ejemplo, si le dan una canasta llena de frutas, se le pide que las divida en diferentes tipos. Ahora la canasta puede contener naranjas, manzanas, mangos, etc. Entonces, cuando divide las frutas, las divide en más de dos clases. Esta es una tarea de clasificación multivariante.

ūüöę