Python: configuración del entorno de procesamiento de datos

Para compilar y ejecutar con éxito el código de muestra en este tutorial, necesitamos un entorno personalizado que contenga tanto Python genérico como los paquetes personalizados necesarios para la ciencia de datos. Primero veremos la instalación de Python genérico, que puede ser Python 2 o Python 3. Pero preferiremos Python 2 para este tutorial principalmente debido a su madurez y soporte más amplio para paquetes externos.

Obteniendo Python

El código fuente más reciente y actualizado, los binarios, la documentación, las noticias y más están disponibles en el sitio oficial de Python. https://www.python.org/

Puede descargar la documentación de Python desde https://www.python.org/doc/… La documentación está disponible en formatos HTML, PDF y PostScript.

Instalación de Python

La distribución de Python está disponible para una amplia variedad de plataformas. Solo necesita descargar los binarios apropiados para su plataforma e instalar Python.

Si el binario no está disponible para su plataforma, necesitará un compilador de C para compilar el código fuente manualmente. La compilación del código fuente le brinda mucha flexibilidad a la hora de elegir las funciones que necesita para su instalación.

Aquí hay una descripción general rápida de la instalación de Python en varias plataformas:

Instalación de Unix y Linux

Estos son los sencillos pasos para instalar Python en una máquina Unix / Linux.

  • Abra su navegador web y vaya a https://www.python.org/downloads/

  • Siga el enlace para descargar el código fuente comprimido disponible para Unix / Linux.

  • Descarga y descomprime los archivos.

  • Edición Módulos / Personalización archivo si desea modificar algunos parámetros.

  • ejecutar el script./configure

  • hacer

  • hacer la instalación

Esto instala Python en una ubicación estándar. / Usr / local / bin y sus bibliotecas en / usr / local / lib / pythonXX donde XX es la versión de Python.

Instalación de Windows

Estos son los pasos para instalar Python en una máquina con Windows.

  • Abra su navegador web y vaya a https://www.python.org/downloads/

  • Siga el enlace de Windows Installer. python-XYZ.msi archivo, donde XYZ es la versión que se instalará.

  • Para usar este instalador python-XYZ.msi, el sistema Windows debe ser compatible con Microsoft Installer 2.0. Guarde el archivo de instalación en su computadora local y luego ejecútelo para ver si su computadora es compatible con MSI.

  • Ejecute el archivo descargado. Esto abre el asistente de instalación de Python, que es realmente fácil de usar. Simplemente acepte los valores predeterminados, espere a que se complete la instalación y listo.

Instalación de Macintosh

Los Mac recientes vienen con Python instalado, pero pueden estar desactualizados por años. Ver http://www.python.org/download/mac/ para obtener instrucciones sobre cómo obtener la versión actual junto con herramientas adicionales para respaldar el desarrollo de Mac. Para Mac OS anteriores a Mac OS X 10.3 (lanzado en 2003), MacPython está disponible.

Jack Jansen lo mantiene y puede obtener acceso completo a toda la documentación en su sitio web: http://www.cwi.nl/~jack/macpython.html… Puede encontrar información completa sobre la instalación de Mac OS.

Configuración de PATH

Los programas y otros archivos ejecutables se pueden encontrar en muchos directorios, por lo que los sistemas operativos proporcionan una ruta de búsqueda que enumera los directorios en los que el sistema operativo busca archivos ejecutables.

La ruta se almacena en una variable de entorno, que es una cadena con nombre admitida por el sistema operativo. Esta variable contiene información disponible para el shell y otros programas.

EN pista la variable se llama PATH en Unix o Path en Windows (Unix distingue entre mayúsculas y minúsculas; Windows no).

En Mac OS, el instalador procesa la información de la ruta. Para invocar al intérprete de Python desde cualquier directorio específico, debe agregar el directorio de Python a su ruta.

Configuración de ruta en Unix / Linux

Para agregar un directorio de Python a la ruta de una sesión específica en Unix:

  • En csh shell – ingrese setenv PATH «$ PATH: / usr / local / bin / python» y presione Enter.

  • En bash shell (Linux) – ingrese export ATH = «$ PATH: / usr / local / bin / python» y presione Enter.

  • En cáscara sh o ksh – ingrese PATH = «$ PATH: / usr / local / bin / python» y presione Enter.

  • Nota – / usr / local / bin / python es la ruta al directorio de Python

Establecer la ruta en Windows

Para agregar un directorio de Python a la ruta de una sesión específica en Windows:

En la línea de comando – ingrese la ruta% ruta%; C: Python y presione Entrar.

Nota – C: Python es la ruta al directorio de Python

Variables de entorno de Python

Estas son las variables de entorno importantes que Python puede reconocer:

Senior No. Variable y descripción
uno

PYTHONPAT

Su función es similar a PATH. Esta variable le dice al intérprete de Python dónde encontrar los archivos de módulo importados al programa. Debe incluir el directorio de la biblioteca fuente de Python y los directorios que contienen el código fuente de Python. PYTHONPATH a veces lo establece el instalador de Python.

2

PYTHONSTARTUP

Contiene la ruta al archivo de inicialización que contiene el código fuente de Python. Se ejecuta cada vez que se inicia el intérprete. En Unix, se llama.pythonrc.py y contiene comandos que cargan utilidades o modifican PYTHONPATH.

3

PYTHONCASEOK

Se usa en Windows para decirle a Python que busque la primera coincidencia que no distinga entre mayúsculas y minúsculas en una declaración de importación. Establezca esta variable en cualquier valor para activarla.

cuatro

PYTHONHOME

Esta es una forma alternativa de encontrar un módulo. Por lo general, está incrustado en los directorios PYTHONSTARTUP o PYTHONPATH para facilitar el cambio de bibliotecas de módulos.

Ejecutando Python

Hay tres formas diferentes de iniciar Python:

Traductor interactivo

Puede ejecutar Python desde Unix, DOS o cualquier otro sistema que le proporcione un intérprete de línea de comandos o una ventana de shell.

Entrar pitón línea de comando.

Empiece a escribir ahora mismo en el intérprete interactivo.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Aquí hay una lista de todas las opciones de línea de comando disponibles:

Senior No. Opción y descripción
uno

-D

Proporciona salida de depuración.

2

-O

Genera código de bytes optimizado (resultando en archivos.pyo).

3

-S

No ejecute el sitio de importación para buscar rutas de Python al inicio.

cuatro

-v

salida detallada (seguimiento detallado de declaraciones de importación).

cinco

-X

deshabilite las excepciones integradas basadas en clases (solo use cadenas); obsoleto desde la versión 1.6.

6

-c cmd

ejecutar el script de Python enviado como cadena cmd

7

expediente

ejecutar la secuencia de comandos de Python desde el archivo dado

Script de línea de comando

Se puede ejecutar un script de Python desde la línea de comandos invocando un intérprete en su aplicación como se muestra a continuación:

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or 

C: >python script.py # Windows/DOS

Nota – Asegúrese de que el modo de permiso de archivo permita la ejecución.

Entorno de desarrollo integrado

También puede ejecutar Python desde un entorno de interfaz gráfica de usuario (GUI) si tiene una aplicación GUI en su sistema que admita Python.

  • Unix – IDLE es el primer IDE de Unix para Python.

  • Ventana – PythonWin es la primera interfaz de Windows para Python, que es una GUI IDE.

  • Macintosh – La versión de Python para Macintosh junto con IDLE IDE está disponible en el sitio web principal y se puede descargar como archivos MacBinary o BinHex’d.

Instalación de SciPy Pack

La mejor forma de incluir los paquetes necesarios es utilizar un paquete binario instalable específico para su sistema operativo. Estos binarios contienen la pila SciPy completa (incluidos los paquetes NumPy, SciPy, matplotlib, IPython, SymPy y nose junto con el núcleo de Python).

Ventana

Anaconda (de www.continuum.io) es una distribución gratuita de Python para la pila SciPy. También está disponible para Linux y Mac.

Canopy (www.enoughtt.com/products/canopy/) tanto las distribuciones SciPy de pila completa gratuitas como las comerciales están disponibles para Windows, Linux y Mac.

Python (x, y): esta es una distribución gratuita de Python con SciPy stack y Spyder IDE para el sistema operativo Windows. (Puede descargarse de www.python-xy.github.io/)

Linux

Los administradores de paquetes de las respectivas distribuciones de Linux se utilizan para instalar uno o más paquetes en la pila SciPy.

Para Ubuntu

sudo apt-get install python-numpy 
python-scipy python-matplotlibipythonipythonnotebook python-pandas 
python-sympy python-nose

Para Fedora

sudo yum install numpyscipy python-matplotlibipython 
python-pandas sympy python-nose atlas-devel

Construyendo desde la fuente

Core Python (2.6.x, 2.7.xy 3.2.xy posterior) debe instalarse con distutils y el módulo zlib debe estar habilitado.

Debe estar disponible el compilador de C. GNU gcc (4.2 y superior).

Para instalar NumPy, ejecute el siguiente comando.

Python setup.py install

Comprobemos si el módulo NumPy está instalado correctamente, intente importarlo desde la línea de comandos de Python.

Si no está instalado, se mostrará el siguiente mensaje de error.

Traceback (most recent call last): 
   File "<pyshell#0>", line 1, in <module> 
      import numpy 
ImportError: No module named 'numpy'

Asimismo, podemos verificar la instalación de todos los paquetes de Data Science requeridos que se muestran en los siguientes capítulos.

🚫