Pandas es una biblioteca de Python de código abierto que se utiliza para el procesamiento y análisis de datos de alto rendimiento utilizando sus poderosas estructuras de datos. Python con pandas se utiliza en una variedad de campos académicos y comerciales, que incluyen finanzas, economÃa, estadÃsticas, publicidad, análisis web y más. Con Pandas, podemos seguir cinco pasos tÃpicos en el procesamiento y análisis de datos, independientemente de su origen: cargar, organizar, administrar, modelar y analizar los datos.
A continuación se muestran algunas de las caracterÃsticas importantes de Pandas que se utilizan especÃficamente para la manipulación y el análisis de datos.
Pandas se ocupa de las siguientes tres estructuras de datos:
Estas estructuras de datos se construyen sobre una matriz Numpy, lo que las hace rápidas y eficientes.
La mejor manera de pensar en estas estructuras de datos es que la estructura de datos de dimensiones superiores es el contenedor de su estructura de datos de dimensiones inferiores. Por ejemplo, DataFrame es un contenedor de Series, Panel es un contenedor de DataFrame.
Estructura de datos | Dimensiones (editar) | Descripción |
---|---|---|
Serie | uno | Matriz homogénea, etiquetada como 1D, de tamaño inmutable. |
Marcos de datos | 2 | Una estructura de tabla etiquetada genérica, redimensionable y bidimensional con columnas potencialmente heterogéneas. |
DataFrame se usa ampliamente y es la estructura de datos más importante.
Una serie es una matriz unidimensional, similar a una estructura con datos homogéneos. Por ejemplo, la siguiente serie es una colección de números enteros 10, 23, 56,…
diez | 23 | 56 | 17 | 52 | 61 años | 73 | 90 | 26 | 72 |
DataFrame es una matriz bidimensional con datos heterogéneos. Por ejemplo,
Nombre | Edad | Suelo | Clasificación |
---|---|---|---|
Steve | 32 | Masculino | 3,45 |
Leah | 28 años | mujer | 4.6 |
Vin | 45 | Masculino | 3.9 |
Katie | 38 | mujer | 2,78 |
La tabla muestra los datos de la fuerza de ventas de la organización con su calificación de desempeño general. Los datos se presentan en filas y columnas. Cada columna representa un atributo y cada fila representa a una persona.
Los tipos de datos de las cuatro columnas son los siguientes:
Columna | Un tipo |
---|---|
Nombre | Un hilo |
Edad | Entero |
Suelo | Un hilo |
Clasificación | Nadar |
En los siguientes capÃtulos, veremos muchos ejemplos del uso de la biblioteca Python de pandas con datos.
🚫