Python – Serie temporal

Una serie de tiempo es una serie de puntos de datos donde cada punto de datos está asociado con una marca de tiempo. Un ejemplo simple es el precio de una acción en el mercado de valores en diferentes momentos en un día en particular. Otro ejemplo es la cantidad de precipitación en la región en diferentes meses del año.

En el siguiente ejemplo, tomamos el valor de los precios de las acciones todos los días durante un trimestre para un símbolo de acciones específico. Capturamos estos valores como un archivo csv y luego los organizamos en un marco de datos usando la biblioteca de pandas. Luego, establecemos el campo de fecha como el índice del marco de datos recreando la columna adicional Valuedate como índice y eliminando la antigua columna Valuedate.

Data de muestra

A continuación se muestran datos aproximados sobre el precio de la acción en diferentes días de un trimestre determinado. Los datos se guardan en un archivo llamado stock.csv.

ValueDate	Price
01-01-2018,	1042.05
02-01-2018,	1033.55
03-01-2018,	1029.7
04-01-2018,	1021.3
05-01-2018,	1015.4
...
...
...
...
23-03-2018,	1161.3
26-03-2018,	1167.6
27-03-2018,	1155.25
28-03-2018,	1154

Creación de series de tiempo

from datetime import datetime
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('path_to_file/stock.csv')
df = pd.DataFrame(data, columns = ['ValueDate', 'Price'])

# Set the Date as Index
df['ValueDate'] = pd.to_datetime(df['ValueDate'])
df.index = df['ValueDate']
del df['ValueDate']


df.plot(figsize=(15, 6))
plt.show()

Su Salida como sigue –

timeseries.png

🚫