PyTorch incluye un paquete llamado torchvision que se usa para descargar y preparar un conjunto de datos. Incluye dos funciones principales, Dataset y DataLoader, que ayudan a transformar y cargar el conjunto de datos.
Un conjunto de datos se utiliza para leer y transformar un punto de datos de un conjunto de datos determinado. La sintaxis básica para la implementación se menciona a continuación:
trainset = torchvision.datasets.CIFAR10(root="./data", train = True, download = True, transform = transform)
DataLoader se utiliza para mezclar y procesar datos por lotes. Se puede utilizar para cargar datos en paralelo con trabajadores multiprocesador.
trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4, shuffle = True, num_workers = 2)
Estamos usando el paquete Python Panda para descargar el archivo csv. El archivo original tiene el siguiente formato: (nombre de la imagen, 68 puntos de referencia; cada punto de referencia tiene coordenadas del eje y).
landmarks_frame = pd.read_csv('faces/face_landmarks.csv') n = 65 img_name = landmarks_frame.iloc[n, 0] landmarks = landmarks_frame.iloc[n, 1:].as_matrix() landmarks = landmarks.astype('float').reshape(-1, 2)
🚫