1. 安装 pytorch,pytorch 是一个 python 优先的深度学习框架。使用 pytorch 可以自动去组合因子成策略。GPU 训练的话只有 N 卡支持,这里选择 cpu 模式就行。https://pytorch.org/ ,torchvision 用来处理图像,torchaudio 处理音频用不到所以不安装。
sudo /home/skka3134/folder/bot/bin/python -m pip install torch
2. 设置数据集,从 Dateset 继承类,形成 TimeSeriesDataset
from torch.utils.data import Dataset
class TimeSeriesDataset(Dataset):
    def __init__(self, X, y):
        self.X = X
        self.y = y
    def __len__(self):
        return len(self.X)
    def __getitem__(self, i):
        return self.X[i], self.y[i]
    
train_dataset = TimeSeriesDataset(X_train, y_train)
test_dataset = TimeSeriesDataset(X_test, y_test)
3. 加载数据集
from torch.utils.data import DataLoader
batch_size = 16    #每批读取数据16个,如果用的是GPU训练,可以调大一点,128?
train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True) #shuffle=True代表打乱数据
test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False) #shuffle=True代表不打乱数据
4. 可视化处理
for _, batch in enumerate(train_loader):
    x_batch, y_batch = batch[0].to(device), batch[1].to(device)
    print(x_batch.shape, y_batch.shape)
    break
