Имам рамка за данни с размер N =~ (3Million,79)
, Трябва да направя 1k dataframe от 3,000където всеки от тях е произволно подмножество на описаната по-рано рамка от данни. Освен това, той е без заместване. По този начин получавам съвкупността от данни, но се разделят на случаен принцип в 1k данни.
Отговори:
2 за отговор № 1След като решите колко части n
искате да разделите вашата рамка на данни, която можете просто да направите
import pandas as pd
import numpy as np
dfs = np.array_split(df.sample(frac=1), n)