Как получить случайную (загрузочную) выборку из мультииндекса pandas

Я пытаюсь создать загрузочный образец из мультииндексного фрейма данных в Pandas. Ниже приведен код для генерации нужных мне данных.

from itertools import product
import pandas as pd
import numpy as np

df = pd.DataFrame({'group1': [1, 1, 1, 2, 2, 3],
                       'group2': [13, 18, 20, 77, 109, 123],
                       'value1': [1.1, 2, 3, 4, 5, 6],
                       'value2': [7.1, 8, 9, 10, 11, 12]
                       })
df = df.set_index(['group1', 'group2'])

print df

Фрейм данных df выглядит так:

                   value1  value2
group1 group2                
1      13         1.1     7.1
       18         2.0     8.0
       20         3.0     9.0
2      77         4.0    10.0
       109        5.0    11.0
3      123        6.0    12.0

Я хочу получить случайную выборку из первого индекса. Например, допустим, что случайные значения np.random.randint(3,size=3) производят [3,2,2]. Я бы хотел, чтобы результирующий кадр данных выглядел так:

                   value1  value2
group1 group2                
3      123        6.0    12.0
2      77         4.0    10.0
       109        5.0    11.0
2      77         4.0    10.0
       109        5.0    11.0

Я потратил много времени на изучение этого вопроса и не смог найти аналогичный пример, в котором значения мультииндекса являются целыми числами, вторичный индекс имеет переменную длину, а выборки первичного индекса повторяются. Вот как я думаю, будет работать подходящая реализация для начальной загрузки.


person Chris    schedule 02.08.2016    source источник


Ответы (1)


Пытаться:

df.unstack().sample(3, replace=True).stack()

введите здесь описание изображения

person piRSquared    schedule 02.08.2016
comment
Не работает для больших наборов данных: ValueError: Unstacked DataFrame слишком велик, вызывая переполнение int32 - person Amin; 04.03.2021
comment
@Amin Ответ 4,5-летней давности. Спросите новый и упомяните большой набор данных. Запрос на эффективность памяти и процессора - person piRSquared; 04.03.2021