Я использую value_count и bin, чтобы получить одно представление нашей базы данных.
bin = np.concatenate((np.arange(0,10,1),np.arange(10,100,10),np.arange(100,1000,100)))
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30,
40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700,
800, 900])
Мои образцы данных следующие:
summary_data['STOP_mean']
536826 4.100000
536827 1.500000
536828 2.000000
Name: STOP_mean, Length: 536829, dtype: float64
Однако bin дает следующий результат:
это не тот порядок, что и в результате pandas.
summary_data['STOP_mean'].value_counts(bins = bin)
(-0.001, 1.0] 172259
(1.0, 2.0] 163468
(2.0, 3.0] 57479
(10.0, 20.0] 30479
(3.0, 4.0] 29108
(4.0, 5.0] 18480
почему (10.0,20.0]
появляется сразу после (2.0.3.0]
Уже пробовал reset_index
и sort_index
не работает. (Похоже, это индекс интервала. Как его сбросить?)
sort_index
результат:
<bound method Series.sort_index of (-0.001, 1.0] 172259
(1.0, 2.0] 163468
(2.0, 3.0] 57479
(10.0, 20.0] 30479
(3.0, 4.0] 29108
(4.0, 5.0] 18480
Решено
sort_index(axis=0)
проблема решена