Сложенный столбчатый график из фрейма данных в Pandas

Я пытаюсь построить гистограмму с накоплением, где оси x — это имена клиентов, оси y — количество звонков, а столбцы — месяцы.

Я сделал сводную_таблицу, которая выглядит так:

сводная_таблица.head(3)

Out[23]: 
Month                      1   2   3   4   5   6   7   8   9   10  11  12
CompanyName                                                              
Company1   11   3   2   3   5   7   3   6   8   3   5   8
Company2   3   1   2  18   3   4   5   4   5   5   3   2
Company3   2   6   1   3   2   0   5   6   4   8   4   7

Вот код

df = pd.read_csv('MYDATA.csv')
df = df.set_index('recvd_dttm')
df.index = pd.to_datetime(df.index, format='%m/%d/%Y %H:%M')

result = df.groupby([lambda idx: idx.month, 'CompanyName']).agg(len).reset_index()
result.columns = ['Month', 'CompanyName', 'NumberCalls']
pivot_table = result.pivot(index='Month', columns='CompanyName', values='NumberCalls').fillna(0)
s = pivot_table.sum().sort(ascending=False,inplace=False)
pivot_table = pivot_table.ix[:,s.index[:40]]
pivot_table = pivot_table.transpose()



pivot_table = pivot_table.reset_index()
pivot_table['CompanyName'] = [str(x) for x in pivot_table['CompanyName']]
Companies = list(pivot_table['CompanyName'])
months = ["1","2","3","4","5","6","7","8","9","10","11","12"]
pivot_table = pivot_table.set_index('CompanyName')

и для построения я пробовал

ax = pivot_table.plot(kind='bar', title ="Bar chart",figsize=(15,10),legend=True, fontsize=12)
ax.set_xlabel("Company",fontsize=12)
ax.set_ylabel("Number of Calls",fontsize=12)

а также

pivot_table.plot(kind='bar',stacked=True)

и попытался сделать это в боке (красивость важна для этого сюжета) с помощью:

months = OrderedDict(Jan=Jan, Feb=Feb, Mar=Mar, Apr=Apr, 

May=May,Jun=Jun,Jul=Jul,Aug=Aug,Sep=Sep,Oct=Oct,Nov=Nov,Dec=Dec)


# any of the following commented are also alid Bar inputs
#medals = pd.DataFrame(medals)
#medals = list(medals.values())

output_file("stacked_bar.html")

bar = Bar(months, Companies, title="Stacked bars", stacked=True)

show(bar)

И для всех трех методов построения графика продолжает появляться эта ошибка: ValueError: Length mismatch: Expected axis has 27 elements, new values have 3 elements Я просмотрел этот ValueError, но я все еще не понимаю, что здесь происходит.


person jenryb    schedule 07.07.2015    source источник
comment
Не могли бы вы загрузить свою полную версию pivot_table через pivot_table.to_csv() (а затем ссылку на Dropbox)? Просто используйте первые 3 строки в своем сообщении, у меня нет ошибки.   -  person Jianxun Li    schedule 08.07.2015
comment
Я тупой, я только что понял, что читал не тот файл данных, из-за чего это происходило. Извините, @JianxunLi. Ваш комментарий о том, что это работает, помог мне понять, что это была ошибка ввода, а не ошибка кода, так что спасибо!   -  person jenryb    schedule 08.07.2015


Ответы (1)


В моем случае я читал неправильный файл данных.

person jenryb    schedule 07.07.2015