планки погрешностей в пределах гистограммы matplotlib

Я пытаюсь, чтобы полосы ошибок отображались в пределах доверительного интервала, а не в центре.

Я хочу вот что:

введите здесь описание изображения

но я получаю следующее:

введите здесь описание изображения

Для построения гистограммы я использовал это:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(12345)

df = pd.DataFrame([np.random.normal(32000,200000,3650), 
                   np.random.normal(43000,100000,3650), 
                   np.random.normal(43500,140000,3650), 
                   np.random.normal(48000,70000,3650)], 
                  index=[1992,1993,1994,1995])
df1 = df.T
df1.columns = ['1992', '1993','1994','1995']
a = df1.describe()
means = a.loc['mean'].values.tolist()
stdevs = a.loc['std'].values.tolist()
counts = a.loc['count'].values.tolist()
index = np.arange(len(df1.columns))

CI = []
for i in range(len(means)):
    CIval = 1.96*stdevs[i]/(counts[i]**(0.5))
    CI.append(CIval)

#print(means, CI)

plt.figure()
fig, ax = plt.subplots(figsize=(10,10))
ax.set_xticks(index)
ax.set_xticklabels(df1.columns)

plt.bar(index, means, xerr = 0.1, yerr=CI)
plt.tight_layout()
plt.show()

person ZakS    schedule 14.05.2018    source источник


Ответы (1)


Столбики ошибок отображаются, как и ожидалось. Вы установили значение 0,1 для ошибки x, однако на изображении ожидаемого результата нет полосы ошибок x, поэтому мы можем ее удалить. Во-вторых, мы можем увеличить capsize ваших полос ошибок, чтобы они действительно были видны, используя capsize= в вызове plt.bar():

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(12345)

df = pd.DataFrame([np.random.normal(32000,200000,3650),
                   np.random.normal(43000,100000,3650),
                   np.random.normal(43500,140000,3650),
                   np.random.normal(48000,70000,3650)],
                  index=[1992,1993,1994,1995])
df1 = df.T
df1.columns = ['1992', '1993','1994','1995']
a = df1.describe()
means = a.loc['mean'].values.tolist()
stdevs = a.loc['std'].values.tolist()
counts = a.loc['count'].values.tolist()
index = np.arange(len(df1.columns))

CI = []
for i in range(len(means)):
    CIval = 1.96*stdevs[i]/(counts[i]**(0.5))
    CI.append(CIval)

fig, ax = plt.subplots(figsize=(10,10))
ax.set_xticks(index)
ax.set_xticklabels(df1.columns)

plt.bar(index, means, yerr=CI, capsize=10)
plt.tight_layout()
plt.show()

введите здесь описание изображения

person DavidG    schedule 14.05.2018
comment
Спасибо. Если оставить как capsize=, так и xerr=, результаты будут странными! - person ZakS; 14.05.2018