Расчет коэффициента Джини по данным LIS (в Stata)

Мне нужно рассчитать коэффициент Джини на основе данных о располагаемом личном доходе в LIS. Согласно учебному документу LIS, код Stata для этого:

    di "** INCOME DISTRIBUTION II – Exercise 13 **"
    program define bottop
    qui sum ey [w=hweight*d4]
    replace ey = .01*r(mean) if ey<.01*r(mean)
    qui sum dpi [w=hweight*d4], de
    replace ey = (10*r(p50)/(d4^.5)) if dpi>10*r(p50)
    end
    foreach file in $us00h $fi00h {
    display "`file'"
    use hweight d4 dpi if (!mi(dpi) & !(dpi==0)) using "`file'", clear
    gen ey=dpi/(d4^0.5)
    bottop
    ineqdeco ey [w=hweight*d4]
    }

Я просто скопировал и вставил этот код из учебного документа. Фрагменты

    qui sum ey [w=hweight*d4]
    replace ey=0.01*r(mean) if ey<0.01*r(mean)

и

    qui sum dpi [w=hweight*d4], de
    replace ey=(10*r(p50)/(d4^0.5)) if dpi>10*r(p50)

соответственно нижнее и верхнее кодирование.

Когда я попытался запустить этот код, переменная hweight не была найдена. Кто-нибудь знает, какое новое имя hweight в LIS? Или может кто-нибудь предложить, как я мог бы иначе преодолеть этот тупик?

Я знаком со stata, но сложность этого кода мне непонятна.

Очень признателен.


person ben    schedule 23.01.2013    source источник
comment
спросите это на statalist. Если повезет, Стивен Дженкинс, один из авторов основного ineqdeco, сможет ответить. Вы должны RTFM изучить документацию, чтобы узнать, что такое переменные. hweight, вероятно, вес домохозяйства. Однако я не понимаю, почему вы хотите испортить хорошие данные кодированием сверху и снизу. Странное упражнение, в общем.   -  person StasK    schedule 23.01.2013
comment
Что такое LIS?   -  person whuber    schedule 23.01.2013
comment
@whuber Люксембургское исследование доходов   -  person ben    schedule 24.01.2013


Ответы (3)


Это скорее второе лучшее решение. Однако перепись населения дает доход в скобках. Если вы готовы это сделать, вы можете получить подсчет для каждой скобки. Имейте верхнюю закодированную скобку для последнего. Используйте среднее значение дохода в каждой скобке. Затем вы можете напрямую применить формулу для коэффициента Джини. Это второе лучшее, потому что это приближение для данных на индивидуальном уровне.

person user1690130    schedule 08.02.2013

На основе списка определений переменных на страница документации LIS, похоже, переменная теперь называется HWGT

person Kyle Heuton    schedule 04.02.2013

Почему бы вам не попробовать команду fastgini:

http://www.stata.com/statalist/archive/2007-02/msg00524.html

ssc install fastgini
fastgini income
return list

это должно дать вам Джини для переменного дохода.

Этот пакет также позволяет использовать вес. Тип

help fastgini

за дополнительной информацией

person Daniel    schedule 13.08.2014