Я хочу создать индикаторную переменную same_first_two_nearby. Это указывает на то, что первые два символа наблюдений равны ближайшим наблюдениям. Пытаюсь использовать «метод дублирования», но у меня ничего не получается. Потому что метод может только «удалить» дубликат, но не сохранить.
PROC SORT data=temp NODUPKEY;
BY customer_IN;
RUN;
Пример моих данных следующий.
data temp;
input customer_IN $ 1-8 ;
cards;
ADJOHN.
ADMARY.
ADjerry.
BWABBY.
CFLUCY.
CFLINDA.
EFLAGNA.
KTPAKAO.
KTWANDA.
;
run;
proc print data=temp;run;
Я хочу получить следующие результаты.
customer_IN same_first_two_nearby
ADJOHN. 1
ADMARY. 1
ADjerry. 1
BWABBY. 0
CFLUCY. 1
CFLINDA. 1
EFLAGNA. 0
KTPAKAO. 1
KTWANDA. 1
Заранее спасибо.