比如,一项多国家研究,某个指标(bscore)在一些国家没有测量,在这些国家均为缺失值;其他变量所有国家都测量了,但是部分个体也有缺失值。如何删掉没有测量国家的该变量的数据?
第一步,先查看该分类变量的分布情况:
tab Country bscore,missing
结果如下,可以看出阿尔巴尼亚共和国(Albania)和阿尔及利亚民主人民共和国(Algeria)这两个国家的bscore变量值全部缺失:
第二步:利用max()函数生成指示变量maxscore:
egen maxscore = max(bscore), by(Country) tab Country bscore if maxscore < ., m drop if maxscore ==.
说明:max()函数为系统函数,返回最大值;如果均未缺失值,则返回缺失值。如max(2,11,.,7) = 11,max(.,.,.) = .。