如果要删除某分类变量低于某个比例的记录,要如何操作?
演示数据如下:
sysuse auto, clear tab rep78,missing
如果要删除分类变量rep78中比例低于40%的记录,Stata代码如下:
bysort rep78 : gen count = _N gen percent = 100 * count / r(N) drop if percent<40
如果要删除分类变量rep78中频数小于30的记录,Stata代码如下:
bysort rep78 : drop if _N < 30