26. 在对一个有6000个条目式列表的列表进行了多次连续搜索之后,您预计目标值与列表项的平均次数是多少

【练习一】现有一份虚拟数据集列类型分别为string/浮点/整型,请解决如下问题:

(a)请以列类型读入数据并选出C为缺失值的行。

(b)现需要将A中的部分单元转为缺失值單元格中的最小转换概率为25%,且概率大小与所在行B列单元的值成正比

 
 
0

【练习二】 现有一份缺失的数据集,记录了36个人来自的地区、身高、体重、年龄和工资请解决如下问题:

(a)统计各列缺失的比例并选出在后三列中至少有两个非缺失值的行。

(b)请结合身高列和地区列中的数据对体重进行合理插值。

 

b问题要分不同地区对体重按身高进行线性插值

 
 
 
 
 
 

1.对待缺失值可先从整体而后具体至行,列去观察研究

2.對于缺失值较多的数据可直接删除

3.对于可容忍缺失数量的特征可进行线性插值中位数,众数填充等方法

4.注意不同缺失值的变量类型有所鈈同其特性也各不相同,处理时尽量转化成Nullable类型

 

我要回帖

更多关于 条目式列表 的文章

 

随机推荐