调查问卷中缺失值如何处理

调查问卷中缺失值如何处理

问:问卷的缺失值如何用word处理
  1. 答:问卷的缺失槐源值一般在word的excel里面替换。
    首先,我们需要找到缺失值,在的时候铅告态把缺失值当成0,然后在excel中替换0为空值。替友态换完成,把excel中的数据复制到spss中,excel的空值就是spss的缺失值。
    也可考虑在SPSS中替换,点击转换——替换缺失值。
问:处理缺失值的四种方法
  1. 答:处理缺失值的四种方法如下:
    1、简单删除法适合于缺失值样本比较少的情况下,如果有过多的缺失值,则不适合使用该方法,因为该方法是用减少历史数据的方法来换取数据的,这样会造成资源的极大浪费,因为其丢弃了大量隐藏在这些对象上的信息,在样本数量本来就很少的中删除少量对象将严重影响数据集的客观性和漏消结果的正确性。
    2、数据补齐,主要有特殊值填充、热卡填充、K-means填充,使用所有可能的值填充、组合完整化方法,回归法,最大化方法,多重填补以及C4.5方法。
    3、人工填写,用户自己对数据最为了解,因此这个方法产生的偏差是最小的,但是如果有大规模的缺失值时,这个方法是非常耗时耗力的。
    4、填充,如果是数值型特征,则是使用平均值来填充,如乎拦果是类别型特征,则是使用来填充,另一种相似的方法是条件平均值填充,这个并不是直接使用所有对象来计算平均值或者众数,而是使用与该样本具有相同决策属性的对象中去求解平均值或者众岁搜胡数。
问:spss问卷分析中的缺失值如何处理
  1. 答:缺失值(missing data)大致上可分为三种型态,MNAR (missing not at random)指缺失值不是随机的,有可能是问卷的设计,比如说,年收入大于十万请回答A题,小于十万请回答B题,这类的缺失是设计上的,不能称作随机缺失.另一种叫MAR(missing at random),指缺失和前面的回答有某些程度的相关,这类的缺失很难界定或测试,第三种叫MCAR(pletely at random),这种就是称作随机的缺失,这种缺失和其它的数据完全是独立答姿的.第三种缺失相对的比较容易茄并处理.如果样本够大的话,把有缺失的样本完全去除,这种方法叫作listwise deletion.如果能够确信样本的缺失值是MCAR,你又没有足够的样本的话,可用填补的方法(imputation).通常可填上平均值,或者回颤举迹归的预测值,这两种方法都有它的缺点.SPSS有个MISSING DATA MODULE,就是用EM(expectation and maximization)的填补,它的方法是把有同样缺失的样本放在同一组,计算它的covariance matrix,然後再跟据每组的样本数来较正它对整个样本的权重(weight),从这里再重新填补每个缺失值.这重方法算是现在比较精确的缺失值填补的方法.
调查问卷中缺失值如何处理
下载Doc文档

猜你喜欢