|
SPSS
Missing
Value Analysis-排除数据中隐含的偏向,得出更精确的结论
|
|
左上:缺失数据会给您带来残缺或错误的分析结果。
右上:其他软件包中简单的代入法,不能正确地填补缺失值。
左下:使用一个相当简单的回归比替换方法好,但是它还是毫无意义的。
右下:很明显,这是最好的模型。SPSS缺失值分析填补了缺失值,给出了随机的散点YMISS和X。
|
| |
赢得新的商机
运用对客户的了解来避免新的投资风险。
提高客户忠诚度
填补缺失数据,测算出识别客户潜在的满意或不满意的模式。
增加交叉销售额
对您的客户可能需要的其他产品或服务做出更好的预测。
防止欺诈行为
把缺失数据纳入考虑范围能够提升您公司防止欺诈的能力。
"缺失值可能会严重影响分析结果。如果把它们忽略,或者假设计算时排除它们就足够了,您可能会得出不正确的结论。SPSS缺失值处理模块为您提供六种缺失值诊断报告,
使您可以从多个角度检查数据,从中找出缺失数据,并透过统计算法插补缺失值。"
快捷地诊断缺失值
用六种灵活的诊断报告来评估缺失值是否会影响分析结论,更好地了解它们的特性。
从数据方式(Data Patterns)报告中您可以快速地诊断数据是否有严重的缺失值问题。这个报告提供了逐一个案的综述,帮您确定缺失值的范围,
并提供每一种缺失值的描述及每一个案的极端值。 应用灵活的分类变量表的单独方差t-检验和交叉表,您可以发现回答者和未回答者之间是否存在显著的差异。这些报告帮您确定缺失值是否会对您的分析造成问题。
这个单独方差t-检验表(Separate Variance t-test table)定义了两组个案:
回答收入组和未答收入组。然后检验这两个组在一个变量系列上是否有差异。 这个表格显示未回答收入的人更有可能是非专业从业人员、女性、已婚以及人口多的家庭。
列表方式(Tabulated Patterns)报告描述每一种缺失值的方式, 并明确标识出哪一组变量构成了这种方式。例如,可以快速地看到100个个案中有98个没有对偏爱的特性和价格这一组变量做出回答。
通过改进调查问卷中可能造成混淆或被某一缺失值方式确定为故障点的问题, 可以提高数据采集的质量。 方式失配百分比(Percent
Mismatch of Patterns)表显示存在缺失值的变量之间的关系,可以明确确定某一变量的缺失值是否与另一变量的缺失值相关。
例如,没有回答收入问题的受访者也没有回答教育水平问题。
得到更精确的摘要统计量
数据的摘要统计量是进行其他分析的起始点,如因子分析、回归或方差分析(ANOVA)。用经过缺失值处理的统计量可以使下一步的分析结果更加可靠。
可以用四种模型来估计均值、相关矩阵或协方差矩阵:列表状态删除(Listwise Deletion),配对状态删除(Pairwise
Deletion),EM(Expectation-maximization,期望最大化)和回归。
方便地用估计值替换缺失值
用您的所有数据,而不是局限于回答完整的个案,来提高得到显著统计结果的可能性。强大的EM或回归算法可以用已有数据预见缺失值。
用估计值替换缺失值可以移除数据中隐藏的偏向,所有的组类,甚至是回答情况极差的组类都可以在分析结果中表现出来,从而得出更精确的结论。
系统需要
 | SPSS
Base |  | 其它的系统需求根据平台的不同而异
| |