数据统计的理解和应用(八)相关分析
相关分析是常用的统计分析方法,现实中各种事物总会存在或多或少的联系,相关分析就是研究事物或现
初级比一比,中级找关系,高级探究竟。那么第八期我们就来简单介绍一下数据的“关系”。 相关分析是常用的统计分析方法,现实中各种事物总会存在或多或少的联系,相关分析就是研究事物或现象之间联系的方法。相关分析可用于确定各变量之间是否存在关联,如果有关联的话,关联程度有多大。 相关分析所研究的主要是变量间的相互依存关系,即如果其中一个变量有变化,其他变量也随之变化。相关分析中的变量无主次之分,所有变量的地位相同,研究的关联是变量间的相互关联。 1、线性相关简介 定量资料的相关分析主要采用线性相关,线性相关主要研究两个或多个变量之间相互依存的关系,可分为简单相关(simple linear correlation)和偏相关(partial correlation) 简单相关就是直接度量两个变量之间的关联,偏相关是校正其他变量的影响后两个变量之间的相关性。简单相关所提示的两个变量之间的关系往往掺杂了其他因素的影响,而偏相关则去除了其他因素的混杂,显示的是两个变量之间的“纯”相关关系。 常用的线性相关的度量指标有Pearson相关系数和Spearman相关系数。Pearson相关系数主要用于正态分布资料,Spearman相关系数主要用于非正态分布资料或等级资料。 当相关系数为正数时,表示变量之间是正相关;相关系数为负数时,表示变量之间为负相关。相关系数绝对值越大,表示相关性越强;反之相关系数绝对值越小,表示相关性越小。 例:某中心调查了辖区内上班族的体重指数、血压、总胆固醇、空腹血糖等指标,以了解他们的健康状况。现从中随机抽取20人的体重指数和总胆固醇(mmol/L),分析他们的相关性。 目的:研究两个指标之间的相关性。 方法:视资料的分布采用皮尔森相关(Pearson)或秩相关(Spearman)。 1.先检验数据的正态性(可结合正态分布图) 2.相关分析 2.1皮尔森相关(pearson) 2.2秩相关(Spearman) 软件操作 SAS 1、正态性检验 2、结果 2.1 正态性检验结果Bmi和tc均服从正态分布,可采用皮尔森相关(Pearson)进行分析。 2.2相关分析结果皮尔森相关(Pearson)分析结果显示:tc和bmi之间的相关系数为0.718,相关性有统计学意义(P 如若数据不满足正态分布,则进行秩相关(Spearman)分析 软件操作SPSS 分析→相关→双变量→选择bmi和tc默认选择pearson相关应用分析,可以根据资料的分布更换分析方法。 分析结果同SAS:tc和bmi之间的相关系数为0.718,相关性有统计学意义(P 软件操作 R语言 分析结果同SAS:tc和bmi之间的相关系数为0.718,相关性有统计学意义(P 秩相关则改为加入语句(默认为pearson相关) method="spearman" 2.分类资料相关分析 分类资料的相关分析常用的方法是卡方检验(Chi-square χ2)检验和对数线性模型(log linear model)。χ2检验在四格表或RXC列联表资料中,可用列联系数(contingency coefficient)来度量两个变量之间的相关性;在配对资料中,还可采用Kappa一致性检验来分析指标的一致性。详见列联表之卡方检验。 — THE END — (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |