统计分析大师STATISTICA/W5.0在医学中的应用 张青 1998年 第23期 15版   统计学,这门渗透于社会和自然科学各个领域的学科,随着电子计算机技术的不断提高,其理论和应用得到了长足发展。基于计算机的大型统计分析软件包,比较流行和著名的当属SPSS(《电脑报》已有专文介绍)、SAS和BMDP。而笔者现在要介绍给大家的是许多人还不太熟悉的STATISTICA/w 5.0其统计分析功能丝毫不亚于SPSS 7.0,其制作统计图形的能力甚至还优于SPSS 7.0。不论你是科学工作者,还是股市中人,都会从中得到满足。 #1  一、STATISTICA/w 5.0安装和启动   美国StatSoft公司1995年发行的STATISTICA/w 5.0是一个更新产品,它要求Windows3.1或以上操作系统。该产品有四种版本:STATISTICA标准版、Quick STATISTICA版、STATISTICA with Quality Control (QC)版(质量管理人员特别感兴趣)和带QC的Quick STATISTICA版。运行Setup.exe后即开始安装,有四种安装方式:最小安装(Minimum)、全部安装(Full)、选项安装(Custom)和服务器安装(Server)。安装后它会自动建立一个STATISTICA程序组,其中包括Basic Statistics-Tables和STATISTICA、Help(在线帮助)、Readme(自述文件)和Setup(方便增减项目安装和卸载)几项。STATISTICA/w 5.0占用近18MB硬盘空间,与SPSS7.0相比要小得多。   启动 STATISTICA/w 5.0,可以直接从Basic Statistics-Tables进入,也可从STATISTICA快捷图标启动。启动后首先看到的是STATISTICA Module Switcher窗口(见^231501a^),滚动目录窗口中列出各种统计分析项目,选择其一Switch To即进入数据编辑窗口,其他统计项目也可在统计分析过程中随时选择转换。 #1  二、STATISTICA/w 5.0的基本结构   在介绍统计分析项目之前,让我们先熟悉一下STATISTICA/w 5.0的基本结构。STATISTICA/w 5.0有四种格式和功能不同的窗口:   1.SpreadSheet Window(数据编辑窗口):启动STATISTICA/w 5.0后首先进入的就是这个窗口,它是输入待统计数据资料的地方,其结构类似于Excel的工作表,缺省的数据表是10×10的单元格集,如果变量(Variable)和case(观测值,如医学研究中的病人资料)较多,则需修改(Modify)变量或case的数量。要注意的是,由于空的单元格要按缺省值计算,故要删除不需要的case。在该表中拷贝、复制和粘贴数据等常规操作均与Excel相同。   2.ScrollSheet Window(原始数据统计结果显示窗口):也是一个数据表样的结构,该窗口提供与统计输出结果相关的图形制作功能。其常用工具栏上的Column和Row对应于SpreadSheet Window的Vars和Cases快捷按钮。   3.Graphics Window(统计图形显示窗口):用于显示制作的统计图,在该窗口内可以通过命令菜单或工具栏快捷按钮调整统计图的各种属性(见^231501b^)。   4.Text/Output Window(文本/输出窗口):这是一个很实用的文本编辑窗口,它实际就是一个包含统计图的小型文字处理器,可以像Word一样书写和编辑图文并茂的论文或报告。   现在你已对STATISTICA/w 5.0有了初步了解,怎么样,感觉不错吧?抖擞精神,让我们共同来看一下STATISTICA/w 5.0的核心内容。 #1  三、STATISTICA/w 5.0的统计分析功能   STATISTICA/w 5.0包含了现代统计学的所有统计分析项目,主要分为两大部分:数据的统计分析和统计制图。某些专业性统计项目中也可以同时产生统计图,如生存分析等。   按其排列的顺序,数据统计分析项目主要有:   1.Basic Statistics and Tables(基本统计分析):包括描述性统计,相关性分析,独立或非独立样本的t检验,频数统计表,概率计算及其他差异显著性检验(两个均值或百分率的检验)等。这是用的最多的统计分析项目,一般简单的统计分析靠它就可以圆满解决问题。   2.Nonparametrics/Distrib(非参数性统计分析):包括Chi-square卡方检验,Kolmogorov-smirnov检验,Wilcoxon配对符号等级检验,两个独立样本Mann-Whitney检验,多个相关样本Cochran Q检验和多个独立样本Kruskal-Wallis检验等等。   3.ANOVA/MANOVA(方差分析):有多因素方差分析、协方差分析和重复测量方差分析等。两个以上样本平均数差异显著性检验,就要靠这个方差分析。举例说吧:比较几种教学方法哪一种对学习成绩提高最快,比较几种牌号汽油的行程率等等。   4.Multip Regression(多元回归分析):逐步回归分析,固定非线性分析,残差分析和基于回归模型的预测等。如果您要调查研究人的智商是否与吃鱼和吃豆腐有关,就可以用回归法来分析。   5.Nonlinear Estimation(非线性估计):包括一般非线性模型,逐步Logit分析,最大可能性估计等。   6.Time Series/Forecasting(时间序列及预测):有关时间序列、探察、模型和预测技术选择等。股民朋友可一定要掌握这一功能。   7.Cluster Analysis(聚类分析):包括K-Means聚类,双边联合聚类等。聚类分析实质上是寻找一种能客观反映元素之间亲疏关系的统计量,然后根据这种统计量把元素分成若干类。是物以类聚的一种统计分析方法。   8.Factor Analysis(因子分析):初始因子模型、旋转因子模型等。例如,学生的各科成绩受智力、计算能力、表达能力和灵活性等因子的影响,虽然可以通过考试或检查等手段获得学生的各科成绩,但那些对各科成绩起支配作用的因子的状态不能直接测定到,这时候因子分析就派上用场了。   9.Canonical Analysis(典型分析):典型相关性分析,典型因子协效应分析。主要用于研究两组多变量之间的相关性。   10.Multidimensional Scaling(多维比例分析):多维距离或相似性估计等。   11.Reliability/Item Analysis(可靠性/项目分析):包括trachoric相关性分析,Crobach α系数,分半(split-half)信度分析等。假如您希望有可靠的交通工具,在任何时间、地点、对任何人,它都应该是可靠的,此种测试手段的可靠性显然是需要的。   12.Discriminant Analysis(判别分析):逐步判别法,分类统计等。判别分析的任务是根据已掌握的一批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体。如在环境检测中,根据对某地区的环境污染的综合测定结果判断该地区属于哪一种污染类型等。   13.Log-linear Analysis(逻辑线性分析):包括多维列联表、残差统计和自动最优模型选择等。   14.Survival Analysis(生存分析)。 #1  四、STATISTICA/w 5.0在医学中的应用   生存分析是国际流行的病患者生存情况及其影响因素的统计分析方法,目前国内医学期刊中利用计算机进行生存统计分析的文献报道还比较少,主要是对这种分析方法还不太熟悉。   临床科研设计以前瞻性随机对照的研究最为科学、合理,统计分析病例资料却非常麻烦,特别是大宗病例、生存时间长的资料统计工作会相当艰巨,在STATISTICA/w 5.0中进行生存统计分析,速度快,生存率计算准确,绘制的生存曲线精确、标准(见^231501b^)。   生存分析项目主要包括:(1)Life-Table寿命表法:要求病例数在30以上,否则误差大。(2)Kaplan-Meier法:小样本量照样精确计算。(3)两组样本生存比较:包括Gehan′s Wilcoxon检验、Cox's F检验、Cox-mantel检验、Log-rank检验和Peto&Peto's Wilcoxon检验,可同时制作各组比例生存和累积生存曲线图。(4)多组样本比较:以ScrollSheet表输出生存时间和评分,描述性统计(各组样本总数、删失和非删失数据数和中位生存和平均生存时间及标准差),每组百分生存统计,也可同时制作生存曲线图。(5)回归模型:包括Cox比例危险回归模型、Cox比例危险/时间协变量回归模型和指数模型等。   Survival Analysis虽然是在医学和生物科学研究中创立的,但它也可以应用于社会和经济学及工程学中,如产品质量效应分析和可靠性/失败时间分析等。   如果购买全套版本的STATISTICA/w 5.0,统计分析项目还有Process Analysis(过程分析)和Experimental Design(实验设计)等内容。另外,STATISTICA/w 5.0提供了内部的STATISTICA Command Language(SCL)语言,可以处理用户定义的特殊统计分析。有兴趣的朋友可以通过传真了解最新信息,传真号码:(918)583-4376。