二 学科前沿动态
来 源
:
|
社会学与社会发展学科前沿研究报告2012 \ - |
作 者
:
|
- |
浏览次数
:
|
4 | ||
摘 要
:
|
在社会调查数据日益丰富的同时,作为定量方法研究的重要保障,定量分析软件也日益多元化、精细化和专业化。因此,我们有必要在关注通用统计软件的同时,也关注一些主要的专项软件的发展变化,在诸多专项统计软件中,我们重点考察两个影响力和覆盖面与日俱增的软件— — Mplus和MARS ,同时关注一个免费的通用统计软件R 。针对定类和定序数据的模型日益涌现在定量研究发展初期,所谓的定量研究通常只是使用了简单的描述统计和基础的假设检验,如进行T检验或方差分析。 | ||||||
关键词
:
|
定量分析 软件 结构方程 研究方法 调查 因变量 统计 丛书 定量研究 自变量 观测 |
在线阅读
二 学科前沿动态
字体:大中小
(一)定量分析工具的最新进展
在社会调查数据日益丰富的同时,作为定量方法研究的重要保障,定量分析软件也日益多元化、精细化和专业化。近年来,统计分析软件也迎合实际研究需求,在分析功能、操作性、兼容性、界面友好等多方面均有不同程度的新进展并日臻完善。这些新进展在SPSS、STATA和SAS等主流分析软件的更新中表现得尤为突出。
1.SPSS
伴随着实证分析方法不断深入、细化和多元化,SPSS作为较早的一款综合统计软件,经过多年的改进,目前已经更新至21.0版本。与以往的版本相比,该版本的SPSS主要在更好地构建预测模型、更精确地评估风险等方面有了新的改进,而且运行速度更快,分析结果更趋于完美。具体而言,SPSS最显著的改进首先是其运行的蒙特卡洛预测模型的结果可靠,更便于决策。当现有数据不足时,新SPSS可以基于现有的数据和已知的参数创建模拟数据库,然后用这个模拟数据库作为一个预测结果,同时可以调整用于模拟数据的参数并比较多个结果,且建立预测模型来协助决策者做出更好的决策并降低风险。第二,新版SPSS可以轻松导入IBM 公司的Cognos Business Intelligence数据。第三,在运算大数据时,速度更快,而且有更好的拓展性和稳定性。第四,无须通过编程可以设定模型,在SPSS的Amos模块中无须画出路径图就可以设定模型,并进行修改。第五,可以比较数据文件。通过在软件中比较两个数据库或文件的差异,来增加分析的准确性。第六,数据安全有了更好的保障。可以用密码保护数据和分析结果。这些新的改进都使SPSS始终处于同类软件的主导地位。
2.STATA
STATA软件目前已经更新至12.0。首先,新版本的STATA新增六种命令拟合不同的模型:新增sem命令,拟合结构方程模型;新增ucm命令,估计不可观测成分模型;新增arfima命令,拟合 ARFIMA模型;增加了tsfilter 命令,可以将时间序列分为趋势和周期性成分;新增psdensity命令,估计平稳过程的谱线密度;新增 mgarch命令用于拟合MGARCH模型,这些新增命令极大地拓展了STATA的使用范围。其次,扩大了一些原有命令的支持范围,如拟合线性多水平模型的xtmixed命令现在支持调查数据;mi impute命令现在支持基于链式方程的多元插补。同时在操作性和兼容性方面,新的STATA增加了自动内存管理功能,意味着研究者不必再事先设置内存;新增Excel数据格式导入、导出,以PDF格式输出log和graph,使得该软件与其他软件的互动性大为提升,而且新的使用界面,使得数据管理更加轻而易举。
3.SAS
SAS在最新的版本中进行了不同程度的更新。最新的SAS 9.3的更新主要集中在新增过程步骤:如PROC COPULA首次亮相;PROC GROOVY使得用户可以在SAS里面运行Groovy语;PROC PLM可以方便地在建好的模型中执行;用PROC FMM可以拟合几种不相关的分布组合起来的混合分布;在PROC IML调用其他模块语句;此外,新版SAS还新增了多种函数,以及绘制气泡图、饼图和瀑布图的功能,同时在系统选项方面也有了新的调整。
此外,在STATA、SPSS、SAS等综合主流统计软件迅猛发展和日臻完善的同时,一些独具特色的专项统计软件也开始走入应用研究者的视野中,日益冲击着通用统计软件的主导地位,并也弥补通用统计软件在追求全面发展的同时无法兼顾各个方面分析的不足,有效地提高了研究者的分析能力。因此,我们有必要在关注通用统计软件的同时,也关注一些主要的专项软件的发展变化,在诸多专项统计软件中,我们重点考察两个影响力和覆盖面与日俱增的软件——Mplus和MARS,同时关注一个免费的通用统计软件R。
4.Mplus
作为第二代的结构方程软件,Mplus是一个实践先于理论发展的工具。该软件于1998年推出了1.0版本,到2012年9月推出了最新的7.0版本。Mplus软件虽然最初是一个针对结构方程模型的软件,但经过7代的发展演变,目前也逐渐演变为一个综合性的定量分析工具。在拟合通用模型的基础上,Mplus软件的一个显著特点是在分析潜变量时可以将多种分析方法融合在一个分析框架下。同时,它也具备了操作简单、容易掌握的特点,在国外的定量分析软件中逐步占据了一席之地,也逐步在国内普及开来。2012年该软件的作者在国内进行了为期一周的讲座,促进了该软件在国内的普及和应用。
由于Mplus软件侧重于对结构方程模型的估算,因此新版本的改进主要体现在对结构方程模型相关模块的细化,特别是引入贝叶斯估计之后,让Mplus具有融合路径分析、测量模型、答题理论(IRT)、潜变量模型、双因子分析,潜增长模型、多层次模型、多组分析等统计学前沿模型于一体的能力。具体而言,最新版本Mplus在以下方面显现出较大幅度的改进:
(1)对于结构方程模型拟合的细化:可以运用BSEM(贝叶斯结构方程模型)模块进行贝叶斯测量的守恒分析,可以拟合含随机因子负荷的贝叶斯两层次结构方程模型、三层次结构方程模型和交叉分类结构方程模型(包括随机斜率和三步混合模型)。
(2)对于因子分析的改进:Mplus7.0可以在因子分析中生成可能影响分因子的总因子,同时可以进行双因子的探索性因子分析旋转、贝叶斯探索性因子分析,以及基于特征值决定因子个数的平行分析。
(3)含协变量的潜转移分析(LTA):当协变量是分类变量时,新版的Mplus可以提供每一分类的潜转变概率;当协变量是连续变量时,新版软件可以用来计算协变量任一取值的潜转变概率。
(4)混合模型的概率参数化:概率参数化为含有定类潜变量的对数概率模型(Logit)和对数线性模型的参数化提供了一种新的路径。
(5)贝叶斯可能值图:贝叶斯估计为每个因子得分和潜在的响应变量值提供了一个可能值的分布,Mplus7.0可以用图表来展示这一可能值的分布。
(6)Mplus 制图能力的提升是本次软件更新的一个主要方面。目前Mplus的图表主要有三种不同的用法:一是在生成Mplus模型命令时可以生成输入的图表。二是可以查看某次分析生成的图表,对于已经生成的图表可以在修改后用来进行新的分析。三是可以查看尚未进行分析但与已经输入数据有关的图表。
此外,Mplus7.0也具备了自动识别双层模型计算可能性的能力,并且在软件使用的便利性和结果显示的美观性方面也有一些小幅度的调整和改进。这些调整和改进增强了该软件与通用统计软件的竞争性,同时由于Mplus具有对外的接口,我们可以直接通过STATA调用Mplus,强强联合、互通有无,极大地提高了定量分析辐射力。
5.MARS
MARS软件的全称是 Multivariate Adaptive Regression Splines,也称为多元自适应分段回归模型。它是一种非参数回归模型,也是一种数据驱动模型,是根据基函数和回归系数的集合建构模型,因此无须假设自变量与因变量之间所潜在的函数关系,也无须假设自变量与因变量的分布模式,是数据挖掘的有效工具。
传统的回归模型通常用直线拟合数据,而MARS在模型构建方面的灵活性表现为可以用曲线、临界值以及其他偏离直线的方法来拟合数据。MARS建模是将数据的分布视为许多直线的组合,允许其中每条直线有自己的斜率,然后将这些直线“拼接”起来拟合数据,这使得MARS可以拟合任何形式的数据而不受数据分布的影响。
MARS是一个有创新性和灵活性的建模工具,它可以对连续的和两分类的因变量自动构建精确的预测模型。MARS擅长发现最优的变量转换形式和变量互动形式,以及发现通常隐藏在高一级数据中的复杂数据结构。给MARS一个目标变量和一些备选的预测变量,它可以自动进行以下的模型拟合:(1)区分出与因变量相关或无关的变量;(2)转换那些显示出与因变量有非线性相关的自变量;(3)决定自变量之间的互动关系;(4)用新的嵌套变量技术处理缺失值问题;(5)进行全面的自我测试,以防止过度拟合。
由于MARS的高度“自动化”,在我们不明确数据间关系的前提下,它是一个高效的探索性数据挖掘工具。然而这种高度的自动化也在一定程度上限制了研究者的自主性,使得模型拟合的结果不一定具有明确的现实意义。
6.R软件
R软件是用于统计分析、绘图的语言和操作环境,是属于GNU系统的一个自由、免费、源代码开放的软件。R软件是一种基于R语言统计分析软件,建立在贝尔实验室开发的S语言的基础上,提供了一系列统计和图形显示工具。其主要特色在于:(1)有效的数据处理和保存机制;(2)拥有一整套数组和矩阵的操作运算符,其在向量、矩阵运算方面功能尤其强大;(3)一系列连贯而又完整的数据分析中间工具;(4)图形统计可以对数据直接进行分析和显示,可用于多种图形设备;(5)一种相当完善、简洁和高效的程序设计语言,它包括条件语句、循环语句、用户自定义的递归函数以及输入输出接口;(6)R语言是彻底面向对象的统计编程语言,和其他编程语言、数据库之间有很好的接口;(7)R软件是完全免费,具有很好的可及性,尤其适合我们发展中国家的研究者使用;(8)R软件的源代码可以自由下载,使用者也可以上传自己编撰的代码,作为一个开源的资源库,通过群策群力来推进软件的更新和发展。目前国内统计学界对R软件的推广和使用略多于其他学科,其免费的特征更为广大学生所青睐,在各大高校中具有一定规模的使用者。
简而言之,目前定量分析软件的一个显著特点是:通用软件和专项软件之间界限变得越来越模糊。例如,STATA的最新版本12.0具备了分析结构方程模型的模块,而这一模块在过去的20年之间,一直是通用软件和专项软件之间的分界线之一。同时,Mplus等专项软件处理数据的能力也不断增强,例如,Mplus7.0就增加了Loop、Do等命令。同时,在另一方面,随着统计软件功能的进一步增强,定量分析中误用统计软件的现象也变得越来越普遍和隐蔽。这一定要引起我们的高度重视。
(二)定量研究方法的前沿进展
由于中国社会学研究整体起步晚于西方社会学,中国社会学定量研究方法的发展也始终滞后于西方社会学方法,一直处于借鉴西方研究方法的阶段,没有针对本土特有社会问题和现象发展出本土化的定量研究方法。目前国内主要有两条有代表性的渠道,系统化和规范化地引入了西方已有的社会学定量研究方法。一条渠道是重庆大学出版社联合中国社会科学院社会学所社会调查与方法研究室出版的“万卷方法——社会科学研究方法经典译丛”,该丛书选择了西方一大批经典或前沿的研究方法的专著,由国内主要社会学研究机构的学者翻译成中文,从2004年至今,已经翻译出版了超过百本的研究方法丛书,成为国内社会科学方法丛书的主要来源。这些翻译的丛书中既有对定量研究方法的介绍,也包括对定性研究方法的介绍,目前丛书的数量还在不断地增加中,为国内研究者了解和掌握前沿的研究方法提供了极大的便利。另一条渠道是由香港科技大学社会科学部吴晓刚教授主编的“格致方法·定量研究系列”丛书,该丛书精选了Sage出版社定量社会科学研究丛书,也由社会学专业的学者翻译成中文,从2011年至今成功发行了37本关于社会学定量研究方法的丛书。该丛书以单个分析方法成书,对于方法的学习者更有针对性和实用性。同时,该丛书的来源——Sage出版社的方法丛书也保持每年更新,为该丛书的扩容奠定了坚实的基础,可以预计“格致方法”丛书会紧随Sage出版社的节奏,持续向国内引进更多的定量分析方法。此外,中国社会科学院社会学所社会调查与方法研究室正在与重庆大学出版社合作,翻译另一部重要的社会学研究方法著作The SAGE Encyclopedia of Social Science Research Methods(《社会科学研究方法百科全书》),该书以词条的形式收录了与社会学研究相关的各种定量和定性的方法,作为百科全书保证了出版以前的主要研究方法均有据可查,极大地便利了方法的学习者和使用者,该书的英文版已由Sage出版社在2003年出版,中文版的方法百科全书预计将于2015年正式出版。
根据国内外最近三年定量研究的成果和出版发行的专著,我们将近几年社会学定量研究方法的主要进展概括为以下几个方面:
1.重视对缺失值的处理
缺失值是社会调查中不可避免的问题,最早的处理方法是忽视缺失值,统计软件默认将含有缺失值的个案排除在模型之外,也无法估计缺失值对分析结果造成的影响。美国学者Paul Allison在2002年编著了专门介绍缺失数据的书,详细介绍了缺失数据的类型和处理方法,该书已于2012年翻译为中文,为国内学者关注和解决缺失值的问题提供了有效的帮助。Paul(2002)指出,缺失值可能是完全随机的缺失,也可能是非随机的缺失,因此缺失值并非完全可以忽视的。传统的处理方法包括成列删除、成对删除、用虚拟变量进行调节以及插补。随后发展出用极大似然估计的方法解决缺失值问题。这一方法对于随机缺失的数据而言比较有效,但其局限性在于,当模型是对数线性模型时,难以用最大似然估计法对缺失值进行估计。目前最前沿的处理方法是多重插值法(multiple implation)或者其他基于模型的方法进行处理。多重插值法可以用于估计任何类型的非线性模型,但计算麻烦,我们必须借助统计软件来解决这个问题,因此用软件进行多重插值法处理缺失值,成为目前较为有效和理想的方法。
2.对非线性关系的探讨深入
线性假定是经典定量分析的一个常见假设,但在实际研究中,线性假定只能被看作是对社会现实的一个近似和简化,当现实的数据与线性假设背离较厉害时,用线性模型估计数据将产生较大偏差,而且简单地依靠数据的分布来取舍线性模型和非线性模型不够严谨和科学。MARS模型的出现为研究者克服这一困境提供了可能。MARS软件是根据基函数和回归系数的集合建构模型,无须假设自变量与因变量之间所潜在的函数关系,也无须假设自变量与因变量的分布模式,因此研究者可以在不对数据进行任何线性或非线性假定的前提下,用MARS模型尝试拟合因变量和自变量的关系,探索最接近数据实际分布的模型,实现了理论思考和数据分析互动循环的过程。
3.结构方程模型的发展
结构方程模型(structural equation model,简称SEM)是一种数据分析技术,在社会科学和自然科学中有广泛的应用,如心理学、经济学、社会学、管理学,还有生态学和遗传学等。结构方程最初的发展得益于20世纪70年代初期Karl Joreskog的杰出工作。此后,结构方程模型一直快速发展。最近十年,结构方程模型又有了惊人的进步。
结构方程模型在近十年来发展的主要内容包括:(1)结构方程中的多组分析;(2)多水平结构方程模型;(3)潜增长曲线模型;(4)定类和连续潜变量混合模型;(5)非线性结构方程模型;(6)结构方程中的中介效用;(7)结构方程中的缺失数据问题;(8)蒙特卡罗模拟在结构方程模型方法论发展中的应用。
总之,结构方程模型作为一种通用的数据分析框架在过去十多年中在各学科的应用中已经变成了主流的多变量统计分析工具,在方法论上经历了第二代模型的综合发展,提出许多新的模型,并正朝向新的综合框架发展。国内对于结构方程模型的介绍和研究同国外的水平相比有相当大的差距,我们在结构方程模型方法论上还要付出更多的努力。
4.针对定类和定序数据的模型日益涌现
在定量研究发展初期,所谓的定量研究通常只是使用了简单的描述统计和基础的假设检验,如进行T检验或方差分析。随着调查数据的日益丰富,定量研究中开始出现以定距变量为因变量运用线性回归模型进行分析的研究。然而实际的社会学调查数据中,往往是定类数据和定序数据比定距数据多,而定类数据和定序数据由于不是连续的数据,无法直接通过线性的模型来拟合数据的分布,需要运用专门的分析方法和模型来应对,因此对于分析这两种测量层次数据的方法有很强的需求。所以在线性回归的基础上,logistic回归、Poisson回归、负二项回归、对数线性模型等统计模型逐渐出现在定量研究的论文中,相关的专著也涌现出来,其中有代表性的是Alan Agresti撰写的Category Data Analysis,该书已于2012年由重庆大学出版社翻译出版,着重介绍了分类变量的分布以及传统的二维列联表分析方法、关于二分类和多分类变量的logistic回归以及相应的logit模型、用于分析列联表数据的对数线性模型,以及最近10年分类数据分析这一领域的新发展。此外,还有2009年出版的由丹尼尔·A.鲍威斯和谢宇撰写的《分类数据分析的统计方法》,该书对分类数据分析的方法和模型及其在社会科学研究中的应用做了全面介绍。它的一个明确目标是整合变换方法和潜在变量方法,这是两类不同但又相互补充的处理分类数据分析的传统方法。这也是第一次在一本单册书中详细地介绍针对离散因变量、交叉分类和跟踪数据的模型与方法。格致方法系列丛书也对于分类数据的分析方法有专门的介绍,该丛书根据分类数据的类别差异,将分析方法进一步细化为《应用logistic回归分析》、《logit与probit:次序模型和多类别模型》、《定序因变量的logistic回归模型》和《对数线性模型》等,由于每个专题都通过一本书展开讨论,因此涉猎的深度比其他综合性的专著更加深入。
5.潜变量模型的发展
潜变量是与显变量相对应的一类变量,潜变量无法直接被观测到和进行测量,但是研究者可以运用统计模型,通过其他可以观测和测量的变量(显变量)对潜变量进行推断和估计。对潜变量的分析拓展了社会学研究的视野,那些以往无法观测和测量的变量,也可以纳入数学模型进行量化分析,探究因果关系,深化了学界对于一些抽象概念的了解和认识。目前针对潜变量,已经发展出一整套系统的分析方法和模型。其中,分析方法包括潜类分析(latent class analysis)、潜变量结构分析(latent structure analysis)和潜变量赋值分析(latent budget analysis)等(沈崇麟,2008)。而分析潜变量的经典模型主要有:多层次回归模型、因子模型和题器相应模型、潜类模型、带有潜变量的结构方程模型和纵贯性模型等(Skrondal and Hesketh,2011)。Skrondal和Sophia Hesketh在其专著Generalized Latent Variable Modeling:Multilevel,Longitudinal and Structural Equation Models 一书中,详细介绍了各类潜变量模型及其建模过程和应用实例,该书已于2011年由重庆大学出版社翻译出版。同样介绍潜变量分析方法的书籍还包括格致方法系列丛书中Kristopher Preacher等所著的《潜变量增长曲线模型》。这些方法的及时引入,为国内学习和进行潜变量的相关研究提供了可能,然而由于该方法相对前沿,运用潜变量分析方法进行研究的成果在社会学领域仍寥寥无几,而在心理学和医学领域的研究中使用该方法的研究已经逐渐增多。
6.分层模型的出现和应用增加了分析单元的层次性
定量研究的分析单元可以是不同层次的,可以是微观个人或家庭层次的,也可以是中观社区层次的,还可以是宏观社会层次的。不同层次的分析单元要求数据和结论是同一层次的,即用个人层次的数据不能推论出社区层次的结论。以往单层的分析方法和模型,限制了定量研究只能在某一层次进行,否则就容易出现层次不对应的“生态谬误”问题。而现实的情况是个体行为可能受到多个层次效应的影响,当多层次效应出现时,OLS的经典假设很难满足,“不相关的误差项”的假设几乎是不能成立的(Douglas A.Luke,2012)。近年来,随着社会调查数据在数据收集阶段就注重调查个人、家庭、社区等不同层次的数据,定量研究的分析方法也出现了分层分析或者多层分析的方法和模型。随着多层次模型的出现,我们可以同时考察多个层次上的效应,可以把个人放在其家庭背景中,再把家庭放在社区的背景下,考察个人层次的变量对社区变量的效应,或者社区层次的变量对个体行为的具体影响。多层模型的出现使得定量分析模型中“宏观和微观”的连接获得了建模技术上的支持(沈崇麟,2008)。这一分析方法的代表是Joop J.Hox在2010年著述的Multilevel Analysis:Techniques and Applications,还有重庆大学出版社于2007年出版翻译的Ita kreft 和Jan DeLeeuw著述的《多层次模型分析导论》,以及格致方法系列丛书也专门对多层模型进行了介绍(Douglas A.Luke的《多层次模型》)。此外,关注近三年来,《社会学研究》和《社会》上发表的论文,从2011年末开始,陆续出现了使用多层模型进行研究的论文,其中绝大部分运用了二层线性回归的方法,最近还有一篇论文运用了二层logistic回归的方法,不难看出多层分析方法和模型的使用日益广泛,运用的程度也在不断深入,增加了社会学定量研究的层次性。
7.追踪数据引领纵向研究的发展和深入
许多社会事实都是横截面的,是在特定的时点对不同对象生活状况的“截图”。虽然通过一系列调查获得的连续性“截图”可以让我们从整体上把握社会变迁,但是这些调查无法使我们了解那些与历史变化相匹配的个体经历变化。与此相反,纵向的社会事实能够通过追踪一些个体随时间变化的经历,来实现我们对个体经历的了解,进而折射出社会变迁对社会成员的微观影响,同样也能反馈社会成员对变迁影响的自我调节和适应。
由于数据和研究方法的限制,相对于较为成熟的横截面研究而言,目前国内对于社会事实的纵向研究还处于探索和起步阶段。虽然有针对性的追踪调查日益增加,然而从理论上推进纵向研究,从方法上总结纵向研究的工作仍然较为有限。近年来,国内主要科研机构由于科研环境的改善,开始重视对纵向调查数据的收集和积累。比较典型的是两项综合调查,一是中国社会科学院社会学研究所开展的“中国社会状况综合调查”(China Social Survey,简称CSS),目前已经完成3期的调查,正在准备第4期调查;二是中国人民大学中国调查与数据中心开展的“中国综合社会调查”(China General Social Survey,简称CGSS),目前已经完成了5期调查。此外,也有一些专项调查,主要包括北京大学老龄健康与家庭研究中心开展的“全国老年人口健康状况调查”,中国老龄科学研究中心开展的“中国城乡老年人口状况一次性抽样调查”,北京大学中国社会科学调查中心的“中国家庭动态跟踪调查”(China Family Panel Studies,简称CFPS)等。随着这些社会调查的调查次数增多,它们逐渐从横截面调查数据积累为纵向数据,虽然这与另一类纵向数据——追踪数据(panel data)相比进行纵向研究还有一定偏差,但能够获得纵向的时期数据,也能在一定程度上促进纵向研究的发展。此外,美国北卡罗来纳大学和中国预防科学研究院联合采集的“中国营养健康状况调查”(China Health and Nutrition Survey,简称CHNS)数据是一套典型的纵向追踪数据,目前已经完成了将近10期的调查,可以说是一套关于中国社会发展追踪时间较长的数据,但是由于其抽样并未覆盖整个中国大陆,其数据的代表性问题值得商榷。
在日益丰富的纵向调查数据的引领下,关于纵向的、追踪研究的方法也成为学界关注的重点。“格致方法”系列丛书有三本专门讨论纵向数据的分析方法的书籍,它们是:《纵贯研究》、《多元时间序列模型》和《世代分析》,这三本书分别从纵向(longitudinal)、时间序列(time serious)和世代(cohort)三种纵向数据的分析视角来介绍纵向追踪研究的方法,可以说是纵向研究的一个基础性方法介绍,表明不同维度的纵向研究需要特定的分析方法和模型来进行。此外,国外也有学者专门介绍和讨论了纵向研究的特定方法,如Yang Yang和Kenneth C.Land以专著介绍了APC(Age-Period-Cohort)分析方法的最新模型、方法和实证运用,将纵向研究年龄、时期和世代三个维度进行了很好地结合,对三种效应进行了很好的区分。
目前国内学界对于纵向追踪的研究还相对较少,主要原因是一方面受限于数据,因为中国目前还没有严格意义上的追踪调查,相关的调查还只是多横截面数据的组合,并不是真正的追踪调查,而相关的追踪调查又面临着被访者大量流失的问题,如何在调查中克服或减少样本流失,是当前国内追踪调查中一个亟待解决的核心问题。另一方面也受限于方法的不适用,目前进行纵向分析的方法并不像横向分析那样丰富和成熟,在纵向的变化过程中多种因素的交互影响的效应如何识别和区分也是纵向研究面临的主要问题。
8.计算机模拟技术的发展拓展了观测方式
计算机技术的发展,使得社会学研究的观测范围从实物观测拓展到虚拟观测。定量研究不再完全依赖于实地的调查,而可以通过计算机模拟或者仿真社会变迁的过程,或者预测未来的发展趋势。计算机模拟(computer simulation),也被称为计算机仿真,就是利用计算机对研究系统的结构、功能和行为以及参与系统控制的主动者——人的思维过程和行为进行动态性的比较逼真的模仿。计算机模拟是数值分析方法的一种。它用计算机程序直接建立真实系统的模型,并且通过计算机的计算了解系统随时间变化的行为或系统的特性(沙莲香等,2007)。目前国内社会学类的研究几乎没有运用计算机模拟技术进行研究的成果,只有沙莲香等2007年在《社会学研究》上发表了一篇运用SWARM软件模拟了民众在危机事件中的社会心理的论文。该论文在国内首次将标准的计算机模拟技术引入社会学研究,而这种模拟在其他学科(如经济学、生态学)已经早于社会学运用该方法了。国内社会学研究中对于计算机模拟技术的另一类运用,主要是在人口学的研究中对人口的未来发展情况进行预测。人口预测是简化的计算机模拟,常运用已有的模拟软件,在给出相应的参数设定后,由软件完成整个预测过程,比运用SWARM这类模拟平台进行模拟简单易行。王广州、张丽萍(2012)曾经做过类似的研究,运用随机微观人口仿真模型估计了中国人的政策生育潜力,预测了不同生育政策条件下中国总人口的峰值变化。该研究把随机人口预测模型和微观人口仿真模型的优点结合起来,虽然建模非常复杂,但其突出的优点是可以通过非常小的概率样本研究全国人口的仿真问题,在国内的模拟研究中相对走在了前列。
可以预见未来研究中计算机模拟技术的使用将不断普及,因为该技术可以克服社会变迁进程漫长观测耗时的问题,也能应对因为社会伦理和社会隔离等因素导致的无法直接进行观测的困境,为社会学定量研究开拓了一个全新的领域。
显示更多