语言 ▾
中文EN

CFPS数据库使用指南及案例

发布时间:  2024-08-21 10:12:18




一、CFPS数据库概述






(一)、背景信息

CFPS由北京大学中国社会科学调查中心(ISSS)实施。项目采用计算机辅助调查技术开展访问,以满足多样化的设计需求,提高访问效率,保证数据质量,是北京大学和国家自然基金委资助的重大项目。CFPS在2008、2009两年在北京、上海、广东三地分别开展了初访与追访的测试调查,并于2010年正式开展访问。经2010年基线调查界定出来的所有基线家庭成员及其今后的血缘/领养子女将作为CFPS的基因成员,成为永久追踪对象。CFPS调查问卷共有社区问卷、家庭问卷、成人问卷和少儿问卷四种主体问卷类型,并在此基础上不断发展出针对不同性质家庭成员的长问卷、短问卷、代答问卷、电访问卷等多种问卷类型。CFPS在执行过程中得到了国家人口和计划生育委员会、国家统计局、上海大学、中山大学、兰州大学的大力协助。在调查设计、技术支持等方面,美国密歇根大学社会研究中心给予我们很多指导与帮助,双方建立起了良好的合作关系。

(二)、CFPS数据库用途

中国家庭追踪调查(China Family Panel Studies,CFPS)旨在通过跟踪收集个体、家庭、社区三个层次的数据,反映中国社会、经济、人口、教育和健康的变迁,为学术研究和公共政策分析提供数据基础。

(三)、CFPS数据采集方式

CFPS采用了抽样设计、问卷调查与追踪调查的方式获取数据。在抽样设计之中同样体现了对社会现象多维度、多层次特点的考虑。抽样设计考虑到了地区差异,以行政区划和经济发展水平等变量分层后进行抽样,是在社会多层次基础上为使数据具有代表性进行的特殊设计。同时研究者也关注到官方的城乡划分与现实的不适应,从而舍去了不够精确的区界划分而是通过多维度信息来反映地区差别,也是对社会复杂性的回应。为了更细致全面地反映社会状况,研究人员针对不同的研究对象设置了不同的问卷,CFPS对以户主为中心的辐射状家庭调查方式在反映整个家庭树的完整关系上的缺陷进行的反思以及在此基础上设计的T表格即体现了这一点,而这往往也是在调查设计的同时容易被忽视的。而针对社会现象具有时间上的持续性的特征,CFPS采取了长期跟踪的数据采集方式。这种调查方式通过对固定样本的追踪调查,为因果关系的推断提供了更加清晰的资料,也有助于控制一些不可观测的变量,提高调查所得数据的质量。

(四)、CFPS数据库样本特征

CFPS重点关注中国居民的经济与非经济福利,以及包括经济活动、教育成果、家庭关系与家庭动态、人口迁移、健康等在内的诸多研究主题,是一项全国性、大规模、多学科的社会跟踪调查项目。CFPS样本覆盖25个省/市/自治区,目标样本规模为16000户,调查对象包含样本家户中的全部家庭成员。





二、CFPS数据库使用方式






(一)、访问和获取

访问地址:https://www.isss.pku.edu.cn/cfps


(二)、注册申请

1、由于CFPS官网数据平台正在进行系统更新,用户可以通过https://opendata.pku.edu.cn/dataverse/CFPS进入到北京大学开放研究数据平台的CFPS页面进行数据获取,进行数据获取前可以通过以下步骤进行注册:



2、点击网页右上角的注册进入到注册页面。


3、选择“高级用户”进行注册(由于“普通用户”注册获取的数据有限,这里以“高级用户”的注册为例),填写相关信息、点击注册。填写好用户名、电子邮件、姓名、单位、地区等信息以后,点击创建账户,这时您会在您填写的邮箱里收到数据平台发来的注册账户的初始密码。


4、在获取登录的初始密码后,就可通过用户名或邮箱加密码进行登录。如果您想要修改初始密码,可以进入到账户信息页面输入新密码点击保存更改即可。



(三)CFPS数据使用指南

1、数据下载

(1)、在注册好账号并登录后,点击中国家庭追踪调查进入到数据下载页面。


(2)、进入到数据下载页面后,点击申请加入用户组,等待系统审核。


(3)、成功加入到用户组以后,便可下载所有的公开数据了,点击下载,即可下载相应的数据。


(4)、如果您想要获取CFPS所提供的限制数据,请仔细阅读CFPS官网提供的CFPS限制数据申请指南,以便您进行相应数据的获取。


2、数据使用

CFPS所提供的数据为.sas和.stata格式,用户需要安装相关软件或者进行文件格式的转换才能对数据进行使用和分析。CFPS官网的文档中心提供了相应的辅助性文档(包括调查问卷、用户手册、数据文档、技术报告),用户可以根据需求仔细阅读和深入理解这些文档。调查问卷:包括各轮追踪调查的汇总问卷以及成人、少儿、经济问卷等相关内容。用户手册:提供了CFPS项目的设计理念与方法、项目在实际运作过程中的各方面的操作细节、数据管理与数据库构建、技术报告索引、数据质量评估等5个方面的详细内容。数据文档:提供的量表、文本编码、综合变量、逻辑流程图、Codebook及SAS值标签等可以帮助研究人员更好的理解相应的数据。技术报告:提供了中国家庭追踪调查抽样设计、执行报告、数据清理报告等众多类型的详细技术报告。







三、CFPS数据类型






CFPS数据包括社区问卷数据、家庭问卷数据、成人问卷数据、少儿问卷数据。

1、社区问卷内容包括:村/居基础设施概况、人口和劳动力资源概况、自身及周边环境、基层选举、财政收入与支出,以及日常消费品价格等。

2、家庭问卷的内容包括:家庭成员结构、日常生活基本设施、社会交往、住房、家庭经济、农业生产与销售等。

3、成人问卷的内容包括:教育、婚姻、职业、日常生活、健康、养老、社会保障、社会交往、价值观、以及基准测试等。

4、少儿问卷的内容包括:学业情况、日常生活、健康、职业期望、与父母关系、成长环境、社会交往、价值观、以及基准测试等。






四、CFPS数据库研究案例






(一)、孙子孙女的抚养意愿、代际支持对中国老年人的健康有影响吗?CFPS数据的定量研究


2023年8月,江苏大学管理学院学者在《Front Public Health》(医学-3区)发表了题为“Does grandchild care intention, intergenerational support have an impact on the health of older adults in China? A quantitative study of CFPS data”的研究论文。本文章基于2018年和2020年中国家庭面板研究数据,采用多元线性回归和多元中介检验,探讨孙子孙女护理意愿和代际支持对老年人健康的影响。孙子孙女的照顾意愿对老年人的自评和心理健康具有显著的正向影响。积极照顾孙子孙女的老年人,通常心理压力较小,在抚养孙子孙女的过程中,能获得满足感和快乐感。而孙子孙女的抚养意愿对身体健康的影响并不显著。孙子孙女护理意愿通过经济支持、生活关怀和情感安慰对老年人健康产生中介作用。

(二)、互联网使用对老年人身体健康的影响及作用机制——基于CFPS的实证分析


2022年10月,北京师范大学体育与体育学院学者在《Front Public Health》(医学-3区)发表了题为“The effect and mechanism of Internet use on the physical health of the older people-Empirical analysis based on CFPS”的研究论文。本文基于2014年、2016年、2018年和2020年中国家庭面板调查(CFPS)数据,通过评估可能的异质性和中介机制来检查互联网使用对老年人身体健康的影响。结果表明,在纳入控制变量的前提下,互联网使用对老年人身体健康有显著影响,异质性分析结果表明,互联网使用对老年人健康的影响在性别、城乡和经济区之间存在差异,中介分析结果显示,互联网使用与老年人的体育锻炼行为呈正相关。

(三)、社会资本是否缓冲或加剧了心理健康不平等?来自中国家庭小组研究(CFPS)的证据


2022年5月,西安交通大学公共政策与管理学院学者在《International journal for equity in health》(医学-2区)发表了题目为“Does social capital buffer or exacerbate mental health inequality? Evidence from the China Family Panel Study (CFPS)”的研究论文,本文主要来源于2018年的中国家庭面板研究,采用CFPS 2016中的社会资本滞后项与2018年的其他变量进行关联。抑郁症状和主观幸福感被设定为心理健康的指标。通过一系列OLS回归模型来估计社会资本对心理健康和心理健康不平等的影响。研究结果表明,中国存在严重的心理健康不平等现象;家庭层面的社会资本可以缓冲抑郁症状的不平等,村级的社会资本可以缓冲SWB的不平等。虽然穷人的社会资本量比富人少,但穷人可以更好地利用社会资本来改善他们的心理健康。







上一篇:CHNS数据库使用指南及案例

下一篇:hdWGCNA,为单细胞与机器学习搭起了“友谊”的桥梁



邮编:400000
联系电话:13651835632
电子邮件:zhoubaihao910@126.com
地址:重庆市沙坪坝区龙湖光年4号楼
Copyright © 2022 重庆嘉舟生物科技有限公司 All Rights Reserved 渝ICP备2022013225号