语言 ▾
中文EN

CHARLS数据库使用指南及案例

发布时间:  2024-08-14 09:38:31


  一、CHARLS数据库概述   

(一)、背景信息

中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)是由武汉大学和北京大学共同执行的大型跨学科调查项目,是国家自然科学基金委资助的重大项目,旨在收集一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析我国人口老龄化问题,推动老龄化问题的跨学科研究,为制定和完善我国相关政策提供更加科学的基础。

CHARLS曾于2008年在分别代表我国东西部典型国情的浙江、甘肃两省开展预调查;全国基线调查于2011年开展,样本覆盖全国随机抽取的150个县区、450个村居的万余户家庭。此后,于2013、2015、2018、2020、2021-23年继续开展全国追踪调查。此外,CHARLS还曾在2014年组织并实施了“中国居民生命历程调查”、2016年开展“共和国初期基层经济历史调查”两项全国性专项访问,亦完全覆盖上述样本地区。2017年在北京和天津两地开展省级代表性抽样,调查访问对象扩大到家户中的全年龄样本。这是对CHARLS现有样本的补充

CHALRS的问卷设计参考了国际经验,包括美国健康与退休调查(HRS)、英国老年追踪调查(ELSA)以及欧洲的健康、老年与退休调查(SHARE)等。项目采用了多阶段抽样,在县/区和村居抽样阶段均采取PPS抽样方法。CHARLS首创了电子绘图软件(CHALRS-GIS)技术,用地图法制作村级抽样框。

(二)、CHARLS数据库用途

CHALRS数据库旨在收集和分析中国45岁及以上人口及其配偶的健康、经济状况、家庭结构和养老问题。

(三)、CHARLS数据采集方式

CHARLS的样本,通过多阶段分层概率抽样方法,共抽取了约17,000个家庭,约28,000名受访者。CHARLS抽样程序经过精心设计,以确保样本的公正性和代表性。该程序分四个阶段执行,从县(区)到村(邻)户,最后到个人层面。具体来说,在县(区)和村(邻)抽样阶段,CHARLS采用的是人口规模成正比的概率抽样方法,通常称为PPS抽样(Probabilities proportional to Size)。县域抽样阶段,采用基于2009年人口统计的PPS方法,以区域区分、城乡分类、GDP为分层指标,随机抽取全国30个省级行政单位(不含西藏自治区、台湾地区、香港、澳门特别行政区)的150个区县。在村级抽样阶段,再次坚持PPS方法,以2009年起的常住人口为基础,从上述150个区县中随机抽取3个村或社区,最终形成450个村/社区单元。上述所有取样程序均在STATA软件环境中执行,未获准更换样品。

为了减少人口数据中可能存在的偏差,将450个村单位的2009年常住人口数据与2007年的数据并列。对于这两年中人口数据偏离超过设定阈值的村庄或社区,则要求统计局进行核实。此外,对于选定的村庄或社区,还通过中国疾病预防控制中心在全国范围内进行验证,进一步确保了采样过程的稳健性。

(四)、CHARLS数据库样本特征

CHARLS的样本覆盖了中国境内的28个省、市、自治区,样本具有全国代表性,涵盖了不同地区、城乡和社会经济背景的45岁及以上中老年人群。


   二、CHARLS数据库使用方式   

(一)

访问和获取


访问地址:https://charls.charlsdata.com/pages/Data/2018-charls-wave4/zh-cn.html


(二)

注册申请


1、点击左上角数据用户注册


2、同意条款


3、填写相关信息、点击注册


4、通过审核后会收到邮件通知,就可以免费下载数据。

(三)

CHARLS数据使用指南


CHARLS数据按照调查年份(批次)整理成横断面数据,每批次数据有两部分:数据使用相关文档、数据下载。用户可以根据需要下载。

1、数据下载

用户注册登录后进入页面,选择所需数据直接点击蓝色字体,进入下一页面,以2020年数据为例进入申请数据,等待审核成功,审批通过就可以下载网站上的所有数据。



2、数据使用

CHARLS数据是以stata格式存储,如果不会使用stata,可以下载一个Stat Stransfer软件将数据转换为想要的格式。或者R软件、SAS软件可以直接导入stata格式的数据文件。


  三、CHARLS数据类型  

CHARLS数据包括个人和家庭基本信息、健康状况、心理健康、认知功能、经济状况、工作与退休、家庭结构、社会支持与人际关系、养老服务需求与使用等。


  四、CHARLS数据库研究案例   

(一)、使用互联网对健康有益吗?

来自中国CHARLS的PSM-DID证据


2024年7月,湖南大学经济与贸易学院学者在《PLoS One》(综合性期刊-3区)发表了题为:“Does internet use benefit health?-PSM-DID evidence from China's CHARLS”的研究论文。本文借鉴中国健康与养老纵向研究(CHARLS),采用倾向得分匹配-差异差异(PSM-DID)方法,探讨互联网对个体健康的影响,并进一步探讨互联网影响健康的途径。在理论分析中,将互联网变量纳入贝克尔健康需求模型中,分析健康需求的变化和影响路径。实证分析检验了理论结果,得出了实证结果。研究结果表明,互联网对身心健康都有显著的积极影响。这些效果是通过减少卫生信息不对称、降低卫生成本和增加接触促进健康的环境来实现的。在异质性分析中,与经济相关的互联网内容对居民健康具有显著的正向影响。大量使用互联网会对心理健康产生不利影响。互联网对健康的有益影响在老年人、医疗保险覆盖者以及数字经济水平较高的地区更为明显。


(二)、麻将、下棋和打牌是否与降低中国老年人肩痛的发生率有关?来自 CHARLS 的横断面和纵向证据


2024年7月,上海交通大学-密西根大学联合研究院学者在《Experimental Gerontology》(医学-3区)发表了题为:“Is playing ma-jong, chess and cards associated with a lower incidence of shoulder pain in Chinese elderly adults? The cross-sectional and longitudinal evidence from CHARLS”的研究论文。本文使用了2015年和2018年中国健康与养老纵向研究(CHARLS)的两波数据。采用Logistic回归模型分析PMCC与肩痛的横断面和纵向关联。结果表明PMCC与肩痛的发生率较低有关,这为PMCC作为肩痛发生的潜在保护因素提供了证据。


(三)不同糖代谢状态个体血浆动脉粥样硬化指数与新发卒中之间的关联:来自CHARLS的见解


2024年6月,南京医科大学临床医学院附属南京鼓楼医院学者在《Cardiovasc Diabetol》(医学-1区)发表了题目为:“Association between atherogenic index of plasma and new-onset stroke in individuals with different glucose metabolism status: insights from CHARLS”的研究论文。本文基于中国健康与养老纵向研究(CHARLS)数据库,采用Kaplan-Meier曲线、多因素Cox比例风险模型和限制三次样条分析,探讨不同血糖代谢状态个体基线AIP水平与卒中发生风险的关联。结果表明,Kaplan-Meier曲线分析显示,所有受试者中AIP组的卒中发生率存在显著差异,糖尿病前期(Pre-DM)和糖尿病(DM)组的卒中发生率均存在显著差异。此外,在所有三种 Cox模型中,发现高水平的AIP与糖尿病前期和糖尿病参与者的中风风险增加有关。然而,在血糖调节(NGR)正常的参与者中未观察到这种关联。受限三次样条分析还表明,在所有参与者和患有葡萄糖代谢紊乱的参与者中,较高的基线AIP水平与较高的卒中风险比相关。




上一篇:左手宏基因组学,右手代谢组学,左右开弓以揭示胃食管反流病儿童的肠道菌群与血清代谢物的关联

下一篇:CHNS数据库使用指南及案例



邮编:400000
联系电话:13651835632
电子邮件:zhoubaihao910@126.com
地址:重庆市沙坪坝区龙湖光年4号楼
Copyright © 2022 重庆嘉舟生物科技有限公司 All Rights Reserved 渝ICP备2022013225号