基于大型肿瘤数据库的数据挖掘研究文献综述-综述大全网

文献综述（或调研报告）：

SEER数据库及其在肿瘤研究中的应用

[摘要] 癌症是严重威胁人类生命和社会发展的重大疾病，运用科学的方法对癌症进行预防控制已成为全球最重要的公共卫生问题之一。有关于肿瘤的治疗方法的研究与肿瘤数据的分析，一直是公共卫生研究关注的重点。而作为经过较长时间调查，拥有较大数据量的SEER数据库在现代肿瘤研究中具有较为重要的作用。而将他同GEO数据库和TCGA数据库这2大肿瘤基因数据库的参考比对研究，也是比较关键，且有实际意义的。同时，结合了最新的机器学习和统计手段的研究方法，SEER数据库将会得到更为有效的应用。

[关键词] SEER规划，GEO规划，TCGA规划，非小细胞肺癌

SEER数据库是美国国家癌症研究所主持进行的癌症监测、流行病学和最终结局规划(Surveillanee, Epidemiology and End Results, SEER program)下建立的数据库，这一数据库包含了从1973至今美国部分洲（共18个调查站，统计总量约占美国总人口的 28％）的肿瘤发病与生存情况的资料^[1]。

一、SEER数据库

1、SEER数据库的起源

美国国家癌症研究所成立之初就很了解收集肿瘤患者病情资料的重要性。美国政府在1935年至1936年间进行了全国健康调查，而后美国国家卫生研究所Harold Fred Dorn教授在1937年和1947年领导了两次肿瘤患者病情资料的专项调查^[2]。通过这两次调查，Dorn发现两次调查期间肿瘤发病率变化不大，因此决定将肿瘤病情的调查时间间隔从10年一次延长至20年一次。

在20年后，John C Bailar领导在预定的1970年美国人口健康普查前后又开展了一次肿瘤患者的专项调查，即第三次国家肿瘤调查(Third National Cancer Survey, TNCS)。这次肿瘤调查从1969年开始一直做到1971年,调查内容比起前两次调查更详细,收集了一些相对少见的肿瘤情况，并对患者资料进行了更加全面的记录，并以此为契机，制定了一系列肿瘤患者资料的登记标准^[3]。这次包含了10%以上美国人口的大型调查结果最后在1975年，由Cutler和Young J.L.Jr.整理,发布在美国国家肿瘤研究所专论第41卷(Natl. Caner Inst Monogr 41:1—454,1975)。这次癌症调查的发病率资料显示出了和Dorn完全不同的结论。各种肿瘤的发病率变化得更快了。原定的时间间隔较长的调查结果已经无法全面说明问题。为了改善这一情况，Culter等新一代调查人员决定依据第三次国家肿瘤调查结果，制定一个全新的计划，即监测、流行病学和最终结局（SEER）计划。这次计划不仅包含了参加第三次国家肿瘤调查的人群覆盖范围，还有意增加了一些新地区，扩展了各种人种的比例来增加人群的代表性。

在开展SEER计划的同时，Culter为了就患者生存率情况进行统计整理与分析，开展了“最终结局组”规划这一报告系统，为SEER数据的完整性奠定了较好的基础。在SEER计划建立伊始，Young就发现在数据收集阶段统一的定义和标准对于数据的收集和分析有着重要意义，因此，他领导开展了对登记员的统一培训，并对登记员的指导手册做了编纂，以此系统地介绍SEER规划进行中各方面必须遵守的规定^[4]。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。

注册

找回密码

基于大型肿瘤数据库的数据挖掘研究文献综述

您可能感兴趣的文章

登录

您可能感兴趣的文章