基因差异表达分析若干方法及在癌症基因组学中的应用研究文献综述

 2023-01-01 21:28:04

开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)1. 选题背景正确识别特定条件之间的差异表达基因(DEGs)是理解表型变异的关键。

在过去的几十年中,DNA微阵列成为这种分析中最重要和使用最广泛的方法,然而最近出现的高通量转录组测序(RNA-Seq),能够以前所未有的分辨率测量和比较基因表达模式,已成为这些研究的主要选择。

随着测序成本的降低,可以想象RNA-seq在差异表达分析中的使用将迅速增加。

2. 课题目的RNA-seq数据的差异表达分析领域仍处于起步阶段,新方法不断出现。

到目前为止,关于哪种方法在特定情况下表现最好,在已经公布的方法之间几乎没有广泛的比较,没有普遍的共识。

在本课题中,通过对4种基因差异表达分析方法(limma ,SAMseq ,DESeq2 , edgeR)在R框架内进行比较, 旨在评价在不同癌症数据条件下,不同方法的差异及共性。

3. 主要研究内容(提纲)利用TCGA数据库或ICGC数据库中的同一癌症数据,下载基因表达数据,通过对其使用不同的基因差异表达分析方法(本文所使用的分析软件包有limma ,SAMseq ,DESeq2 , edgeR)进行分析,从而比较这些软件包的易使用性,灵活性等差异和优劣。

4. 研究方法基于真实的癌症基因表达数据,先将样本数据归一化,目的是最小化基因长度和总样品RNA组成的影响,使得归一化读取计数作为靶向基因表达水平的直接反映。

第二,对计数数据用泊松分布(负二项式(NB)模型)进行建模,之所以使用NB模型,是因为对于测序数据来说,读数的变异通常远大于平均值。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。