在这个sc RNA-seq单测序数据試验中采用了4种呼吸道平滑肌肉细胞(airway smooth muscle cells),每种细胞均有 地塞米松治疗、非治疗两类共计8个样本,储存在 airway 包中
高通量测序数据常采用 FASTQ 格式来保 存所测的碱基读段和质量分数。如图 所示,FASTQ 格式以测序读段为单位存 储,每条读段占 4 行,其中第一行和的第三行由文件识别标志和读段名(ID)组成(第一行以“@”开头而第三行以“+”开头;第三行中 ID 可以省略,但“+”不能省 略),第二行为碱基序列,第四行为各碱基所对應的测序质量分数序列
eg. 外显子的染色体位置, 基因的起始、终止位点
注意这里采用了一个基因组注释文件的子集, 完整的信息可以从
上图显示的是SummarizedExperiment类(以及他的子类DESeqDataSet)的布局, 粉红色assay(se)
表示实際的数据 每行为一个基因,每列为一个样本;colData
表示样本的具体信息随后我们会对它进行填充;rowRanges
表示每一个基因的信息。具体如下
注意:此处得到的数据需要采用EDSeq2包进行差异分析所以不对数据进行标准化,切记
我们采用 DESeq2 包进行,差异表达基因的分析
# 此步采用 airway 包自带的se数据进行后续操作可以忽略。如果没有进行上面的步骤也可以直接采用下面的数据进行后续操作
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。