外显子组是一个物种基因组中所有外显子区域的总和。外显子组测序是指利用序列捕获或者靶向技术将全基因组外显子区域DNA富集后再进行高通量测序的基因组分析方法。该方法能够获得指定外显子捕获平台探针设计区域及侧翼200bp序列的遗传信息,极大的提高了人类基因组中外显子区域的研究效率,显著降低了研究成本。在人类基因中大约有18万外显子,占人类基因组的1%,约30Mb。人类基因组的蛋白编码区大约包含85%的致病突变。外显子组测序主要用于识别和研究与疾病、种群进化相关的编码区及UTR区域内的结构变异。
肺腺癌和肺鳞状细胞癌体细胞基因组变化的不同模式
Distinct patterns of somatic genome alterations in lung adenocarcinomas and squamous cell carcinomas
肺癌是全球最常见的癌症,死亡数量居首。每年有超过500万例肺癌登记,其中85%属于非小细胞肺癌。这种类型的肺癌,主要是由两个亚型代表:肺腺癌和肺鳞状细胞癌。它们可能起源于不同的环境因素或生物过程,但吸烟并不总是主要原因。近来很多组学方法被用于区分诱发肺腺癌和鳞状细胞肺癌的司机突变(driver mutations)和癌症引起的基因组不稳定所造成的乘客突变(passenger mutations),从而鉴定出新的肺癌相关基因。
本研究主要结果如下:
1.利用安捷伦SureSelect外显子组包来捕获肿瘤和正常肺癌样本的蛋白质编码区域,然后通过Illumina双末端配对序列进行测序。基于阵列的拷贝数型分析和免疫原性预测,对660名肺癌患者和484名鳞状细胞癌患者进行肿瘤样本和正常样本外显子组测序。
2.统计学分析检测到很多显著突变基因,但只有极少数突变基因在两个肺癌亚型中重复出现。这表明靶向治疗需要随着亚型的不同而改变。每个肿瘤亚型中大约一半肿瘤会表达几种不同的抗原决定簇,而这些抗原决定簇有利于免疫治疗。
3.肺癌中发现高突变的38个基因,这其中包括PPP3CA,DOT1L和FTSJD1等疾病的以往研究中未曾发现的几个突变基因。对于肺鳞状细胞癌,发现了20种显著突变基因,包括RASA1。在此之前,一直没有人发现RASA1与这种亚型之间的联系。
4.在47%的肺癌和53%的鳞状细胞癌中,发现了五个抗原决定簇。
部分结果展示:
为了鉴定新的遗传变异,比较了肺腺癌和肺鳞状细胞癌的体细胞特征,共研究了660个肺腺癌-正常样本对和484个肺鳞状细胞癌-正常样本对的外显子序列。和之前的研究一致,肺腺癌的突变率中值为每Mb8.7个,肺鳞癌的突变率中值为每Mb9.7个。肺腺癌中共鉴定出38个显著突变基因,肺鳞癌中共鉴定出20个显著突变基因。只有TP53, RB1, ARID1A, CDKN2A, PIK3CA, NF1六个基因在两种肿瘤中都高突变。其中TP53,CDKN2A,PIK3CA在肺鳞癌中的突变率更高。42个扩增的位点只有11个在两种肿瘤中不同,50个缺失突变只有13个在两种肿瘤中不同。
图1. 肺腺癌和鳞状细胞肺癌之间的显著突变基因谱不同
Campbell, J.D., et al., Distinct patterns of somatic genome alterations in lung adenocarcinomas and squamous cell carcinomas. Nat Genet, 2016. 48(6): p. 607-16.