近日,法国国家研究中心的Rainer Waldmann团队在bioRxiv在线发表了一篇题为“高通量、纠错纳米孔单细胞转录体Ome测序”的研究论文。在本研究中,报道了一种将纳米孔测序技术与UMI和10xGenomics单细胞分离系统相结合的方法,以获得纠错的全长序列信息。这种方法使得在单细胞水平上检测差异RNA剪接和RNA编辑成为可能。
单细胞RNA测序是分析细胞间异质性的关键技术。目前基于微流控技术的高通量scRNA-Seq方法可以快速分析数千个细胞,但二代测序的短阅读长度缺乏深入理解细胞间异质性的关键信息,如选择性剪接、嵌合转录物、序列变异等。长长度测序技术可以克服上述限制,但PacBio的低吞吐量导致转录组数据覆盖不足,限制了高表达转录本的分析。与上述两种测序方法相比,纳米孔测序可以产生足够长度的数据用于转录物分析,其较高的单碱基错误率使得单细胞测序中细胞条形码和唯一分子标识符的识别具有挑战性。
在这项研究中,我们报告了一个策略,将cellBC和UMI分配给纳米孔读取高效可靠。首先通过Illumina对10xGenomics文库进行测序,为每个基因和基因组区域定义相关cellBC,然后为每个细胞、基因或基因组区域定义相关UMIs组合。然后,上述信息被用来指导cellBC和UMI被分配到已经与基因组对齐的纳米孔阅读。
图1 CellBC和UMI分配策略
研究人员使用10×Genomics制备了190和951个E18小鼠脑细胞库,然后分别用Illumina和Nanopore测序。UMls分子条形码可以将嵌合cDNA被错误注释为新转录物的风险降至最低。然而,先前的研究未能在单细胞纳米孔测序中使用UMls。在这项研究的UMl分配策略中,97.4%的UMI被分配给76%的已识别cellBC的纳米孔读取。纳米孔数据集中也发现了第二代测序鉴定的单细胞中75%的UMIs和82%的基因,纳米孔和第二代测序的基因表达相关性也很好。因此,该策略中cellBC和UM1指定的纳米孔数据集很好地代表了10xGenomics方法捕获的转录组。
图2纳米孔单细胞转录组测序。细胞条形码和UMI分配策略;细胞条形码和UMI分配的效率和准确性;Illumina和纳米孔数据集的UMI测序深度;通过Illumina和纳米孔测序检测1141个细胞的基因数和UMIs数,Illumina和纳米孔测序数据之间的基因表达相关性;Illumina基因表达和纳米孔转录异构体表达的T-SNE图。
通过纳米孔和第二代测序确定的E18小鼠大脑中典型细胞类型的T-SNE模式显示出相似的聚类。研究人员进一步发现了139个基因,这些基因在集群中有不同的转录异构体表达。例如,网格蛋白轻链A在神经元成熟过程中经历了明显的异构体转化,异构体转化可能会微调该蛋白在不同发育阶段的作用。
研究人员通过对同一UMI的读数进行分组来纠正纳米孔测序错误,为每个核糖核酸分子生成一致的序列,并在单个细胞中鉴定出这种序列异质性。通过对Gria2修正序列的分析,证实了以往关于Gria2编辑的发现,揭示了编辑一个网站增加了编辑另一个网站的可能性。因此,单细胞长阅读测序不仅证实而且拓展了以前关于中枢神经系统Gria2编辑的知识。
图3纳米孔单细胞转录组测序显示转录物的多样性。T-SNE图显示了神经元成熟过程中Clta亚型的表达转换。将两个UMIs的主要Clta剪接变体与支持的基因组读数进行比较;;Gria2的主要剪接变体;R/G A->I编辑位点扩增;Q/R and R/G编辑;在神经元成熟过程中,R/G位点A-> I编辑的扩展会增加。
综上所述,将高通量纳米孔测序与UMI引导校正相结合,不仅可以高置信度地定义转录异构体,还可以识别单个细胞中的序列异质性。利用UMIs进行单细胞纳米孔测序,将促进RNA剪接、编辑和印迹的高通量单细胞研究,也将成为进一步研究肿瘤异质性的有价值的工具。
自成立以来,希望集团致力于将三代测序技术应用于服务。自2017年牛津纳米孔测序平台成立以来,开展了基于纳米孔测序技术的研发,先后突破了ONT超长测序、ONT微数据库建设、ONT全长转录组测序等前沿技术。希望集团将继续深化纳米孔测序技术,为全球客户提供快速高效的纳米孔长读长测序服务!
参考文献:
Lebrigand K,Magnone V,Barbry P,等。高通量,纠错的纳米孔单细胞转录组测序。bioRxiv,2019: 831495。