Abstract
Nanopore sequencing based on Oxford Nanopore Technologies (ONT) and Pacific BioSciences (PacBio) single-molecule real-time (SMRT) long-read isoform sequencing (Iso-Seq) have shown great potential in detecting post-transcriptional regulation. Direct RNA sequencing (DRS) has the advantages in capturing RNA modification due to without PCR amplification which is the limitation of the next-generation sequencing (NGS). Here, we provide a comprehensive computational procedure for the quantification of RNA modification in single-base resolution based on DRS data. Moreover, we also provide procedure on the identification of alternative splicing (AS) and alternative polyadenylation (APA) based on both DRS and PacBio Iso-Seq data. The entire step was based on two packages (Nanom6A and PRAPI), which were based on Python language on Linux system.Graphical abstract: The flowchart for identification of RNA modification, alternative splicing and alternative polyadenylation based on third generation sequencing technology., [摘要]基于 Oxford Nanopore Technologies (ONT) 和 Pacific 的纳米孔测序 BioSciences (PacBio) 单分子实时 (SMRT) 长读长异构体测序 (Iso-Seq) 在检测转录后调控方面显示出巨大潜力。直接 RNA测序 (DRS) 由于没有 PCR 扩增而在捕获 RNA 修饰方面具有优势,这是下一代测序(NGS)的限制。在这里,我们提供了一个全面的计算程序,用于基于 DRS 数据以单碱基分辨率量化 RNA 修饰。此外,我们还提供了基于 DRS 和 PacBio Iso-Seq 数据识别选择性剪接(AS)和选择性多聚腺苷酸化(APA)的程序。整个步骤基于两个包(Nanom6A 和 PRAPI),它们基于 Linux 系统上的 Python 语言。关键词: 纳米孔直接 RNA 测序,PacBio Iso-Seq,RNA 修饰, N 6 -甲基腺苷,选择性剪接,选择性多聚腺苷酸化图文摘要:基于第三代测序技术的RNA修饰、选择性剪接和选择性多聚腺苷酸化鉴定流程图。[背景]转录组为理解基因表达和生长发育的调控提供了深入的视角。 随着第三代测序技术的快速发展,基于长读长测序的数据在揭示转录后调控方面具有很大优势( Smith et al ., 2019) 。转录后 调控被认为是一个复杂的生物学过程,在影响 RNA 的剪接、输出、定位和翻译方面发挥着重要作用(Keene,2007) 。例如,选择性多聚腺苷酸化 (APA) 在维持 RNA 的结构和稳定性方面起着至关重要的作用 (Di Giamartino等人,2011 年,Tian 和 Manley,2017 年) 。选择性剪接(AS) )根茎相关发育的调控 (Wang et al ., 2017)和激素反应(Zhang et al ., 2018) 。在与生物合成途径相关的关键基因中可以发现多种 AS 事件(Chen et al ., 2020) 。 PacBio Iso-Seq 可以在同种型范围内捕获全长 mRNA以分析 转录后处理事件,例如AS 和 APA (Rhoads 和 Au,2015 年) 。准确性和可靠性工具对于识别转录后事件很重要。短读平台上的AS base d可以被几个优秀的软件识别,如rMATS (Shen等人,2014 年)和 SUPPA2 (Trincado等人,2018 年) 。然而,由于转录组组装的限制,短读长平台在检测全长异构体方面表现出劣势( Rhoads和 Au,2015 年) 。 TAPIS (Abdel-Ghany et al ., 2016)和 FLAIR (Tang et al ., 2020) 已被开发用于基于长读序列识别 AS 事件。然而,TAPIS 不提供转录后事件的定量分析( Abdel -Ghany等,2016) 。 FLAIR 可以检测亚型,但缺少 APA 检测模块(Tang等 人。 , 2020) 。 因此,我们为AS 和 APA的识别和可视化提供了一个全面且用户友好的管道 (PRAPI) (Gao et al ., 2018) 。在这里,我们提供了使用基于 Iso-Seq 异构体和短读数据的 PRAPI 进行数据处理、可视化、识别 AS 和 APA 的详细程序。除了 PacBio 平台, Oxford Nanopore Technologies (ONT) 平台还应用了独特的测量方法,将 RNA 分子通过特殊孔隙的信息作为电信号保持 (Garalde等人,2018 年) , 它可以识别包括N 6 -甲基腺苷 (m 6 A) (Linder et al ., 2015; Zhang et al ., 2019) 、假尿苷(Ψ) 和 2'-O-甲基化 (Nm)在内的 RNA 修饰 (贝吉克等人,2021) 基于天然 RNA 的单核苷酸分辨率。此外,Nanopore DRS 能够确定 RNA 二级结构(Aw et al ., 2021) ,并检测天然去折叠蛋白序列中的氨基酸(Hu et al ., 2021) 。基于 ONT 数据检测 RNA 修饰的方法已在包括Epinano在内的多个软件包中报告 (刘等人,2019) , xPore (普拉坦瓦尼奇 等人,2021 年) ,MINES (洛伦兹等人,2020 年) , NanoDoc (Ueda, 2021) 、Nanom6A (Gao et al ., 2021) 、 Tombo (斯托伊伯 等人,2017) 。 Epinano 、 xPore 、Nanom6A 和 MINES 可以实现单碱基分辨率的准确度。然而,由于依赖碱基调用错误, Epinano无法将 m 6 A 与其他修饰碱基(例如 m 1 A)区分开来(Liu et al ., 2019) 。此外, xPore需要 m 6 A writer 敲除线作为比较,并且可能由于其在 DRACH 基序中的强富集而存在偏差(Pratanwanich等人,2021) 。最后,MINES 仅检测到 4 个 RRACH 基序(AGACT、GGACA、GGACC 和 GGACT),而忽略了其他 8 个 RRACH 基序(Lorenz等人,2020) 。 Nanom6A提供了使用 Nanopore 直接 RNA 读数来鉴定定性和定量 m 6 A 的方法,基于XGBoost算法以单碱基分辨率修改,提供 m 6 A 的高精度全转录组鉴定、定量和序列上下文 (RRACH )修改(Gao et al ., 2021) 。在这项研究中,我们提供了详细的程序 定量精度高 以单碱基分辨率进行 RNA 修饰。简而言之,我们提供了基于 DRS 或 PacBio Iso-Seq 数据鉴定AS 、 APA 和 m 6 A的综合程序。用于 Nanom6A 和 PRAPI 分析的 Linux Bash Shell 和脚本现已在https://github.com/GuInNGS/NanoPrapi中提供 和https://github.com/Bio-protocol/Pipeline_for_Identification_m6A_AS_and_APA_with_Long_Read 。
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have
Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.