分享人:纪之琳
分享时间:2023.2.8早9:00
地点:线上会议
参与人:王琪、师高翔、高启超、武莉、刘格良、薛佳、郑超越、程灵婧、冯爽、孔腾、孙翔飞、李渊、陈浩然、常敏静、王灿、薛丹阳、黄泰、纪之琳、齐荣煊、李晨龙、郭仟禧、何田田、樊芙蓉、龚万里、张书贤、莫状、侯雅琪、吴静等60余人
主要内容:核糖体数据库项目(RDP)分类器是一种朴素的贝叶斯分类器,可以快速准确地将细菌16SrRNA序列分类为Bergey的原核生物分类大纲中提出的新的高阶分类法。它提供从域到属的分类分配,以及每个分配的置信度估计。大多数分类(98%)具有高估计置信度(≥95%)和高精度(98%)。除了使用Bergey大纲中的5,014种菌株序列的语料库进行测试外,RDP分类器还使用NCBI分配给其替代高阶分类法的23,095个rRNA序列语料库进行测试。对两个语料库的测试结果表明,近全长和400碱基片段在所有置信水平下的总体准确性为89%或更高,直到属水平,大多数分类错误似乎是由于当前分类法中的异常造成的。对于较短的rRNA片段,例如可能由焦磷酸测序产生的片段,错误率在16S rRNA基因的长度上变化很大,V2和V4可变区域周围的片段给出最低的错误率。
总的来说,RDP 分类器既适用于单个 rRNA 序列的分析,也适用于数千个序列的文库分析。另一个相关工具RDP文库比较旨在促进基于16S rRNA基因序列文库的微生物群落比较。它将 RDP 分类器与统计测试相结合,以标记样本之间差异表示的分类群。