Binning指将宏基因组测序得到的混合了不同微生物的序列reads或序列组装得到的contigs或scaffolds按物种分开归类的过程。这些分开归类的序列被称为宏基因组组装基因组(metagenome-assembled genomes,MAGs)。
宏基因组测的是一个环境中的全部微生物的基因组信息,以获得群落中全部的物种信息和功能信息,而Binning可以把宏基因组数据中来自同一菌株的序列聚到一起,得到一个菌株的基因组,对不同的菌株进行分类鉴定。Binning分析使我们得以洞察这些无法在实验室培养获得的菌株的生态适应机制、营养互作机制和新陈代谢功能等,可以研究在环境中起重要作用的微生物、进化机制、及其与宿主的互作机制等。
与常用数据库(NR、KEGG、eggNOG、CAZy、CARD)进行比对,获得基因功能信息并对各数据库注释情况进行统计。
对高质量Bin去冗余后得到的结果进行de novo基因预测,分别得到编码基因、重复序列、tRNA及rRNA基因信息。
根据基于聚类的序列类型的不同,可分为reads binning, contig binning和 genes binning。