在现代分子系统学研究中,最大似然法和贝叶斯分析是两种文献中最为主要的构建系统发育树的两种方法。在构建系统发育树之前,研究人员一般都需要对比对后的多条基因序列进行最优进化模型选择。目前,通常使用的模型选择软件,如ModelTest等,其实包含似然比检验(LRT)、赤池信息标准(AIC)和贝叶斯信息标准(BIC)等多种选择模型的统计标准。对于研究者来说,具体采用哪种统计标准最后选出进化模型往往是一个让人困惑的问题。
因此,为了更好地理解不同选择标准的行为特点,从而方便众多研究者的应用,新研究针对广义时间可逆模型(GTR)中24个基本的模式,共计模拟了33600个数据。就分层似然比检验(hLRT)、赤池信息标准(AIC)、贝斯信息标准(BIC)和决定理论(DT)等四种现有的主要标准,分别对这些数据进行模型选择,并继而分析了不同标准的准确性、精确性、差异度和选择偏向性。结果表明,BIC和DT具有较高的准确性和精确性,因此判断它们是目前最佳模型选择标准。另外,结果显示,对于同样的数据不同的选择标准经常选择出不同的最优模型;其中hLRT和AIC的差异度最高,而BIC和DT之间的差异度则最小。选择偏向性结果表明:当真实模型含不变异位点这一参数时,hLRT的选择准确性较差;而BIC和DT则总是呈现相似的选择偏向性。总之,研究表明,在做模型选择分析时,BIC和DT应该作为首选的统计标准。结合模型适度检验,依据BIC和DT的选择模型理应能促进分子系统及相关研究的可信性。
|