目前,构建
多序列比对模型的方法大体可以分为两大类.
第一类
基于氨基酸残基的相似性,如物化性质,残基之间的可突变性等.
第二类
主要利用蛋白质分子的二级结构和三级结构信息,也就是说根据序列的高级结构特征确定比对结果.
差别
这两种方法所得结果可能有很大差别.一般说来,很难断定哪种方法所得结果一定正确,应该说,它们从不同角度反映蛋白质序列中所包含的生物学信息.
基于序列信息和基于结构信息的比对都是非常重要的比对模型,但它们都有不可避免的局限性,因为这两种方法都不能完全反映蛋白质分子所携带的全部信息.
蛋白质序列是经过DNA序列转录翻译得到的.从信息论的角度看,它应该与DNA分子所携带的信息更为"接近".而蛋白质结构除了序列本身带来的信息外,还包括经过翻译后加工修饰所增加的结构信息,包括残基的修饰,分子间的相互作用等,最终形成稳定的天然蛋白质结构.因此,这也是对完全基于序列数据比对方法批评的主要原因.