1引言
本文通过建立数学模型对DNA序列进行了有效的分析,对解读DNA全序列图有一定的指导意义,从而有助于解决遗传学中的人们正面临的棘手问题.
2 DNA序列分析中的数学模型
在DNA序列片段的分类问题中,所遇到的每一个DNA片段都是由少则近百多则上千万的 构成的字符串,为了研究的方便,可以按每个字符串中的 出现的频率 构成一个四维向量 .这样,不论字符串的长度是多少,每个DNA片段都能对应一个四维向量 .
3 数学建模在实例中的应用
设两个母体 ( 类)和 ( 类),他们都是三维向量,均值向量分别为 和 ,有共同的协方差矩阵,即 ,因此序列到第 个母体的距离可表示为
对给出的样品 ,要判断它来自哪个母体,先构造函数:
令 ,得判别函数
.
确立的判别规则可写成:如果 ;如果 ;若 ,则 属于非 非 类.上述式中 , , 未知.今从两类母体中各提取 个样品:
判别函数 中的 , , 分别用其估计值代替得
,
其中 ;
当样本位数 ,而假设两个分布分别为 时,判别函数 变成
.
不失一般性,设 ,此时 的符号就更取决于 还是 ,当 时判断 ,否则 .
对于 两类所对应的母体,通过样本作如下的关于母体均值的共性检验.
检验假设: 是否为真.用 统计量:
,
其中
设两个母体 和 的分布函数是 ( ).它是一个三维分布函数.在该假设为真时 ( ).当 时,即认为这 个判别因子的均位向量有显著的差异.
参考文献
[1] 刘万霖.基于微阵列数据构建基因调控网络[J].北京:科学出版社,2007,5-8.
[2] 裴新澍.遗产学发展与亲子间传递规律的数学模型[J].自然杂志出版社,2000,22(6):339-344.
[3] 张菁晶,冯晶.全基因组预测目标基因的新方法及其应用[J].遗传.2006,28(10):1299-
1305.
[4] 李秀钧.医学数学模型[J].西部医学,2007,19(1)1-2.
Abstract: This paper build mathematical model to analyze and solve problems of genetic.The subject not only widens the application field of modern mathematics,but also promotes the development of modern genetics.
Key words: Mathematical modeling;Life sciences;Genetics
【作者要求保留英文摘要和关键词,麻烦排版编辑注意保留,谢谢】作者简介:刘臣臣(1992.4-),男,河南省洛阳市伊川县,本科,黄淮学院数学科学系信息与计算科学专业,研究方向:数学建模分析