Hits:
Indexed by:Journal Papers
Date of Publication:2020-01-01
Journal:大连理工大学学报
Volume:60
Issue:1
Page Number:69-74
ISSN No.:1000-8608
Key Words:广义线性模型 主从模型 组蛋白修饰 基因表达
Abstract:组蛋白修饰是生物体中普遍存在的一种现象,能够以不同的调控方式影响基因表达,且随着高通量测序技术的飞速发展,大量的测序数据使得探究组蛋白修饰信号与基因表达水平之间的内在联系成为可能.由于基因表达数据存在零膨胀现象,提出了一种基于广义线性模型框架的主从模型,能够以较高精度从组蛋白修饰信号预测基因表达水平.首先通过人类全基因组注释文件中的基因位点信息,筛选出包含完整基因位点信息的表达数据;其次,根据基因位点信息,定位并提取出组蛋白修饰数据中基因特定位点的特征信息,构建设计矩阵;最后结合响应变量数据零膨胀的特点,构建主从模型,以GM12878细胞系为例,与现有的多种回归算法进行对比,验证了所提模型的有效性.