微波EDA网,见证研发工程师的成长!
首页 > 测试测量 > 测试测量技术文库 > 基于Alpha-NMF的AD样本分类及特异性基因选择方法

基于Alpha-NMF的AD样本分类及特异性基因选择方法

时间:05-25 来源:互联网 点击:

任一样本yi可以表示为:

也就是说每一个样本可以近似看做是非负矩阵X的行向量的非负线性组合,组合系数是矩阵A对应行向量的分量。把分解后的矩阵X的每一行称为一个集合基因。矩阵A的第k列为X的第k个集合基因的系数,若矩阵X能表征原始数据的局部特征,则系数矩阵A与样本类别紧密相关,即类别c1对于特征k的贡献大,而c2对于特征k的贡献小。对于每一个集合基因(图2为HIP数据经Alpha-NMF算法,α=0.5时分解后相关系数为0.97集合基因的柱状图),若元素的值相对较大,说明其对应的基因j与AD紧密相关。

3 实验结果与分析
首先采用WT-SAM方法分别对HIP和EC数据进行预处理,筛选后的基因数分别为13 587个、6 567个,再对数据进行菲负化处理,然后通过Alphs-NMF算法进行分解,利用分解后的A矩阵进行聚类,本文采用k均值聚类方法对A的行向量进行聚类,得到一聚类结果。对于矩阵X,设定一阈值,筛选出集合基因中大于该阈值的信息基因。
由于NMF算法受初值和维数r的影响,因此对每组实验分别取r=2,3,4,5时运行NMF算法20次。为了衡量由于r值选取不同导致的聚类的稳定性问题,定义了一个共表型相关系数(图3分类稳定性比较),共表型相关系数越接近于1,分类越稳定。

观察图3和图4的结果,通过比较可以发现,随着r的增加,其相关系数和分类正确率普遍降低,当r=2时,其分类稳定性和识别正确率明显高于r=3,4,5时的情况。此时,Alpha-NMF算法相比标准NMF算法具有较高的分类准确性和稳定性。尤其当α=0.5时,效果最佳。因此,选择Alpha-NMF算法α=0.5,r=2处理后的集合基因,如图2所示,选择某一阈值(此处阈值为50),可以分别提炼出268个(HIP)、172(EC)个探针表达变化具有显著差异。

4 讨论
4.1 特异性基因及其功能分类
将上节提炼出的探针号与AD基因组进行比对,共确定有320个基因为特异性基因。这些基因主要于细胞信号传导、物质代谢、物质传输等生物过程有关。
MiMI(Michigan Molecular Interactions)是国家卫生研究所疾病预防控制综合生物情报中心中的一部分。它可以提供蛋白质间的相互作用,并且利用这些数据进行融合,集合成一个复杂的网络;还能检索大量基因的生物功能。
使用MiMI对上上述特异性基因进行功能分类,其中有88基爵在GO(Gene Ontology)上没有注释,因此没有对其分类,仅对其余的232个基因进行分类,根据分类结果,主要分为以下几类:1)物质代谢过程;包括蛋白质代谢、细胞氮化合物代谢、核苷酸代谢;2)细胞周期过程,包括细胞形态发生和发展、细胞自动调节机能、生殖细胞形成;3)定位过程,包括蛋白质定位、细胞定位、大分子定位;4)细胞成分组织,包括细胞内大分子聚集、细胞膜组织以及细胞内各器官组织;5)生物合成过程,包括核苷酸合成、小分子合成;6)基因表达、转录、翻译;7)神经系统调节,包括神经元的形成、神经突触传导、神经元变异、神经传导素生成及传输;8)细胞凋亡;9)物质运输,包括ATP水解耦合质子运输、阳离子运输、胞内蛋白质运输、离子跨膜运输。上述基因功能分类如表1所示。

4.2 利用Cytoscape工具构建基因功能结构图
BiNGO是Cytoscape里的一个插件,它让Cytoscape链接到Gene Ontology,使每个基因赋予注释,构建基于目的的基因功能的结构图。
将232个特异性基因提交给BINGO,输出一幅包含123个节点和165条边的结构图,基因功能结构图中每个节点表示一个生物过程,每一条边表示生物功能间的关系。其中节点的大小表示与该过程相关的基因占232个信息基因的比例,点的颜色与p-value相关,颜色越深表示p-value越大,也就是说该节点显著过表达。如图5所示,可以发现,提取的232个基因主要在细胞周期过程、定位过程及传输过程等生物过程上显著过表达;在生物合成、代谢过程和一些与神经系统相关的生物过程也有一定程度的显著过表达。这些特异性基因有的与AB的聚集有关,有的与神经递质的传输有关或与神经元的形成发展有关,还有的与金属的代谢相关,它们都能伴随着细胞的炎症反应,导致神经元损害,引起记忆
减退和认知障碍,产生痴呆症状。

5 结论
通过以上的实验和阐述可以看出,Alpha-NMF算法较传统NMF算法具有较高的分类准确性和稳定性,算法的运算速度也有较大的提高。由Alpha-NMF算法处理后所提炼出来的特异性基因具有显著差异表达,并且它能提炼出目前确定与AD致病相关的基因(APP)。通过构建基因功能结构图,加深了对生物过程的理解,从而为生物学实验的验证提供的明确的方向。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top