本站小编为你精心准备了人IDE基因启动子生物信息学探讨参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
摘要:对人ide基因启动子进行生物信息学分析以获得人IDE基因启动子、CpG岛及转录因子结合位点特征.从UCSC基因组数据库成功获得人IDE基因5’调控区2000bp序列.Promoter2.0、FPROM、NNPP预测人IDE基因分别有3个、2个、6个启动子.Relativeprofilescorethresh-old选择80%、85%、90%、95%、100%时,JASPAR预测该序列存在5170、1771、454、87和5个可能的转录因子结合位点.Relativeprofilescorethreshold选择80%,搜索到6个潜在的TCF7L2转录因子结合位点.采用进化足迹法,LAGAN预测方法获得位于人和小鼠同源IDE基因启动子保守区域相同位置的转录因子结合位点为14个,包含转录因子SPI-1、cap、c-FOS、FREAC-3、c-ETS、Cdxa、HSF2等.发现一个CpG岛,位于1303~1705bp之间,大小为403bp.人IDE基因启动子、CpG岛及转录因子结合位点的生物学信息学分析,为下一步基因表达调控实验奠定了基础.
关键词:生物信息学分析;IDE基因;5’调控区;转录因子;启动
子胰岛素降解酶(insulindegradationenzyme,IDE;EC3.4.24.56),又名胰岛素酶、胰岛素蛋白酶,是一种非典型的M16A亚家族锌金属蛋白酶,水解生物医学中几个重要的中等大小的肽底物,包括胰岛素、胰岛素样生长因子-2、胰高血糖素、胰淀素和β淀粉样蛋白,并具有调节功能:调节蛋白酶体活性、激素受体活性、过氧化物酶体脂肪酸氧化、细胞的生长发育.胰岛素降解酶参与阿尔茨海默病(AlzheimerDisease,AD)、2型糖尿病(Type2Di-abetes,T2D)的发病机制,也被鉴定为水痘-带状疱疹病毒感染和细胞扩散的细胞受体.2型糖尿病由渐进性β细胞功能障碍、胰岛素分泌不足,或胰岛素抵抗引起[1-3].在疾病早期阶段对2型糖尿病患者进行胰岛素短期强化治疗是近年来被关注的一项策略[4-5].胰岛素降解酶通过降解胰岛素的机制来控制体内循环胰岛素水平.胰岛素降解减少使循环的空腹和外周胰岛素水平长期升高,进一步加剧胰岛素抵抗.因此,胰岛素降解酶是治疗2型糖尿病的潜在的药物靶标[6-7].目前对于人IDE基因表达调控的机制还缺乏了解,用生物信息学的方法对基因的启动子进行预测和分析可以加快基因调控机制和发病机制的研究进程.本研究利用生物信息学软件对人IDE基因核心启动子区域、CpG岛、转录因子结合位点进行生物信息学分析,为人IDE基因启动子的克隆、基因的转录调控机制研究奠定了理论基础.
1材料与方法
1.1材料人IDE基因GeneID:3416,位于10q23.33,有25个外显子,6个转录变异体.变异体1编码最长的蛋白质,mRNA登录号:NM_004969.3.本研究选择变异体1作为研究人IDE基因的材料.
1.2方法
1.2.1人IDE基因5’调控区序列的获得在UC-SC网站中,以“IDE”为检索词搜索人IDE基因在基因组序列(GRCh38/hg38)中的位点.以转录起始点为界限,截取基因组序列中其上游-2000bp~-1bp共2000bp序列作为IDE基因5’调控区进行序列分析.
1.2.2小鼠同源IDE基因5’调控区序列的获得在NCBI的小鼠RefSeqRNA数据库中搜索NM_004969.3的同源序列,得到唯一序列NM_031156.3,一致性为86%,说明两者的同源性较高.NM_031156.3为小鼠胰岛素降解酶的mR-NA.按照人IDE基因5’调控区序列获得的方法获得小鼠同源基因5’调控区序列.
1.2.3启动子区预测和分析利用在线软件NeuralNetworkPromoterPrediction,Promoter2.0与FPROM对人IDE基因5’调控区中潜在的启动子区进行预测和分析.参数设置:NeuralNetworkPromoterPrediction启动子剪切值设为0.85,Promoter2.0取其默认设置,FPROM的TATA盒启动子的阈值选择0.8.
1.2.4人IDE基因5’调控区转录因子结合位点预测利用在线软件JASPAR对人IDE基因5’调控区转录因子结合位点进行预测,参数设置如下:JASPARmatrixmodelsspecies选择Homosapiens,Numberofmatrices选择200,Type选择Withineachmatrix,Relativeprofilescorethreshold选择80%、85%、90%、95%、100%.进一步采用进化足迹法分析,在CONREAL网站使用4种不同的预测方法(CONREAL、LAGAN、MAVID、BLASTZ)确定人和小鼠同源IDE基因启动子区保守的核苷酸序列,在JASPAR、Trans-facv.8.2两种脊椎动物转录因子结合位点数据库中搜索位于保守区域的相同的转录因子.参数设置如下:thresholdforPWMs设为80%,thresholdforhomology设为50%.
1.2.5人IDE基因启动子区甲基化CpG岛预测利用在线软件EMBOSS与MethPrimer对人IDE基因5’调控区进行CpG岛预测.相关参数设置为:CpG检测含量/期望含量(Obs/Exp)>0.60,GC%>50%,CpG岛长度>200bp.
2结果
2.1人IDE基因启动子分析在UCSC数据库中获得人IDE基因5’调控区2000bp序列,在染色体上的位点为:chr10∶92574077~92576076.将这2000bp序列作为候选启动子用3种启动子预测软件进行分析.Promoter2.0预测人IDE基因有3个启动子,FPROM预测人IDE基因有2个启动子.NeuralNet-workPromoterPrediction在正义链上预测人IDE基因有6个启动子.
2.2人类IDE基因5’调控区转录因子结合位点分析利用JASPAR软件对人IDE基因5’调控区转录因子结合位点进行预测,Relativeprofilescorethreshold选择80%、85%、90%、95%、100%时,获得正负链上转录因子结合位点数依次为5170、1771、454、87和5个,其中Relativeprofilescorethreshold选择100%时转录因子结合位点预测结果如表4所示.选择转录因子TCF7L2,Relativeprofilescorethreshold选择80%,搜索到6个潜在的TCF7L2转录因子结合位点.
2.3人IDE基因启动子区甲基化CpG岛预测使用EMBOSS软件对人IDE基因5’调控区2000bp序列进行CpG岛预测,结果显示有一个CpG岛位于上述序列的1433~1657bp之间,大小为225bp.使用MethPrimer软件在人IDE基因5’端转录起始点上游发现一个CpG岛,位于1303~1705bp之间,大小为403bp(图2).EMBOSS软件预测的CpG岛位于MethPrimer软件预测的CpG岛之内,说明两个软件预测的结果基本完全一致.
3讨论
人IDE基因位于10q23~q25,全长约120kb,与人IDE基因染色体区域连锁的区域被鉴定为2型糖尿病相关数量性状的基因位点.IDE基因敲除小鼠的特点是胰岛素降解降低、高胰岛素血症和葡萄糖耐受不良的糖尿病表型[8].抑制IDE基因表达会增加淀粉样蛋白在胰腺β细胞系中积聚[9].另一方面,IDE基因过度表达增加胰岛素的降解和下调胰岛素信号通路[10].IDE对胰岛素具有优先亲和力,胰岛素的存在会抑制IDE介导的其它物质降解,包括β淀粉样物质.Cook等[11]研究结果表明,IDE基因表达减少可能是阿尔茨海默病的危险因素,IDE可能与载脂蛋白E相互作用,从而影响β淀粉样蛋白代谢.IDE基因两端的多态性对IDE基因表达有相反的影响,从而导致对不同疾病易感性不同:启动子的变异增加IDE基因表达但防止阿尔茨海默病,而3’-UTR变化降低IDE基因表达并增加糖尿病风险[12].本研究用生物信息学软件对人IDE基因5’端调控区2000bp序列进行生物信息学分析,Pro-moter2.0预测人IDE基因有3个启动子,其中1400bp处为高度可能的启动子.FPROM预测人IDE基因有2个启动子,每个启动子预测到一个TATA盒.NeuralNetworkPromoterPrediction预测人IDE基因有6个启动子,每个启动子预测到一个转录起始位点,分值在0.90以上的启动子有3个.由于预测软件的原理及准确度不同,预测结果出现差异,结合预测分值以及与HPRM45827序列的比对基本可确定人IDE基因启动子位于IDE基因5’上游1900bp范围内,转录起始位点位于5’调控区2000bp序列的1982bp的G碱基处.软件预测到的序列可作为核心区域进行进一步的研究和实验验证.真核生物启动子的起始涉及许多蛋白质因子,这些因子结合到各种形形色色的顺式作用元件上.启动子含有所有这些结合位点,它们能以正常效率在适当的调控下支持转录[13].利用JASPAR软件对人IDE基因5’调控区转录因子结合位点进行预测,预测到大量的转录因子结合位点,说明人IDE基因的转录因子比较丰富,表达调控机制比较复杂.Relativeprofilescorethreshold选择80%,搜索到6个潜在的TCF7L2转录因子结合位点.TCF7L2是含有高迁移率族(HMG)盒的转录因子,在Wnt信号通路中起关键作用,与血糖稳态有关,该基因变异与2型糖尿病风险增加有关.Lu等[14]研究表明T2D组TCF7L2基因rs7903146的TT基因型的胰岛素抵抗程度较CC基因型轻.
在进化保守的启动子区域发现的转录因子结合位点相对于启动子其它区域中发现的更为可靠[15].采用进化足迹法,LAGAN预测方法获得位于序列保守区域相同位置的转录因子结合位点为14个.包含转录因子SPI-1、cap、c-FOS、FREAC-3、c-ETS、CdxA、HSF2、Thing1-E47、MZF1、del-taEF1.SPI-1转录因子在髓系和B系细胞发育过程中激活基因表达.SPI-1结合到启动子附近的PU盒上,与其它转录因子和辅助因子一起调节基因的表达.该蛋白还可以调控靶基因的选择性剪接.cap蛋白与CBL相关,它的功能是参与胰岛素信号转导与刺激.cap基因突变可能与人类胰岛素抵抗紊乱有关.研究表明cap可能参与糖尿病肾病的发生[16].c-FOS是AP-1转录因子亚基,是细胞增殖、分化和转化的调节因子.代谢通路分析表明c-FOS转录因子参与通用转录通路、糖皮质激素受体的调控网络、MAPK信号通路、cAMP信号通路.FREAC-3属于叉头域家族的转录因子.c-ETS是ETS家族的转录因子,起转录激活或抑制作用,靶基因较多,参与干细胞发育、细胞的衰老和死亡以及肿瘤发生.HSF2属于HSF家族的转录因子,特异性结合热休克启动子元件并激活转录.MZF1属于锌指蛋白Kruppel家族,与阿尔茨海默病有关[17].突变分析表明MZF1结合位点有助于基础启动子活性[18].deltaEF1是一种锌指转录因子,可能在白细胞介素2转录抑制中起作用.
该基因突变与后部多形性角膜dystrophy-3和迟发性福斯角膜内皮营养不良相关.这些转录因子涉及到髓系和B系细胞发育、Wnt信号通路、胰岛素抵抗、细胞增殖、细胞分化和转化、靶基因的选择性剪接、阿尔茨海默病的发生、肿瘤发生、热休克等通路,说明IDE基因参与的通路可能比较多.转录因子的预测还能解释一些疾病的发病机制.MZF1与阿尔茨海默病有关、而IDE也与阿尔茨海默病的发生相关,MZF1转录因子对IDE基因的转录调节是不是涉及阿尔茨海默病的发病机制还有待研究.TCF7L2与胰岛素抵抗程度有关,说明TCF7L2基因突变后可能引起IDE转录抑制导致胰岛素抵抗程度发生变化.cap基因突变可能与人类胰岛素抵抗紊乱有关,cap转录因子对IDE转录的调节可能解释这一现象.MZF1、MZF_1-4、deltaEF1、c-ETS靠近TSS,在1~150bp范围内,说明这些转录因子对转录起始有重要的作用.vanWaveren等[19]研究表明在OXPHOS基因TSS附近一些转录因子如NRF1,NRF2和YY1F显示明显的位置倾向.甲基化CpG岛通过抑制特定的转录因子结合抑制染色质活性,对于基因的转录有重要的调控作用.本研究使用EMBOSS、MethPrimer软件在人IDE基因5’调控区2000bp序列的1303~1705bp之间发现一个CpG岛,此区域的甲基化修饰对调节人IDE基因的转录起始可能发挥着极其重要的作用.
作者:鲍思元1,2;金科华2;陈红霞2;陈娇娥2;胡旺平2 单位:1.湖北科技学院糖尿病心脑血管病变湖北省重点实验室,2.湖北科技学院基础医学院