本站小编为你精心准备了伐昔洛韦水解酶基因的分析参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
《基因组学与应用生物学杂志》2015年第四期
1结果与分析
1.1VACVase-like理化性质的分析利用Protparam在线软件分析植物VACVase-like基因的蛋白序列(表1),植物14个氨基酸残基数目除了甜瓜MELO3C009679P1的398个氨基酸外,均在440以上,拟南芥的分子量最大,为56.2111kD,甜瓜MELO3C009679P1分子量最小,为44.7561kD,分析其稳定性发现除了可可树稳定以外,其余均为不稳定的蛋白,黄瓜的VACVase-like蛋白最不稳定为51.30%,稳定指数>40%不稳定。对所有的VAC-Vase-like蛋白的总疏水性进行分析,发现除了葡萄、可可树、草莓正值外。其余均为负值,然而他们的值都在-0.2~+0.12之间均为两性氨基酸,研究报道认为数值介于-0.5~+0.5主要为两性氨基酸(付海辉等,2010),说明这三种植物的VACVase-like蛋白是疏水性蛋白。
1.2植物VACVase-like氨基酸序列系统发生树的构建与分析为了研究基因之间的进化关系,植物14个VAC-Vase-like基因的系统进化树的构建采用距离依靠法(distancemethods)中的邻位相接法(neighbor-Joining,NJ)方法,对VACVase-like蛋白进行序列的比对分析,通过自举法分析(bootstrapanalysis),当Bootstrap的经验值越大,越接近于初始设定的重复抽样次数,即可信度就越高(马勇等,2014)。分析结果表明,自举法分析的期望值在每个节点上都较高,这很可能是VAC-Vase-like家族成员之间的氨基酸序列在进化过程中高度保守所导致的,而进化树的可靠性通过独立元素法(discretecharactermethods)中的另外一种构建法,即最大简约法(maximumparsimonymethods,MP)构建的进化树进行验证。并通过MEGA5.10软件构建系统发生树(图1),通过综合分析可进一步获知,在物种进化的过程中,在功能分化上的VACVase-like基因家族是高度保守的,在进化分析过程中,拟南芥(AT1G64670)、甜瓜(MELO3C009679P1)与其他植物的进化上的亲缘关系较远,进化初期便发生了分歧,但是各分支内仍然有物种内独特的旁系同源基因。桃和草莓、大豆和鹰嘴豆、番茄的两个蛋白以及黄瓜和甜瓜的蛋白在进化过程中高度保守,在进化上的亲缘关系最近。
1.3VACVase-like亲/疏水性的分析通过蛋白质的亲水性和疏水性值的分析,可预测蛋白质表面的氨基酸残基的分布。利用ProtScale在线工具对植物14个VACVase-like氨基酸序列的亲水性和疏水性进行预测,结果如图2所示。蓖麻和拟南芥蛋白的异亮氨酸有最高值为4.5,表明其疏水性最强,精氨酸的最低分值为-4.5,表明其亲水性最高,亲疏水性氨基酸分布均匀。经整体分析,蓖麻和拟南芥蛋白存在明显的疏水区和亲水区,用同样的方法分别对黄瓜、葡萄、可可树、毛果杨、桃、草莓、大豆、鹰嘴豆、番茄和甜瓜等植物的亲疏水性进行分析,结果表明这几种植物均存在明显的疏水区和亲水区(其它几种植物的图片分析结果未显示)。
1.4VACVase-like信号肽及导肽的预测和分析信号肽是新合成多肽链中用于指导蛋白质的跨膜转移的N-末端的氨基酸序列,由15~30个氨基酸组成。一个为带有正电的碱性氨基末端及带有负电荷的C较长末端,其含小分子氨基酸,是信号序列切割位点,而信号肽的主要功能区一段能够形成d螺旋结构疏水序列。在信号肽的引导下,新合成的蛋白质进入内质网腔,而信号肽序列则在信号肽酶的作用下被切除(王汉屏,2008)。利用SignalP4.1Server在线软件,使用神经网络(NN)和隐马尔可夫模型(HMM)两种分析蓖麻和拟南芥氨基酸序列的信号肽所在位置,结果见图2。拟南芥和蓖麻的max.C、Y值都是YES,并且预测存在信号肽的可能性分别为0.671、0.468和0.510,并且存在明显的酶切位点,预测可能属于分泌蛋白,其它植物的VACVase-like氨基酸序列采用同样的方法对进行分析,结果显示均含有信号肽结构,推测可能属于分泌蛋白。导肽是新生蛋白N-端一段大约20~80个氨基酸的肽链,又称转运肽(transitpeptide)或导向序列(targetingsequence),它是游离核糖体上合成的蛋白质的N-端信号。主要是带正电荷的碱性氨基酸(特别是Arg和Lys)含量较为丰富,具有较强的穿透组织和细胞膜的能力,将肽链准确的定位在某一个组织上或者细胞的细胞器上是其主要功能(金元昌等,2008)。因此,通过导肽的预测,对蛋白质的功能分析、作用机制和亚细胞定位具有一定的意义。利用targetP1.1server(Nielsenetal.,1997;Emanuelssonetal.,2000;2007)在线软件对蓖麻和拟南芥氨基酸序列进行预测,结果如图3所示。结果表明,蓖麻VACVase-like存在导肽结构,定位于分泌途径其预测值为0.520,且可信度为5级,拟南芥VACVase-like存在导肽结构,定位于分泌途径其预测值为0.901,且可信度为3级(可信度区分1:diff>0.800;2:0.800>diff>0.600;3:0.600>diff>0.400;4:0.400>diff>0.200;5:0.200>diff),CmVACVL02为分泌途径信号肽的可能最大。
1.5VACVase-like跨膜结构域的预测和分析跨膜结构域(transmembranedomain,TM)是由20个左右的疏水氨基酸残基形成琢螺旋,与膜的脂双分子层的疏水区域相互作用,将跨膜蛋白锚定在细胞膜中形成跨膜通道(翟中和等,2007)。通过TM-pred和TMHMMServerv.2.0在线软件同时预测拟南芥和蓖麻VACVase-like和人VACVase氨基酸序列的跨膜结构域,再利用TMHMMServerv.2.0在线软件进行证明结果的准确性。结果显示(图4),拟南芥(NP_194145)含有四个跨膜螺旋,第一个跨膜螺旋从16~40位氨基酸,由膜外到膜内;第二个跨膜螺旋从219~242位氨基酸,由膜内到膜外;第三个跨膜螺旋从291~308位氨基酸,相由膜外到膜内;第四个跨膜螺旋从347~365位氨基酸,由膜内到膜外。蓖麻VACVase蛋白同样含有四个跨膜螺旋,第一个跨膜螺旋从22~40位氨基酸,由膜外到膜内;第二个跨膜螺旋从199~221位氨基酸,由膜内到膜外;第三个跨膜螺旋从326~344位氨基酸,由膜外到膜内;第四个跨膜螺旋从347~365位氨基酸,由膜内到膜外。对其它植物VACVase-like蛋白序列进行分析,结果如表2所示。通过证明跨膜结构域存在也证实了信号肽存在的可能性。1.6亚细胞定位预测和分析亚细胞定位是指某种蛋白或表达产物在细胞内的具体存在和发挥功能的部位。利用WoLFPSORT(Hortonetal.,2007)在线分析软件对植物VAC-Vase-like蛋白的亚细胞定位进行预测和分析,结果表明,拟南芥(AT1G64670)的质膜得分8.0,拟南芥(NP_194145)在各组织中的分值较低,蓖麻的胞质和叶绿体的分值分别为5.0和4.0。番茄(XP_00424-4657)的在质膜得分10.0,桃的在细胞核的得分9.0,草莓的在胞质的得分9.0,其它在各组织中的分布预测结果如图5所示。分析结果表明,VACVase-like蛋白在不同植物中存在和发挥功能部位均不相同。
1.7蛋白质二级结构的预测和分析蛋白质的多肽链的主链骨架依靠羰基和酰胺基团之间形成的氢键作用,盘曲折叠,形成有规律的空间排布,形成比较稳定的二级结构,进一步加工形成有活性的特定构象。常见的二级结构有琢-螺旋和茁-折叠,另外还有茁转角、延伸链和无规则卷曲。VACVase-like蛋白的二级结构本文利用CFSSP(chou&fasmansecondarystructurepredinctionserver)(ChouandFasman,1974a;1974b)在线软件进行预测,通过预测结果的分析,琢-螺旋、茁-折叠、无规则卷曲和茁转角是蓖麻和拟南芥VACVase-like蛋白的组成元件,而琢-螺旋和茁-折叠是最主要的构成元件。对其它植物的VACVase-like蛋白的二级结构采用同样的方法进行预测,通过预测结果可以看出,该蛋白家族在二级结构的构成元件上比例大致相似,说明VACVase-like基因编码的蛋白质家族的二级结构和功能上具有一定的相似性。
1.8植物VACVase-like蛋白的三级结构的预测和分析蛋白质三级结构是指蛋白质分子处于它的天然折叠状态的三维构象,是在蛋白质二级结构的基础上进一步盘绕,折叠形成紧密的立体空间结构。随着蛋白质结构数据库中数据量的增多,利用信息学的方法对蛋白质的高级结构进行预测和分析,对理解的结构及功能具有一定意义,一般采用从头算法(abinitio)、线串法(threading)和同源建模(homologymodeling)3个计算方法,对蛋白质分子的三维结构进行初步模拟。利用Swiss-ModelWorkspace在线分析工具(Schwedeetal.,2003;Guexetal.,2009;Johans-sonetal.,2012),对拟南芥和蓖麻的VACVase-like蛋白的三级结构进行同源建模(图6),并应用Swiss-Pdb-Viewer(DeepViewv4.1)软件显示,结果表明,与人VACVase蛋白三级结构比较发现,蓖麻和拟南芥VACVase-like蛋白预测C-末端是一个典型的琢/茁水解酶的折叠结构,其中心的茁片层是由一组8个折叠股构成的,茁片层的两侧则分布有五个和六个的琢螺旋,N-端部分的氨基酸残基同样也参与琢/茁水解酶折叠结构域的形成,折叠结构是琢/茁水解酶超家族的典型的结构特征,琢/茁水解酶折叠的三个结构域区域都可以插入整个结构域或者一些片段,也可以相应的进行延长。从同源建模的结果得知,蓖麻和拟南芥VACVase-like蛋白氨基酸序列与参考蛋白的氨基酸序列的同源性较高均在50%以上,所得到的建模结果的准确性均较高。拉氏构象图(theramachandrandiagram)主要是鉴定蛋白质的构象的合理性。对于一个三肽来说,当中心肽基处在所有渍角和鬃角值时计算非键合原子间的允许距离,通过在线软件Swiss-PdbViewer分析预测的结果,通过分析Psi(鬃)角和Phi(渍)角的分布,可大致的评估模拟的结构域与自然结构的相同程度及合理性。图7中的黄色区域是最理想的Phi(渍)角和Psi(鬃)角分布区域,而蓝色区域外部则表示不合理区域(琢表示琢-螺旋,L琢表示左旋琢-螺旋,茁表示茁-折叠,pp域表示聚脯氨酸域)。预测的蛋白质的空间结构较是否稳定取决于蛋白质残基的二面角(>90%)是否都位于黄色区域,如果预测的二面角均在黄色区域内,则同源建模的结果相对可靠。
1.9植物VACVase-like蛋白的保守序列分析利用在线工具MEMESuiteversion4.7.0(BaileyandElkan,1995)分别对植物VACVase-like蛋白进行了基序(motif)分析,在每个VACVase-like蛋白质中分别得到5个保守基序(表3),N-端在不同植物中进化变异性较高,但N-端的氨基酸残基也参与形成琢/茁水解酶折叠结构域,C-端则高度保守,是一个琢/茁折叠水解酶典型结构,且每个植物的保守区的位置基本相同(图8;图9),表明该基因家族在进化过程中高度保守,说明VACVase-like基因家族在生物体中具有十分重要的作用。甜瓜(MELO3C009679P1)基序motif2和motif4在进化过程中缺失,可能在功能上有冗余。随着选择压力的减小,每个基因积累各自不同的遗传和变异,从而形成结构和功能不同的新基因。
2讨论
VACVase在动物体内的肝脏、肾脏中表达量极高,而在心脏、肠道及骨骼肌中表达量极弱,证明该酶具有重要的解毒功能,对其特异性分析表明VAC-Vase是一个高度特定的氨基酸酯水解酶,但在植物体内的功能尚不清楚。本文通过生物信息学软件和在线分析工具,对蓖麻、黄瓜、葡萄、可可树、毛果杨、桃、草莓、大豆、鹰嘴豆、番茄、拟南芥和甜瓜等植物的VACVase-like蛋白进行分析。结果显示,其稳定性发现除了可可树稳定以外,其余均为不稳定的蛋白,其中黄瓜的VACVase-like蛋白最不稳定为51.30%,研究认为,不稳定指数>40%,说明该蛋白为不稳定。该蛋白家族除了甜瓜和人均含有信号肽结构,而VACVase-like基因编码的蛋白存在导肽和跨膜结构,跨膜螺旋数目在3~5之间,也证明了信号肽结构的存在。在系统发生分析过程中,多数蛋白在进化上高度保守,且各分支上都存在直系同源关系,但是在各自的进化分支上仍然发现有物种内的独特的旁系同源基因,可能在进化演变过程发生了独立的基因重复事件,基因重复在演化过程中扮演重要角色,它与物种的分化、生物体基因组大小的进化、新基因的产生等都密切相关。从而产生了旁系同源基因,并且在功能上,由于进化提供了较合适且更多的选择位点,当基因重复事件发生后,只要有一个基因是正常发挥功能,这些基因的复制品通常可幸免于选择压力或选择压力就会大大减少,当重复基因积累到一定程度便获得新的功能,而且也是新基因产生的重要途径之一(Forceetal.,1999)。桃和草莓、大豆和鹰嘴豆、番茄的两个蛋白以及黄瓜和甜瓜的蛋白在不同物种间而进化过程中则高度保守,在进化上的亲缘关系最近。可能是由同一祖先进化而来,但在物种分化后,在不同的选择压力下序列发生了不同方向的进化。虽然VACVase-like蛋白都属于琢/茁折叠水解酶,导致在亚细胞中的定位存在一定的差异主要与其所处的空间位置和功能相关。高级结构分析表明,所有植物VACVase-like蛋白都由琢-螺旋、茁-折叠、茁转角和无规则卷曲所组成且琢-螺旋和茁-折叠是主要的构成元件,三级结构中VAC-Vase-like蛋白C-末端是一个典型的琢/茁水解酶的折叠结构,其中心的茁片层是由一组8个折叠股构成的,茁片层的两侧则分布有五个和六个的琢螺旋,N-端是一个茁推进器结构,大约10~30个氨基酸残基组成,该茁推进器结构也参与形成琢/茁水解酶折叠结构域,折叠结构是琢/茁水解酶折叠超家族的典型的结构特征。
3材料与方法
3.1数据来源选择一个含有典型DUF1234/ABHYDROLASE-1结构域的蓖麻(ACCESSION:XP_002518915)和拟南芥(NP_194145)蛋白序列作为探针序列,在NCBI(NationalCenterForBiotechnologyInformation通过blastp检索蛋白数据库,选择E臆10-10的序列为候选蛋白,再利用SMART(smart.embl-heidelberg.de/)在线软件预测这些候选蛋白质的DUF1234/ABHYDROLASE-1结构域,若存在DUF1234/ABHYDROLASE-1结构域则认为该蛋白属于琢/茁折叠水解酶家族的类伐昔洛韦水解酶,最终确定,黄瓜(XP_004143839)、葡萄(XP_002279898)、可可树(EOY23882)、毛果杨(XP_0-02304581)、桃(EMJ10313)、草莓(XP_004309537)、大豆(XP_003535395)、鹰嘴豆(XP_004495509)、番茄(XP_004244657,XP_004245454)、拟南芥(NP_194145,AT1G64670)、甜瓜(MELO3C005787P1,MELO3C00-9679P1)和人(NP_004323)。
3.2类伐昔洛韦水解酶的生物信息学分析应用Expasy数据库中的Protparam软件分析预测候选蛋白的理化性质包括:氨基酸数目、分子量、理论等电点、分子式、消光系数、脂肪系数等。氨基酸的同源比对及构建进化树应用MEGA5.10软件分析。Protscale软件预测其亲水性,采用SMART在线软件预测蛋白质的保守结构域,SignalPV2.0.b2预测可能的信号肽,TargetP1.1Server预测可能的前导肽,跨膜结构域的预测应用TMHMMServerv.2.0和Tmpred在线工具进行。二级结构预测由数据库中的CFSSP(chou&fas-mansecondarystructurepredinctionserver)进行,三级结构由Swiss-Model进行同源模块的构建,再用swiss-pdbviewer计算得出拉氏构象图(Ramac-hand-ran),以检验其合理性。利用在线工具MEMESuiteversion4.7.0分别对植物VACVase-like蛋白进行了基序分析。作者贡献巴德仁贵完成论文构思、数据分析和写作;李爽、王绍萌和马勇参与论文的分析和修改;哈斯阿古拉是项目的支持人,完成论文的修改和最终定稿。致谢本研究由内蒙古自治区高等学校创新团队发展计划(No.NMGIRT1401)资助。
作者:巴德仁贵李爽王绍萌马勇哈斯阿古拉单位:内蒙古大学生命科学学院/内蒙古自治区牧草与特色作物生物技术重点实验室,