前言:我们精心挑选了数篇优质生物信息学分析方法文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
关键词:高中生物 教学方法 创新性分析
一、高中生物教学现状分析
1.教师队伍教学水平有待提高
教师是生物教学活动的组织者和引导者,生物教师的知识结构、教学能力以及道德品质的优劣直接影响到学生对于生物的学习兴趣和生物教学的实际效果,随着我国生物科学的发展,以及生物学逐渐与物理学和化学等学科进行相互渗透,逐渐形成了新的知识,这一趋势扩展到高中生物教学过程中,使得高中生物教学面临着严峻的考验,不仅要求生物教师要有广博的知识,还需要有全新的教学理念和较高的教学技能。同时在通常情况下,学校教师缺乏一定的危机意识,对于生物教学的积极性不高,一些教师仍然用传统的教学观念和落后的教学方法进行生物教学,这在很大程度上导致学生缺乏学习兴趣,致使生物教学效果差。[1]
2.生物整体教学质量有待提高
生物学是一门以实验为基础的学科,故而生物教学过程中需要重视实验教学,但是目前的生物教学过程中,生物实验教学距离标准要求仍有一定的差距,比如生物教学实验场地拥挤,学生不重视实验课,实验操作误差,实验结果不能达到预期等,同时,目前我国生物教科书采取“一纲多本”的政策,在选定生物教材的过程中,学校没有充分考虑教科书的更新换代,对于教科书更新不及时,影响了对于生物知识的更新速度,因此,教师要精心选择教学材料,同时高质量的教学材料,可以有效地提高教学质量。
3.对生物学科重视程度不高
由于生物学科在高考分数比例中占得不高,导致一些教师和学生对于生物的重视程度不高,受传统应试教育的影响,高考是一些学校教学安排的指挥棒,因为生物学科所占比例较低,学生和家长认为生物是不重要的,导致不重视生物学科的教学,这就大大降低了生物教师的教学积极性,没有良好的社会氛围,学生学习生物的动机不明确,导致了学生学习生物的内部动力不足。[2]
二、提高高中生物教育创新性的建议
1.加强生物教学基础设施建设
加强生物教学软件和硬件设施建设,提高整体教学能力。由于生物科学的特殊性,教学过程中需要开展实验教学,因此,为了提高高中生物教学的整体实力,需要结合学校的实力和条件确保学生实验设施完备。同时,要充分利用多媒体工具等更方便的使用方式,有助于提高学生的学校兴趣。同时针对生物实验教学的重要性,需要加强实验室的管理,加强对生物实验教学的重视,促进生物实验课形式多样化。提高生物实验教学效率。此外,要根据生物教学需要,及时购买和更新所需的实验设备,加强对生物教学硬件设施的保管和使用,并加强对实验室的规范化管理,确保生物教学设施完备。
2.提升生物教师队伍教学水平
根据高中生物教学的具体实践,生物教师队伍的教学水平在很大程度上影响着高中生物教学的整体教学水平,提升高中生物教师的教学水平,首先,需要提高教师的敬业精神和责任感,促进教师充分认识到生物教学的重要性。其次,教师要转变角色,教师是生物教学活动的组织者和引导者,鼓励教师在备课的同时研究和了解学生的思想和行为,创新生物教学方法,提高教学质量。最后,可以采取适当的激励措施,给教师提供一定的物质奖励和精神奖励。因此,为了实现高中生物教学模式的创新,教师应不断提高学生主动学习的能力,同时,也要加强自身教学方式方法的转型升级,这将有助于教师和学生的全面发展。
3.推进生物教育方法的创新
在高中生物课堂的教学环境下,生物教师应避免采用传统的教学方法,要结合学生的不同,注重学生的差异,从帮助学生成长的高度,来创新生物教学方法。在生物教学过程中适当给予鼓励和支持,让学生有一个积极的态度和愉悦的心情投入到生物学习过程中,同时,学生们也需要发挥自己生物学校的主观能动性。教师和学生在同一时间接受生物教育,并且教师要针对学生在学习过程中存在的问题与不足,采取合理的方法使每一个学生都能积极思考,探索自己,提高学习质量和效果。同时要结合具体的发展实际来促进生物教学法的创新和发展,生物科学是自然科学的一门学科,为了提高高中生物教学的质量,教师要转变教学方式,当然与此同时看,学生也必须改变学习方法。在教学方法上,生物教师应注意采用多种教学方法,加强与学生之间的互动,充分调动学生的积极性,挖掘学生学习生物的潜能,让学生探索知识,促进学生得到全面发展。
4.激发学生学习生物的兴趣
为了提高学生对高中生物课程的兴趣,教师可以在日常的生物课堂教学过程中,将教材的课程学习内容和具体实际生活有目的的联系起来,通过生活实际来引起学生学习的兴趣,也就是通过生活中的一些生物学现象来吸引学生掌握解决问题的能力,并在这一过程中促进学生学到生物科学相关的基本知识。同时,加强生物实验课的日常学习和引导,也能吸引学生用生物知识来解决日常生活中的问题,提高学生的成就感。此外,还可以通过开展生物知识竞赛等活动,提高学生学习生物知识的兴趣,组织开展各种生物知识竞赛,可以有效地提高生物课程的教学质量,可以促进学生更好的掌握基础知识,对学生学习成绩的提高可以起到巨大的推动作用。[3]
三、结语
总而言之,结合当前高中生物教育现状,虽然高中生物教学改革取得了一定的成绩,但仍有许多需要完善和修改的地方,因此加强高中生物教学方法的创新,必须更新教学观念,树立正确教育质量观,教师要及时进行角色转换,采用现代化的生物教学方法,才能更好的促进生物教育教学质量的提高。
参考文献
[1]李伟靖.如何提高高中生物教育教学质量――以梅州市曾宪梓高中生物教育教学为例[J].教育教学论坛,2013(22).
1、根据薄弱的课程来分析
许多学生在学习中都曾经或正在遇到这样的一个问题,那就是偏科。有的程度还不明显,有的偏科差距惊人。我知道的一个学生,她在高考中语文和数学的成绩居然相差了100分,严重的偏科现象,不能不引起我们的重视。其实薄弱的课程,就是你发现问题和总结问题的切入点。成绩表现不高的科目暴露的问题势必最多,发现问题也会容易得多。对薄弱课程的解决方法通常有两种:
a、集中利用课外时间进行自我补习,遇到问题找家长、老师或网校帮助解决。如果你想取得成功,高效地达到目的,那么就一定要让自己理性一些成熟一些。面对问题,特别是学习上的问题千万不要感情为先,把兴趣爱好甚至对老师的评价牵扯到自己的学习中来,要明白自己为什么学习,要知道自己的目标,也要发现自己的问题。只有清醒理智地上路,才可能在学习的道路上披荆斩棘,取得最终的成功。抛开心理上的各种问题后,就应该开始着手补习自己的薄弱环节。其实你最先想到的不该是家教,而是自己。自己找到问题,自己解决问题,取得的效果会比依赖别人所取得的效果强很多。补习一定要利用课余的时间,千万不要把自己搞得太疲惫,对于落下的知识不要着急,如果急于求成,可能会由于过于浮躁而适得其反。另外,不要因为补习弱项而“冷落”了原本学得好的科目,要注意平衡协调,不能顾此失彼。
当然,遇到问题的时候,首先不要轻易放弃,要换几种方法思考。只有到了穷途末路,冥思苦想之后也没有结果的时候,再请教老师或者家长。毕竟自己想出来的答案,会让你体味到成功所带来的喜悦,也会记忆深刻。
b、如果课程落下太多,考虑请家教。
如果你自己补习的时候发现自己的问题太多,难以梳理,很多知识点,凭借自己看书,看笔记已经无法弄明白,自己的努力已经起不到什么作用了,那么我建议你,可以找个合适的家教。但你不要过于依赖家教,千万不要天真地以为请了家教,只要开展那些号称个性化的一对一的教学能让自己的成绩有突飞猛进的进步,那是不可能的。因为知识的掌握还需要一个过程。
家教的优势其实更多体现在一对一的针对性和即时性,他可以根据你自己的问题帮助你解决,另外,遇到不明白的问题,也可以得到及时解答。但是遗憾的是,许多家长不善于请家教。但一般的家教老师的认识有限水平有限,所以作用也是有限的,更多更深的内容需要自己在学习中感悟、体会。如果自己不努力,总是处于被动的状态的话,那么请多少家教也是徒然。关于如何请家教的问题,请参考本人的《学会跟孩子说话》一书。
2、根据考试的表现来分析
有的人是平时小测验不错,但大的考试却发挥失常。其实这种情况往往说明你对平时功课的掌握还是不错的,但复习阶段和平常的总结工作没有做好,导致考试的状态不是自己的最高水平。同时由于自己没能总结经验教训,所以一到大的考试心理就会被以前的经历所困扰,久而久之,很容易形成考场综合征,严重者,不管自己的功课有没有准备好,到了考场就紧张、肚疼、头晕等现象。(很多症状已经表现生理化)
科学家曾对一些自称考试前总是肚疼的人发现,由于这些人普遍感到焦虑和紧张,所以胃功能不能正常发挥其作用,长此以往,就会出现胃溃疡等症状。心理学家的实验也强有力地说明,两只猴子被关在笼子里,一只猴子不定期地被电击,另外一只猴子定期地被电击。结果不定期地被电击的猴子最后死掉了。对死的那只猴子做生理解剖发现,胃溃疡的问题很严重。所以紧张是造成这种现象的主要原因,而且由于对考试结果的担忧,希望找到合适的借口来为自己开脱,那么生理的毛病是最好的挡箭牌了。所以有的学生开始假装肚疼,到了后来可能就是真的肚疼了。
人的记忆规律说明,对于新接触的概念,当时会很清楚,但过了一些日子会有一定的遗忘。当然不会全部遗忘。很多学生就是当时搞明白了,所以即使过了很长时间,自己对这节的内容依然会感觉掌握的不错,其实已经有一些细节淡忘和陌生了,但本人实际的心理状态还是自我感觉良好。由于自己不容易认识到这个问题的严重性,所以也不知道问题在什么地方。往往是考试结束后才发现有一道简单的问题也没有做出来,就一拍脑袋:“哎呀,一下子给忘了!”这种问题最具欺骗性,以为自己掌握了,但实际情况已经发生了变化,而自己还不是很清楚。
解决这个问题的办法很简单,加强复习、总结归纳、查漏补缺,其实就是通过一些手段和措施来弄明白自己的功课到底是在什么地方有疏漏。方法就是一定要对考试结果做分析总结,而结论无外乎是这几种情况:
a、 考试发挥失常。
很多人把考场上的失利归结于心理素质不好,他们往往为自己辩解:“我平时学的挺好的,可是一到考试就紧张,把原本记得很清楚的东西也给忘了”。的确有些人是因为心理素质的问题,在考场中不能发挥出自己的真实水平,但是,这不是决定性因素。太多人把心理因素当成掩饰自己知识不扎实,掌握得不够牢固的挡箭牌。试想,遇到再紧张的事情、再紧张的时刻,你会不会忘记自己的姓名、国籍、年龄甚至生日?不会。为什么不会?因为这些东西深深印记在脑海里,没有人可以抢走,他们会迅速地出现在眼前。那么反过来想,如果你平时熟练掌握了的那些知识,怎么就会在考试时全部忘光呢?
因此,不要过分夸大心理作用,从根本上讲,平时学好了,考试就不容易失常。失常还是因为学得不够好,自己没有信心才会失常啊!如果在考试的时候果真有心理问题,那么无论它带来的影响是大是小,我们首先要做的就是调整心态。紧张是正常的,明星第一次上台会紧张,想必你一定听过某个明星第一次开演唱会紧张得忘词的事情吧?老师第一次讲课也会紧张,着名作家沈从文第一次进教室讲课甚至紧张的说不出一句话。其实人在面对一件自己非常重视的事情时,都难免有紧张情绪,比较简单地克服紧张的办法就是深呼吸。
另外,就是让自己适应紧张的环境。如果面对考试的确感觉到紧张而难以抑制的话,最好的办法就是常常给自己模拟考试,把作业当作考试,把回答问题当成考试。总之,要自己逐渐习惯考试的气氛,这样到了真正考试的时候,你就会觉得它和平时做作业,做习题没什么不同。
b、考试考出了平时学习上的漏洞和不足。
既然出现了知识点的空白,那么就应该及时给自己进行补习训练。除了心理因素,考试成绩不佳往往是由于知识上有漏洞,考试就像一个检测器,它会有效地发现你的问题所在。就像我们反复强调的那样,对于错题一定要给予足够的重视,对于寻找自己在学习上的问题,它是一个很好的突破口,对每一点错误都不能忽略,不能一带而过,而要像对待新知识一样,仔细弄明白,记在脑子里。
有的学生考试成绩很高,错题很少,但同样不能忽略错误,因为考试并不是全面的检测,只是抽样似的检测,有一定的偶然性,考得分数高不一定说明学得好,也许某次考试恰恰没有考到那些你掌握不好的知识点,好的成绩往往会蒙蔽人。因此,一点小错误都要重视起来,比如英语中单复数的变化,也许只是一个“s”的问题,注意了重视了,下次就一定不会再错。有的学生成绩低,卷面上暴露的问题实际上是很多的,就需要你逐一解决才好。总之,从哪里摔倒就从哪里爬起来,还要记住一点,下次不要再在同一个地方摔倒。
c、马虎成性,审题草草了事,做题不经过认真思考。
也许你总结考试的时候会发现,自己既不是因为紧张做错题,更不是因为知识掌握得不好,而仅仅是因为自己马虎,审题不仔细,发下卷子后再看,发现做错的题只要稍微用心些,就完全可以做好。相信你一定遇到过这种情况,考卷发到手里,一看题目简单极了,自己全都会,于是一个劲地奋笔疾书之后,检查的工序都省了,直接交卷就等着得一百分呢。可是成绩发下来却让你惊讶,怎么和自己预计的差这么多呢?再仔细一看,不是某个小数点点错了,就是看错了题目的意思。
【关键词】新课改 高中生物教学 方法
0.引言
随着新课程改革的不断深化,教育观念也得到更新,给教育界带来了很大的影响。最近几年来,高中生物课程的理念不断更新且在高中生物课堂教学中发挥着重要的作用,但高中生物课堂教学仍然存在着较多的问题导致高中生物课堂教学的效率较低,无法适应新课改的需求。因此,如何提升高中生物课堂教学效率已成为当前广大生物教育者值得思考的重要课题,也是笔者将要探讨的课题。
1.新课改下高中生物教学中存在的问题
1.1 课程资源不够丰富
高中生物教学的课程资源不够丰富,导致其教学效率低下。根据目前高中生物教学过程中的具体情况看来,高中生物课程资源还无法很好地满足现实教学的需要,没有把新课改的理念与现实的改革相结合,试题和习题的拟定也脱离教学实际,教学实践缺乏先进的理念指导。有部分教师还无法发挥多媒体手段的作用进行教学,只是单纯地把生物课程的知识点用多媒体展示出来,课程教学资源不够丰富,教学效率也就不尽人意。
1.2 课堂教学方式不具多样性
在课堂教学方式上,高中生物教学仍然沿用过去陈旧单一的方式,致使高中生物教学效率低下。如今,在新课程改革的背景下,高中生物教学还是没有采用先进的教学方法进行教学,教学方法也比较单一,无法满足形势下高中生物教学的要求。归而言之,在高中生物教学过程中,只有教师发挥了主体地位,而学生的主体地位缺失,这样的课程教学很大程度地影响了高中生物教学效率。
1.3 教师自身素质有待提高
大部分高中生物教师教学无法与时俱进,自身素质有待提高,很难满足新课改下的教学要求,极大地影响了高中生物教学效率[1]。在教学过程中,一部分教师还没有从根本上认识到新课改的重要性,对其具体内涵的理解更是模凌两可,无法用先进的教学理念来指导高中生物教学实践。随着现代生物技术走进课堂教学,高中生物教师自身素质也须得到提升,然而在现有的教师团队中,大部分教师无法熟练掌握现代生物技术的运用,很难把生物科学方法以及思想融入到生物教学中。
1.4 学生缺乏学生兴趣
在新课程改革的背景下,学生的学习兴趣不够浓厚,一定程度上影响了高中生物教学效率的提高。大部分的高中生物教师都还未完全摆脱传统教学观念的禁锢,一味地把知识技能
灌输给学生,不注重培养学生的学习兴趣,导致学生缺乏学习生物课程的兴趣,自然而然,教学效率也就较为低下。
2.提升高中生物教学效率的方法
2.1 灵活运用现代的教学手段
在教学过程中,教师要发挥现代教学手段的作用,借助多媒体的优势来进行教学。这样就可以让教学更具体形象,便于学生掌握和理解。例如,在学习细胞分裂这一节时,就可以相应的计算机软件进行展示,由于细胞分裂包括减速分裂和有丝分裂,分裂过程较为复杂,学生一时之间很难掌握和理解,这就要借助flas来直观地展示其分裂过程,既有良好的听觉效果,又具良好的视觉效果,能够加深学生对所学知识的印象,从而更好地掌握和理解所学知识。通过这种方法,就可以使教学环境得到较好的改善,培养学生的学习主观能动性和兴趣。从教学角度来讲,多媒体的使用对教学是大有裨益的,有效的提高教学效率,丰富了高中生物教学中的课程资源。
2.2 开展探究式教学
探究式教学是新课改下提升高中生物教学效率的重要方法。在新形势下以探究式的方法来进行学习是非常有必要的,通过此方法,学生能够积极主动地参与到活动中去,产生强烈的学习欲望。因此,高中生物教师在教学过程中要大力开展探究式教学,尽量选择学生感兴趣的问题来进行探究,培养学生自主探索、自主学习的能力[2]。例如,在学习《伴性遗传》这一节时,教师可以提出相关问题,如“什么叫常染色体?什么叫性染色体?性别由哪类染色体决定的”或“尔根的果蝇实验发现果蝇的眼色遗传与性别有关,这说明了什么”等问题,通过对这些问题的回答,学生对伴性遗传知识就有了一定的了解,然后教师让学生明白,红绿色盲的发病率是男性高于女性,再增设一些问题让学生进行自主探索、自主学习,最后让学生把探究结果陈述出来,教师要对探究结果进行评价,这样一来就能培养学生的自主学习和探索未知知识的能力,从而提高教学效率。
2.3 提升教师自身素质
新课程改革对高中生物教师提出了较高的要求,它要求教师具备较高的专业素质。只有生物教师能够具备较高的专业素质,才能对新课程改革的具体内涵有一个更加深刻的认识,朝着新课程改革的方向进行教学,用先进的教学理念来指导教学实践,从而提升高中生物教学的效率。
2.4 培养学生的学习兴趣
在生物教学的过程中,教师要注重培养学生的学习兴趣。一旦学生对生物课程的学习有了浓厚的兴趣,他们对相关信息的印象就会加深。因此,教师在课堂教学过程中要举出一些与课堂知识相关的生活实例,培养学生的学习兴趣。例如,在讲授呼吸作用的知识时,教师可以用日常生活中制作酸奶和酸菜以及酿酒的过程来引出相关的理论概念,通过这种方法就可以培养学生的学习兴趣,产生强烈的学习欲望,从而提高高中生物教学的效率。
3.结语
综上所述,在我国新课程改革的背景下,高中生物教学中还存在着较多的问题,这些问题都在一定程度上影响了高中生物教学效率的提升。因此,高中生物教师要采取行之有效的方法来提升高中生物教学的效率,从而促进我国教育事业的健康发展。
参考文献
关键词:生物信息学 教材 分析
中图分类号:G4233文献标识码:A文章编号:1009-5349(2017)06-0019-02
近些年,生物信息学顺应时代变化而成为生命科学的新兴领域。[1]生物信息学主要是对核酸和蛋白质两个大方向的数据进行处理与分析。[2]目前,生物信息学作为基础课程在各高校生物科学专业及相关专业开设。其教学质量的高低对于培养学生的综合能力具有重要的意义。[3]因此,各高校在教材选择、课程安排、教学内容、实践教学等方面不断进行改进。[4]优秀的生物信息学教材是提高教学质量的基础。对不同的教材进行对比分析,从中选取适合相关专业的教材,是教师的必要工作。本文对五种生物信息学教材进行分析,为不同专业对于教材的选择提供参考和建议。
一、研究方法及教材简介
(一)文献研究法
笔者主要从以下三个方面进行文献检索。首先,搜索与生物信息学教材分析相关的著作。其次,利用中国知网、万方数据库等检索与教材分析相关的期刊论文。最后,借鉴优秀教师的教案,仔细阅读并进行分析。深入了解相关生物信息学教材分析的背景以便进行整理分析。
(二)对比研究法
本文主要选取了五种生物信息学教材,根据教材的基本框架结构及特点,对其进行对比分析,分析总结不同教材之间异同。
二、生物信息学教材分析
随着课程改革的不断完善,针对不同地区、不同专业,教材的使用也趋向多元化。生物信息学教材是教师进行教学活动的基础。对不同的生物信息学教材进行对比,以便教师作出最适合的选择。如表1所示,对五种教材从宏观角度进行内容上的分析。
如表1所示,从中可看出这五种教材从整体编写方面,都涵盖了核酸和蛋白质两个主要层面。主要内容包括:生物信息学的概念及发展历程、数据库的介绍、生物信息学常用统计方法、基因组学、蛋白质组学等几大方面。并且,大多数教材都附有思考题,有利于学生课后对知识进行运用及加深理解。只是随着生物信息学的飞速发展,不同版本的教材增添了新的相关的知识。同时不同教材的侧重点略有差异。
另一方面,从表1中可看出,五种教材所包含的章节为7到15章不等。这说明,随着科学技术的不断发展,更多的前沿知识不断地填充到教材中。所以,随着时间的变化,不同的教材,具有各自的特色。
首先,教材的侧重点不同。随着各物种的基因组计划的不断完成,生物信息学发展实现了质的飞跃。并且融入到各个领域中。例如:由李霞、雷建波编写的《生物信息学》,侧重介绍了生物信息学与疾病的相关联性。教材在内容和形式上有所创新。突出实用性,以临床实际问题作为编写出发点;而刘娟编写的《生物信息学》一书中,以丰富的实例,重点介绍了相关数据库和软件的功能、应用策略和使用方法。在章节编排上涉及微阵列数据分析的内容,突出了生物信息学与数学的融合。
其次,不同教材的难度存在差异性。陶士珩编写的《生物信息学》较基础,包含了生物信息学基本内容,力求使学生全面了解和掌握生物信息学领域的重要基础知识与基本操作技能。而陈铭编写的《生物信息学》,根据生物信息学多学科融合的特点,增添编程与统计学知识,教材所涉及的知识范围广泛。使得无论是对教师还是学生来讲,都要求具有深厚的学科背景。
最后,学科之间联系程度差异。生物信息学作为一项生物科学的工具,不仅仅应用于生物学,同时,在医学、农业专业、计算机科学等领域。[10]但不同教材所体现生物信息学与其他学科的联系程度不尽相同。例如:吴祖建编写的《生物信息学分析实践》一书,主要包含了数据库检索、引物设计、序列分析等诸多技术问题。书中以图表形式为主,文字介绍为辅,以让学生学会操作为主,将生物信息学与计算机科学紧密结合。
三、结语
生物信息学重要特点为学科交叉性,涉猎范围广。不同的生物信息学教材适用于不同专业。本文对五种教材进行对比分析,根据教材不同特色并结合不同专业特点,为教师选择适合的教材提出建议。陶士珩、刘娟编写的两版不同《生物信息学》,内容基础,适用农业专业和师范专业作为教学用书;李霞、雷健波编写的教材,主要突出了与医学相关联系,适用于医学专业用书;陈铭、吴祖建所编写教材,注重与计算机科学的关联,实践性强,有利于培养学生动手操作能力,适用于计算机专业。
参考文献:
[1]朱杰.生物信息学的研究现状及其发展问题的探讨[J].生物信息学,2005,3(4):185-188.
[2]赵屹,谷瑞升,杜生明.生物信息学研究现状及发展趋势[J].医学信息学杂志,2010(5):2-6.
[3]倪青山,金晓琳,胡福泉等.生物信息学教学中学生创新能力培养探讨[J].基础医学教育,2012,14(11):816-818.
[4]向太和.我国现有《生物信息学》教材和网络资源的分析[J].杭州师范学院学报(自然科学版),2006,5(6).
[5]陶士珩.生物信息学[M].北京:科学出版社,2007.
[6]刘娟.生物信息学[M].北京:高等教育出版社,2014.
[7]吴祖建.生物信息学分析实践[M].北京:科学出版社,2010.
[8]陈铭.生物信息学(第二版)[M].北京:科学出版社,2015.
[9]李霞,雷建波.生物信息学(第二版)[M].北京:人民卫生出版社,2015.
[10]高亚梅,韩毅强.《生物信息学》本科教学初探[J].生物信息学,2007,5(1):46-48.
[关键词]生物信息学 课程教学改革 创新能力培养
[中图分类号] G642 [文献标识码] A [文章编号] 2095-3437(2013)16-0061-02
当前生物信息学的研究主要集中于核苷酸和氨基酸序列的存储、分类、检索和分析等方面,所以目前生物信息学可以狭义地理解为“将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科”。生物信息学的发展,对人们分子水平上认识生命活动的规律起着关键性的作用。生物信息学是一门理论性和实践性都很强的课程,理论与实践的结合十分紧密。生物信息学课程的授课内容分为理论基础和上机操作部分,主要特点是传授理论知识和培养实践能力并举。在生物信息学的课堂教学中,既要强调基本理论、基本知识的传授,同时也要加强学生的实践能力和创新能力的培养,以实际应用为主要侧重点,着重培养学生的创新能力。根据生物信息学的课程特点,我们在理论教学、上机实践操作及考试方式等方面进行了改革和探索,获得了较好的教学效果。
一、激发学习兴趣
生物信息学课程涉及的新技术较多,接触的因特网也多为英文页面,多数学生因而存在畏难情绪。对于分子生物学基础及英文较差的学生,我们采用循序渐进的方式,鼓励他们由浅入深地学习生物信息学的分析方法,由少到多地浏览英文网站,理解并掌握常用的生物信息学英文词汇,从而增强了学习生物信息学的兴趣和信心。学生通过对英文网站的不断浏览,英文阅读能力得到了很大提高;同时也开阔了视野,拓宽了知识面。随着学生生物信息学分析能力及专业英语水平的提高,教师在理论课讲解过程中,由少到多地逐步加大了英文教学的比例。总之,通过激发学生的学习兴趣,帮助学生逐步建立起学习的兴趣和自信心,为学好生物信息学这门课程打下了坚实的基础。
二、重视双基训练
本课程首先结合人类基因组计划介绍生物信息学的历史发展和概况,然后顺序介绍生物数据库分类、序列相似性比较、数据库搜索、分子系统发育树分析、基因组学与基因预测、蛋白质结构预测等基本知识,以介绍基本理论和基本知识为主,启发学生拓宽知识面,了解学科前沿和最新进展,培养学生解决生物信息学分析实际问题的能力,从而为今后进行生命科学研究奠定基础。
生物信息学涉及的算法多数都较为枯燥,在授课过程中侧重于分析方法的讲解和应用。如在讲授双序列比对动态规划算法Needleman-Wunsch全局比对和Smith-Waterman局部比对及分子系统发育树构建UPGMA(Unweighted pair group method with arithmetic mean,非加权算术平均组队法)等算法时,在多媒体教学的基础上,结合板书演算实例、互动式“提问”等方法帮助学生理解算法的基本原理及分析方法;同时布置课后计算题作业,要求学生独立完成后上交,并作为平时成绩考核的主要依据之一,从而促进学生巩固基本理论和基本知识。
三、双语多媒体教学
为了适应生物信息学知识全球化的特点,使学生能够更好地接受最新的生物信息学知识,我们制订了生物信息学课程双语教学计划,并在教学过程中分阶段逐步实施。在第一阶段,以汉语讲授为主,英语渗透,中文教材为主,相关英文文献为辅;在此基础上,逐步向第二阶段过渡,即汉英整合,不分主次,PPT课件和Flas采用英文版本;最终的目标是第3阶段,即选用英文教材,制作英文版本的PPT教学课件,采用全英文授课方式。整个过程循序渐进,逐步淘汰传统的中文教学。
在讲解数据库查询和BLAST(Basic local alignment search tools)分析、Bankit在线序列提交和Sequin离线序列提交及DNASTAR、DNAMAN、MEGA等软件包使用方法时,改变以往静态演示的旧有模式,应用屏幕录像专家软件制作多媒体动画文件,将操作步骤和鼠标的移动轨迹、点击抓取下来,以便让学生直观地观看课件。通过现场操作核酸序列的查询、蛋白质三维空间结构的显示、限制性酶切图谱绘制、PCR引物设计、序列组装重叠群(contig)构建、分子系统进化树构建等分析,应用多媒体设备将整个操作过程动态地逐一展示,直至最终完成整个过程,使学生得到了直观体验,加深了印象,从而更加容易掌握这些实践操作。
四、加强上机操作
实践教学相对于理论教学具有直观性、验证性、综合性、启发性和创新性的特点。为了提高学生的实践操作能力,我们安排了多个验证性、设计性上机实践操作。《NCBI数据库的检索与使用》让学生熟悉GenBank核酸序列的格式、主要字段的含义、序列下载的方法,并掌握Entrez检索工具的使用方法;《BLAST数据库搜索》让学生掌握BLAST数据库搜索的分析方法;《核酸和蛋白质序列的进化分析》让学生掌握MEGA(Molecular evolutionary genetic analysis)和Clastalx等软件构建分子系统进化树的方法和步骤;《DNAMAN软件的使用》让学生掌握DNA序列的限制性酶切位点分析及PCR引物设计等基本操作方法;最后一次实践上机课安排《核酸、蛋白序列的综合分析》设计性实验,让同学们随机组成两人一组的研究小组,自选感兴趣的基因并从GenBank数据库中下载该基因的20条核酸序列及蛋白序列,分析其中1条核酸序列的碱基组成比例,反向互补序列、编码的RNA序列及蛋白序列,分析其中1条蛋白序列的氨基酸组成比例、分子量、疏水性、等电点、亚细胞定位等物理、化学特性;同时基于DNA序列和蛋白质序列构建分子系统发育树。
五、网络教学资源
生物信息学对于网络工具高度依赖,由于受学时限制,课堂教学的内容非常有限。为了给学生创造一个良好的自学环境,我们应用屏幕录像软件开发了上机实践操作演示等教学资源;提供了课件供学生在网络上下载使用,该课件覆盖了生物信息学课程的全部教学内容,包括相关的动画演示等信息;另外还提供了DNASTAR、DNAMAN、MEGA、BIOEDIT等软件安装程序及使用手册,相关英文参考文献等,从而有效地扩大了学生的自学空间。
六、科研教学相长
本课程由具有生物信息学或分子生物学博士学位的教师承担,每位授课教师的科研课题均涉及生物信息学分析。在生物信息学的教学过程中,授课教师积极融合个人的科研工作经验和成果,丰富了教学内容。如在讲授Bankit在线序列提交及Sequin离线提交序列时,我们以提交至国际核酸序列数据库GenBank的芒草(Miscanthus sinensis)肉桂醇脱氢酶(JQ598683)、过氧化氢酶(JQ598684)、咖啡酰辅酶A-O-甲基转移酶(JQ598685)、肉桂酸-4-羟化酶(JQ598686)为例;在讲授基因外显子和内含子结构预测时,以牡丹(Paeonia suffruticosa)ACC氧化酶(FJ855434)和ACC合成酶(FJ769773)为例。通过把科研思路带入教学中,有效培养了学生的科研能力及创新能力。此外,教学实践也有利于教师全面了解生物信息学和相关学科的最新进展,不断为科研提供新思路。
七、考试方式改革
生物信息学课程的目的是提高学生利用信息技术解决生物学问题的能力,因此主要考查学生综合利用所学知识分析问题和解决问题的能力。在课程考核中结合平时书面作业、递交上机操作练习和考试三方面情况,综合评定。平时布置3次思考题目,以书面形式上交,占考核成绩的20%;上机实践操作的习题以电子版发送到教师的E-mail邮箱中,占考核成绩的30%;课程结束后给学生1周的时间复习,而后在计算机上答题,包括基础知识部分和上机操作部分,占考核成绩的50%。经过综合评定,能够比较客观地反映一个学生对该课程的实际掌握情况。采用这种考试方式后,一方面,促使学生在学习过程中,不必花大量工夫去死记硬背,而把重点放在了基本理论、基本知识的巩固及实践操作技能的提高上,有效地提高了学生的实践操作能力和创新能力;另一方面,也促使教师在教学过程中,注重从能力培养的角度进行教学课堂设计,提升教学质量和水平。
在教学过程中,通过激发学生的学习兴趣,采用双语多媒体教学方式,在重视基本理论和基本知识讲授的同时,加强上机实践操作,充分利用网络教学资源,将科研成果结合于教学过程中,结合考试方式改革与探索,大大提高了“生物信息学”课程的教学质量水平及教学效果。
[ 参 考 文 献 ]
[1] 葛威,鲍大鹏,董战峰,等.Visual BASIC编程在核酸序列分析中的应用研究初探[J].生物信息学,2004,(4):43-46.
>> 丹参类贝壳杉烯氧化酶(SmKOL)基因全长克隆及其生物信息学分析 红白忍冬SABATH甲基转移酶基因克隆及其生物信息学分析 雷公藤贝壳杉烯酸氧化酶基因的全长cDNA克隆与表达分析 丹参SmNAC1基因的克隆和生物信息学分析 黄芩葡萄糖醛酸水解酶基因的克隆、生物信息学分析及表达 太子参分解代谢关键酶8′羟化酶基因的克隆及生物信息学分析 人组蛋白去乙酰化酶11的克隆表达与生物信息学分析 金铁锁糖基转移酶PtT1的克隆与生物信息学分析 平邑甜茶MhWRKY15基因cDNA克隆及其生物信息学分析 茶陵野生稻冷响应基因OrCr3的克隆及其生物信息学分析 唇形科植物脚6基脚6基焦磷酸合酶编码基因及其氨基酸序列的生物信息学分析 棉铃虫类胰蛋白酶的生物信息学分析 玉米谷胱甘肽过氧化物酶的生物信息学分析 黔北麻羊RERGL基因cDNA克隆与生物信息学分析 小菜蛾p38MAPK基因的克隆与生物信息学分析 高丛越桔UFGT基因电子克隆和生物信息学分析 小菜蛾PxALP1基因的克隆与生物信息学分析 希金斯炭疽菌腺苷酸环化酶生物信息学分析 黄瓜DVR基因的生物信息学分析 FZ6基因及其蛋白的生物信息学分析 常见问题解答 当前所在位置:l)查找开放阅读框(ORF)。生物信息学分析主要采用一些网上软件包进行分析,如采用Interpro (http://ebi.ac.uk/tools/interproscan)进行结构域比对,ExPASy在线服务器的Compute pI/Mw工具(http:///compute_pi/)预测相对分子质量与理论等电点,TargetP1.1 server (http: //cbs.dtu. dk /serv- ices/targetP/)进行信号肽分析,Psort (http://psort.hgc.jp/)及WOLFPSORT (http:///)分析亚细胞定位,TRMHMM server v 2.0 (http:// cbs. dtu.dk/services/TMHMM-2.0/)进行跨膜域分析,Predictprotein (https:///)进行二级结构预测,SWISS-MODEL (http://swissmodel.expasy. org/)进行二级结构分析和结构域的三维同源建模。使用DNAMAN软件对序列进行多重比对,用ClustalW分析软件与其他植物的MCS氨基酸序列进行同源比对,根据分析结果选择17种植物的MCS氨基酸用MEGA 5.1软件构建进化树。
2.4 SmKOL基因的表达分析 取0.1 g毛状根样品采用Trizol试剂盒提取总RNA,用Takara反转录试剂盒反转录成cDNA。其过程为:总RNA模板1 μL(约200 ng),dNTP 1 μL, Radom 6 mers 2 μL,不含RNase的去离子水至10 μL,离心,置于PCR仪上,65 ℃ 5 min,之后冰上急冷。然后加入5×PrimerScript Buffer 4 μL,RNase Inhibitor 0.5 μL,PrimerScript Rtase 1 μL,RNase free H2O 4.5 μL。PCR反应条件为30 ℃ 10 min,42 ℃ 60 min,70 ℃ 15 min,所得cDNA用于Real-time PCR。根据丹参内参β-actin和目标基因SmKOL的核苷酸序列设计引物。其中β-actin上游引物为5′ -AGGAACCACCGATCCAGACA-3′,下游引物为5′ -GGTGCCCTGAGGTCCTGTT-3′;SmKOL上游引物为5′ -GCTTCTGGCAAGGCAATCAAC-3′,下游引物为5′ -CTTTTCCTCGTTGAGTTGGTCG-3′。转录后的cDNA用管家基因引物β-actin进行普通PCR反应,用于反转录质量控制,待目的基因引物及管家基因引物检测合格后,在ABI7300 RT-PCR仪上进行荧光定量检测,反应体系为:5 μL Power SYBR Green PCR Master Mix,0.2 μL引物F,0.2 μL引物R,1.0 μL cDNA,3.6 μL ddH2O。PCR反应条件为95 ℃ 30 s;95 ℃ 5 s;60 ℃ 34 s,40个扩增循环;检测溶解曲线。反应结束后分析荧光值变化曲线和溶解曲线。每个反应重复3次,采用2-ΔΔCT法分析结果。
3 结果
3.1 丹参毛状根SmKOL基因的全长克隆及序列分析 将基因cDNA序列进行Blast比对分析,结果表明测得的片段与其他植物中的KO基因有70%左右的同源性,并有相似的保守区域。将所得的片段进行拼接,获得基因全长序列,共1 884 bp核苷酸,命名为SmKOL,GenBank登录号为KJ606394,DNAMAN软件结合ORF Finder在线软件对SmKOL基因全长cDNA序列进行分析,推测编码519个氨基酸的蛋白质,并含有完整的开放阅读框(open reading frame, ORF),SmKOL基因的开放阅读框位于23~1 582 bp,序列的1~22 bp为5′非翻译区(5′UTR),1 583~1 884 bp为3′非翻译区(3′UTR)。
Blast结果显示SmKOL基因与甜橙Citrus sinensis的KO基因有68%相似, 西洋梨Pyrus communis的KO基因有66%相似、苜蓿Medicago truncatula的KO基因有67%相似、葡萄Vitis vinifera的KO基因有65%相似、拟南芥Arabidopsis thaliana的KO基因有64%相似、粳稻Oryza sativa Japonica Group的KOL基因有57%相似。KOL具有比较保守的结构域,用DNAMAN程序对比葡萄(AFD54196.1)、苜蓿(XP_003637273.1)、西洋梨(AEK01241.1)、粳稻(AAT81230.1)拟南芥(AED93499.1)的氨基酸序列进行多序列比对(图1)。结果表明家族具有较高同源性。使用Interpro结构域比对,结果表明SmKOL具有与IPR001128的Cytochrome P450 domain和IPR017972的Cytochrome P450相同保守位点(图2)。
3.2 KOL氨基酸序列的分子系统进化树分析 将SmKOL与GenBank中的17种植物的17种蛋白进行比对分析,在软件MEGA 5.1上采用相邻链接法构建KOL进化树,进行聚类分析(图3)。SmKOL与阿拉比卡种小果咖啡KOL聚为一类,两者在本文所选蛋白中的亲缘关系最近。
3.3 理化性质和3D结构预测 使用ExPASy在线服务器的Compute pI/Mw工具预测,SmKOL蛋白的相对分子质量为58.88 kDa,等电点pI 7.62。亚细胞定位结果表明可能定位于细胞质或者细胞核。信号肽分析表明为分泌蛋白,前23个氨基酸可能是信号肽,跨膜域分析可能为膜蛋白。SmKOL蛋白的二级结构预测结果显示,α螺旋结构占50.10%、β折叠结构占6.36%、无规则卷曲结构占43.55%。蛋白质的功能很大程度上取决于其空间结构,无规则卷曲结构决定了蛋白质,尤其是酶的功能部位常常位于这种构象区域,而α螺旋主要对蛋白质骨架起稳定作用,通过对蛋白质二级与三级结构预测和分析,有助于理解蛋白质功能与结构的关系[10]。使用Swiss Model进行同源建模,以人Cytochrome P450 2R1蛋白A链(PDB注册号3czh.1.A)作为同源模板,用于建模的氨基酸序列残基为46~511位,序列相似性为23.56%,模型质量得分(GMQE)0.55(图4)。
3.4 SmKOL受茉莉酸甲酯(MeJA)诱导的诱导表达分析 实时荧光定量PCR实验数据结果采用2-ΔΔCT法进行相对定量表达分析,即确定目标基因(SmKOL)和参照基因(β-actin)有相近的扩增效率,就可以确定不同样本中目标基因表达水平的相对差异。不同时段MeJA诱导的丹参毛状根中SmKOL相对表达发现,MeJA能明显诱导丹参毛状根中SmKOL基因mRNA的表达。实验检测了丹参毛状根经MeJA处理12,24,36,120 h后SmKOL基因的诱导表达情况,结果显示经MeJA处理后的SmKOL基因的诱导表达水平在0~36 h逐渐升高,在36 h时达到最大值,随后120 h时SmKOL基因的表达量下降(图5)。
4 讨论
由于丹参毛状根具有遗传稳定性高、产率高等优点,近年来常应用于次生代谢产物的生产。本研究首次从丹参毛状根中克隆得到了赤霉素代谢途径上的KOL基因,获得含有完整ORF的基因全长,并利用生物信息学的方法对其核酸及其推测的蛋白序列组成进行分析。结果表明,该基因与其他物种中的KO基因有较高的同源性,命名为SmKOL,它具有Cytochrome P450 domain,这在所有的家族成员中都是保守的。
同时,SmKOL基因诱导表达结果表明,经诱导子MeJA诱导后,SmKOL的mRNA表达量逐渐上调,在36 h达到最大值,之后表达量下降。随着丹参赤霉素生物合成途径中基因的不断挖掘,为在分子水平上认识赤霉素合成途径中的编码基因、调控方式、酶反应动力学及其代谢调节的分子机制奠定基础[11]。SmKOL基因的克隆为进一步研究该基因的功能和丹参赤霉素生物合成及其次生代谢调控机制提供了靶基因。
[参考文献]
[1] Ogawa M, Kusano T, Koizumi N, et al. Gibberellin-responsive genes: high level of transcript accumulation in leaf sheath meristematic tissue from Zea mays L[J]. Plant Mol Biol, 1999, 40(4): 645.
[2] 虞慧芳, 曹家树, 王永勤. 植物矮化突变体的激素调控[J].生命科学,2002, 14(2):85.
[3] Wang Q, Hillwig M L, Wu Y S, et al. CYP701A8: a rice ent-kaurene oxidase paralog diverted to more specialized diterpenoid metabolism[J]. Plant Physiol, 2012, 158(3): 1418.
[4] 李节法, 田义轲, 王彩虹, 等. 梨贝壳杉烯氧化酶基因PpKO的克隆及生物信息学分析[J]. 园艺学报, 2012, 10: 1575.
[5] Miyazaki S, Katsumata T,Natsume M, et al. The CYP701B1 of Physcomitrella patens is an ent-kaurene oxidase that resists inhibition by uniconazole-P[J]. FEBS Lett, 2011, 585(12): 1879.
[6] Lei L, Fan Z R, Tang L, et al. Molecular cloning and identification of tissue-specific expression of ent-kaurene oxidase gene in Momordica charantia[J]. Afr J Biotechnol, 2011, 10(70): 15724.
[7] Ko K W, Lin F Q, Katsumata T, et al. Functional identification of a rice ent-kaurene oxidase, OsKO2, using the pichia pastoris expression system[J]. Biosci Biotechnol Biochem, 2008, 72(12): 3285.
[8] Song J, Guo B J, Song F W, et al. Genome-wide identification of gibberellins metabolic enzyme genes and expression profiling analysis during seed germination in maize[J]. Gene, 2011, 482(1-2): 34.
[9] Morrone D, Chen X M, Coates R M, et al. Characterization of the kaurene oxidase CYP701A3, a multifunctional cytochrome P450 from gibberellin biosynthesis[J]. Biochem J, 2010, 431: 337.
[10] Zhou X Y, Li J Y, Fan Z Q. Cloning and expression analysis of chalcone isomerase gene cDNA from Camellia nitidissima[J]. Forest Res, 2012, 25: 93.
[11] 谈心, 马欣荣. 赤霉素生物合成途径及其相关研究进展[J]. 应用与环境生物学报,2008, 14(4): 571.
Cloning and bioinformatics analysis of ent-kaurene oxidase
synthase gene in Salvia miltiorrhiza
HU Ya-ting1, GAO Wei2, LIU Yu-jia2, CHENG Qi-qing2, SU Ping2, LIU Yu-zhong1, CHEN Min1*
(1. State Key Laboratory of Dao-di Herbs, National Resource Center for
Chinese Materia Medica, China Academy of Chinese Medical Sciences, Beijing 100700, China;
2. School of Traditional Chinese Medicine, Capital Medical University, Beijing 100069, China)
[Abstract] Based on the transcriptome database of Salvia miltiorrhiza, specific primers were designed to clone a full-length cDNA of ent-kaurene oxidase synthase (SmKOL) using the RACE strategy. ORF Finder was used to find the open reading frame of SmKOL cDNA, and ClustalW has been performed to analysis the multiple amino acid sequence alignment. Phylogenetic tree has been constructed using MEGA 5.1. The transcription level of SmKOL from the hairy roots induced by elicitor methyl jasmonate (MeJA) was qualified by real-time quantitative PCR. The full length of SmKOL cDNA was of 1 884 bp nucleotides encoding 519 amino acids. The molecular weight of the SmKOL protein was about 58.88 kDa with isoelectric point (pI) of 7.62. Results of real-time quantitative PCR analyses indicated that the level of SmKOL mRNA expression in hairy roots was increased by elicitor oMeJA,and reached maximum in 36 h. The full-length cDNA of SmKOL was cloned from S. miltiorrhiza hairy root, which provides a target gene for further studies of its function, gibberellin biosynthesis and regulation of secondary metabolites.
牙齿的生长发育是一个持续而复杂的过程,一些关键基因和调控因子在牙齿发育中起着重要作用。赫尔辛基大学创建了牙齿发育数据库,收录了牙组织发育中的基因特征、结构及表达情况等。Hubbard等运用蛋白质组学技术、结合Edman测序及质谱分析方法,对釉质的发育进行了大量的研究,初步构建了口腔牙组织的蛋白数据库,为口腔内组织蛋白的鉴定提供了重要的研究范本。聂敏等运用二维凝胶电泳和生物信息学方法研究维生素D对牙髓细胞分化的影响,结果表明:维生素D可促进牙髓细胞的分化,并在牙齿发育和矿化过程中起了重要的调节作用。Jevnaker等利用基因芯片技术以整个牙胚作为研究对象,首次构建了小鼠牙胚在不同时期的微小RNA表达谱,从基因调控机制上研究了牙齿的生长发育。
2在口腔肿瘤研究中的应用
目前的研究多利用生物信息学方法比较基因组学和蛋白质组学,能够高效率、高通量地筛选口腔肿瘤的相关基因和蛋白,寻找肿瘤的诊断标记和治疗靶点。
2.1口腔鳞状细胞癌(oralsquamouscellcarcino-ma,OSCC)
OSCC是口腔常见的恶性肿瘤之一。美国国立癌症研究所用抗体芯片的高通量蛋白组分析方法推测认为,上皮和间充质间涉及的多重细胞信号的分子信息在口腔癌的发生中起了关键作用。2004年,香港大学利用蛋白质组分析方法检测了OSCC细胞,获得了丰富的蛋白质信息,鉴定了与肿瘤相关的生物标记物或分子靶点。2005年日本千叶大学通过使用生物信息学的方法,鉴定了OSCC与正常组织中22种蛋白的表达存在差异。Wang等研究表明,活化激酶C受体1蛋白在OSCC中存在差异性表达,可作为OSCC的临床诊断分子标记物、临床预后指标及候选药物靶标等。张永强等使用生物信息学技术构建人舌鳞癌细胞cDNA库,并预测了Doc-1基因编码的P12蛋白的某些结构和功能基序。另有研究采用甲基化DNA免疫沉淀结合芯片技术分析研究了口腔疣状癌中基因组DNA甲基化的情况,为进一步探讨口腔疣状癌的发生分子机制和治疗靶基因奠定了基础。
2.2涎腺腺样囊性癌(salivaryadenoidcysticcar-cinoma,SACC)
SACC是涎腺常见的上皮源性恶性肿瘤之一。卢友光等采用第二代差异显示技术构建了SACC高低转移细胞株的基因表达谱,通过生物信息学分析发现,Notch基因家族中的4个成员在ACC-2、ACC-M这2个细胞株中存在表达差异。另一研究运用生物信息学初步筛选出Notch信号通路在SACC中所涉及的基因,并采用实时荧光定量聚合酶链式反应和免疫组学方法进行了验证,结果显示:Notch信号通路中有46个基因与SACC相关,并检测出其中的8个基因在SACC高低转移细胞株中存在表达差异。
3在口腔黏膜疾病研究中的应用
3.1口腔扁平苔癣(orallichenplanus,OLP)
OLP是一种口腔黏膜癌前状态,其病因不明。王文梅等建立了OLP与口腔正常黏膜蛋白表达谱,对OLP在双向电泳图谱中高表达差异的10个蛋白质进行质谱和生物信息学分析,鉴定发现了差异表达的蛋白。Tao等利用DNA芯片的特点筛选并建立了OLP的病变基因表达谱,研究共发现了985个差异表达基因,其中629个上调,356个下调,这为研究OLP的发病机制打下了基础。
3.2口腔白斑(oralleukoplakia,OLK)
OLK指仅仅发生在口腔黏膜上的白色或灰白色角化性病变的斑块状损害。王文梅等通过蛋白质差异组学研究和生物信息学分析,鉴定出膜联蛋白A2、角蛋白8以及角蛋白Ⅰ和Ⅱ型角蛋白亚基、免疫球蛋白J型轻链的C区片段等在OLK的发生发展过程中发生了改变。Odani等采用寡核苷酸芯片技术发现:兜甲蛋白和角蛋白在OLK的发生发展过程中的表达差异较大,且多个基因在癌变过程中显著下调。周晌辉等利用cDNA芯片成功检测出OLK和OSCC组织中30个基因的表达差异,其中17个为已知功能基因,这些功能基团与细胞分裂、信号传导、免疫防御、细胞代谢及细胞成分等密切相关。
4在牙周疾病研究中的应用
牙周炎是导致成年人牙齿丧失的主要原因,严重影响了人类的身体健康。Steinberg等使用具有上皮细胞特异性的DNA芯片研究了白细胞介素对口腔角质形成细胞1β的作用,确定了与牙周炎相关的几个基因。Vardar-Sengul等通过DNA芯片在1次实验中同时分析出了超过40000个基因,得到了类似的结果。Beikler等构建了重度慢性牙周炎患者的牙周组织中的一些免疫和炎症基因的表达谱。Covani等利用生物学实验及生物信息学算法,鉴定出参与或可能参与牙周炎的61个基因,其中5个是主导基因,并完全建立起2个主导基因的牙周炎模型。
5在其他口腔研究中的应用
5.1口腔微生物
口腔微生物在维持口腔正常生理体系和诱导口腔疾病发生中具有重要作用。Chen等构建了口腔病原体的生物信息学资源。2008年,人体口腔微生物组数据库启动,方便了研究者查看和检索口腔微生物信息。在对口腔致病菌的研究中,郭丽宏等利用生物信息学相关软件及数据库进行C血清型变异链球菌高毒力株特异DN段的基因分析、识别和功能预测,发现了5个新的基因片段以及高毒力株特异的DN段的主要功能。刘筱娣等采用生物信息学结合Southern印迹杂交法,构建了变异链球菌的苏氨酰-tRNA合成酶基因敲除的重组质粒。另有研究者应用鸟枪法、蛋白质组学分析、美国国家生物技术信息中心检索等,建立了变异链球菌耐氟菌株和亲代菌株的蛋白质组表达谱。
5.2口腔唾液
一、整合生物信息学的研究领域
尽管目前一般意义上的生物信息学还局限在分子生物学层次,但广义上的生物信息学是可以研究生物学的任何方面的。生命现象是在信息控制下不同层次上的物质、能量与信息的交换,不同层次是指核酸、蛋白质、细胞、器官、个体、群体和生态系统等。这些层次的系统生物学研究将成为后基因组时代的生物信息学研究和应用的对象。随着在完整基因组、功能基因组、生物大分子相互作用及基因调控网络等方面大量数据的积累和基本研究规律的深入,生命科学正处在用统一的理论框架和先进的实验方法来探讨数据间的复杂关系,向定量生命科学发展的重要阶段。采用物理、数学、化学、力学、生物等学科的方法从多层次、多水平、多途径开展交叉综合研究,在分子水平上揭示生物信息及其传递的机理与过程,描述和解释生命活动规律,已成生命科学中的前沿科学问题(摘自:国家“十一五”生命科学发展规划),为整合生物信息学的发展提供了数据资源和技术支撑。
当前,由各种Omics组学技术,如基因组学(DNA测序),转录组学(基因表达系列分析、基因芯片),蛋白质组学(质谱、二维凝胶电泳、蛋白质芯片、X光衍射、核磁共振),代谢组学(核磁共振、X光衍射、毛细管电泳)等技术,积累了大量的实验数据。约有800多个公共数据库系统和许多分析工具可利用通过互联网来解决各种各样的生物任务。生物数据的计算分析基本上依赖于计算机科学的方法和概念,最终由生物学家来系统解决具体的生物问题。我们面临的挑战是如何从这些组学数据中,利用已有的生物信息学的技术手段,在新的系统层次、多水平、多途径来了解生命过程。整合生物信息学便承担了这一任务。
图1简单描述了生物信息学、系统生物学与信息学、生物学以及基因组计划各个研究领域的相关性。可以看出基因组计划将生物学与信息学前所未有地结合到了一起,而生物信息学的兴起是与人类基因组的测序计划分不开的,生物信息学自始至终提供了所需的技术与方法,系统生物学强调了生物信息学的生物反应模型和机理研究,也是多学科高度交叉,促使理论生物学、生物信息学、计算生物学与生物学走得更近,也使我们研究基因型到表型的过程机理更加接近。虚线范围代表整合生物信息学的研究领域,它包括了基因组计划的序列、结构、功能、应用的整合,也涵盖了生物信息学、系统生物学技术与方法的有机整合。
整合生物信息学的最大特点就是整合,不仅整合了生物信息学的研究方法和技术,也是在更大的层次上整合生命科学、计算机科学、数学、物理学、化学、医学,以及工程学等各学科。其生物数据整合从微观到宏观,应用领域整合涉及工、农、林、渔、牧、医、药。本文将就整合生物信息学的生物数据整合、学科技术整合及其他方面进行初步的介绍和探讨。
二、生物数据挖掘与整合
生物系统的不同性质的组分数据,从基因到细胞、到组织、到个体的各个层次。大量组分数据的收集来自实验室(湿数据)和公共数据资源(干数据)。但这些数据存在很多不利于处理分析的因素,如数据的类型差异,数据库中存在大量数据冗余以及数据错误;存储信息的数据结构也存在很大的差异,包括文本文件、关系数据库、面向对象数据库等;缺乏统一的数据描述标准,信息查询方面大相径庭;许多数据信息是描述性的信息,而不是结构化的信息标示。如何快速地在这些大量的包括错误数据的数据量中获取正确数据模式和关系是数据挖掘与整合的主要任务。
数据挖掘是知识发现的一个过程,其他各个环节,如数据库的选择和取样,数据的预处理和去冗余,错误和冲突,数据形式的转换,挖掘数据的评估和评估的可视化等。数据挖掘的过程主要是从数据中提取模式,即模式识别。如DNA序列的特征核苷碱基,蛋白质的功能域及相应蛋白质的三维结构的自动化分类等。从信息处理的角度来说,模式识别可以被看作是根据一分类标准对外来数据进行筛选的数据简化过程。其主要步骤是:特征选择,度量,处理,特征提取,分类和标识。现有的数据挖掘技术常用的有:聚类、概念描述、连接分析、关联分析、偏差检测和预测模型等。生物信息学中用得比较多的数据挖掘的技术方法有:机器学习,文本挖掘,网络挖掘等。
机器学习通常用于数据挖掘中有关模式匹配和模式发现。机器学习包含了一系列用于统计、生物模拟、适应控制理论、心理学和人工智能的方法。应用于生物信息学中的机器学习技术有归纳逻辑程序,遗传算法,神经网络,统计方法,贝叶斯方法,决策树和隐马尔可夫模型等。值得一提的是,大多数数据挖掘产品使用的算法都是在计算机科学或统计数学杂志上发表过的成熟算法,所不同的是算法的实现和对性能的优化。当然也有一些人采用的是自己研发的未公开的算法,效果可能也不错。
大量的生物学数据是以结构化的形式存在于数据库中的,例如基因序列、基因微阵列实验数据和分子三维结构数据等,而大量的生物学数据更是以非结构化的形式被记载在各种文本中,其中大量文献以电子出版物形式存在,如PubMed Central中收集了大量的生物医学文献摘要。
文本挖掘就是利用数据挖掘技术在大量的文本集合中发现隐含的知识的过程。其任务包括在大量文本中进行信息抽取、语词识别、发现知识间的关联等,以及利用文本挖掘技术提高数据分析的效率。近年来,文本挖掘技术在生物学领域中的应用多是通过挖掘文本发现生物学规律,例如基因、蛋白及其相互作用,进而对大型生物学数据库进行自动注释。但是要自动地从大量非结构性的文本中提取知识,并非易事。目前较为有效的方法是利用自然语言处理技术NLP,该技术包括一系列计算方法,从简单的关键词提取到语义学分析。最简单的NLP系统工作通过确定的关键词来解析和识别文档。标注后的文档内容将被拷贝到本地数据库以备分析。复杂些的NLP系统则利用统计方法来识别不仅仅相关的关键词,以及它们在文本中的分布情况,从而可以进行上下文的推断。其结果是获得相关文档簇,可以推断特定文本内容的特定主题。最先进的NLP系统是可以进行语义分析的,主要是通过分析句子中的字、词和句段及其相关性来断定其含义。
生物信息学离不开Internet网络,大量的生物学数据都储存到了网络的各个角落。网络挖掘指使用数据挖掘技术在网络数据中发现潜在的、有用的模式或信息。网络挖掘研究覆盖了多个研究领域,包括数据库技术、信息获取技术、统计学、人工智能中的机器学习和神经网络等。根据对网络数据的感兴趣程度不同,网络挖掘一般还可以分为三类:网络内容挖掘、网络结构挖掘、网络用法挖掘。网络内容挖掘指从网络内容/数据/文档中发现有用信息,网络内容挖掘的对象包括文本、图像、音频、视频、多媒体和其他各种类型的数据。网络结构挖掘的对象是网络本身的超连接,即对网络文档的结构进行挖掘,发现他们之间连接情况的有用信息(文档之间的包含、引用或者从属关系)。在网络结构挖掘领域最著名的算法是HITS算法和PageRank算法(如Google搜索引擎)。网络用法挖掘通过挖掘相关的网络日志记录,来发现用户访问网络页面的模式,通过分析日志记录中的规律。通常来讲,经典的数据挖掘算法都可以直接用到网络用法挖掘上来,但为了提高挖掘质量,研究人员在扩展算法上进行了努力,包括复合关联规则算法、改进的序列发现算法等。
网络数据挖掘比单个数据仓库的挖掘要复杂得多,是一项复杂的技术,一个难以解决的问题。而XML的出现为解决网络数据挖掘的难题带来了机会。由于XML能够使不同来源的结构化的数据很容易地结合在一起,因而使搜索多个异质数据库成为可能,从而为解决网络数据挖掘难题带来了希望。随着XML作为在网络上交换数据的一种标准方式,目前主要的生物信息学数据库都已经提供了支持XML的技术,面向网络的数据挖掘将会变得非常轻松。如使用XQuery 标准查询工具,完全可以将 Internet看作是一个大型的分布式XML数据库进行数据浏览获取、结构化操作等。
此外,数据挖掘还要考虑到的问题有:实时数据挖掘、人为因素的参与、硬件设施的支持、数据库的误差问题等。
一般的数据(库)整合的方法有:联合数据库系统(如ISYS和DiscoveryLink), 多数据库系统(如TAMBIS)和数据仓库(如SRS和Entrez)。这些方法因为在整合的程度,实体化,查询语言,应用程序接口标准及其支持的数据输出格式等方面存在各自的特性而各有优缺点。同时,指数增长的生物数据和日益进步的信息技术给数据库的整合也带来了新的思路和解决方案。如传统的数据库主要是提供长期的实验数据存储和简便的数据访问,重在数据管理,而系统生物学的数据库则同时对这些实验数据进行分析,提供预测信息模型。数据库的整合也将更趋向数据资源广、异质程度高、多种数据格式、多途径验证(如本体学Ontology的功能对照)、多种挖掘技术、高度智能化等。
三、生命科学与生物信息学技术的整合
生物信息学的研究当前还主要集中在分子水平,如基因组学/蛋白质组学的分析,在亚细胞、细胞、生物组织、器官、生物体及生态上的研究才刚刚开始。从事这些新领域的研究,理解从基因型到表型的生命机理,整合生物信息学将起到关键性的作用。整合生物信息学将从系统的层次多角度地利用已有的生物、信息技术来研究生命现象。另外,由其发展出的新方法、新技术,其应用潜力也是巨大的。图2显示了生命科学与生物信息学技术的整合关系。
目前生命科学技术如基因测序、QTL定位、基因芯片、蛋白质芯片、凝胶电泳、蛋白双杂交、核磁共振、质谱等实验技术,可以从多方面,多角度来分析研究某一生命现象,从而针对单一的实验可能就产生大量的不同层次的生物数据。对于每个技术的数据分析,都有了大量的生物信息学技术,如序列分析、motif寻找、基因预测、基因注解、RNA分析、基因芯片的数据分析、基因表达分析、基因调控网络分析、蛋白质表达分析、蛋白质结构预测和分子模拟、比较基因组学研究、分子进化和系统发育分析、生物学系统建模、群体遗传学分析等。整合生物信息学就是以整合的理论方法,通过整合生物数据,整合信息技术来推动生命科学干实验室与湿实验室的组合研究。其实践应用涉及到生物数据库的整合、功能基因的发现、单核苷酸多态性/单体型的了解、代谢疾病的机理研究、药物设计与对接、软件工具以及其他应用。
在整合过程中,还应该注意以下几方面内容:整合数据和文本数据挖掘方法,数据仓库的设计管理,生物数据库的错误与矛盾,生物本体学及其质量控制,整合模型和模拟框架,生物技术的计算设施,生物信息学技术流程优化管理,以及工程应用所涉及的范围。
四、学科、人才的整合
整合生物信息学也是学科、教育、人才的整合。对于综合性高等院校,计算机科学/信息学、生物学等学科为生物信息学的发展提供了学科基础和保障。如何充分利用高校雄厚的学科资源,合理搭建生物信息学专业结构,培养一流的生物信息学人才,是我们的任务和目标。
计算机科学/信息学是利用传统的计算机科学,数学,物理学等计算、数学方法,如数据库、数据发掘、人工智能、算法、图形计算、软件工程、平行计算、网络技术进行数据分析处理,模拟预测等。生物信息学的快速发展给计算机科学也带来了巨大的挑战和机遇,如高通量的数据处理、储存、检索、查询,高效率的算法研究,人工智能的全新应用,复杂系统的有效模拟和预测。整合生物信息学的课程设计可以提供以下课程:Windows/Unix/Linux操作系统、C++/Perl/Java程序设计、数据库技术、网络技术、网络编程、SQL、XML相关技术、数据挖掘,机器学习、可视化技术、软件工程、计算机与网络安全、计算机硬件、嵌入式系统、控制论、计算智能,微积几何、概率论、数理统计、线性代数、离散数学、组合数学、计算方法、随机过程、常微分方程、模拟和仿真、非线性分析等等。
生物学是研究生命现象、过程及其规律的科学,主要包括植物学等十几个一级分支学科。整合生物信息学的课程设计可以提供以下课程:普通生物学、生物化学、分子生物学、细胞生物学、遗传学、分子生物学、发育生物学、病毒学、免疫学、流行病学、保护生物学、生态学、进化生物学、神经生物学、基础医学、生物物理学、细胞工程、基因工程、分子动力学、生物仪器分析及技术、植物学、动物学、微生物学及其他生物科学、生物技术专业的技能课程。
作为独立学科的生物信息学,其基本的新算法,新技术,新模型,新应用的研究是根本。课程涉及到生物信息学基础、生物学数据库、生物序列与基因组分析、生物统计学、生物芯片数据分析、蛋白质组学分析、系统生物学、生物数据挖掘与知识发现、计算生物学、药物设计、生物网络分析等。另外,整合生物信息学的工程应用,也需要了解以下学科,如生物工程、生物技术、医学影像、信号处理、生化反应控制、生物医学工程、数学模型、试验设计、农业系统与生产等。
此外,整合生物信息学的人才培养具有很大的国际竞争压力,培养优秀的专业人才,必须使其具备优良的生物信息科学素养,具有国际视野,知识能力、科研创新潜力俱佳的现代化一流人才。所以要始终紧跟最新的学术动态和发展方向,整合学科优势和强化师资力量,促进国际交流。
五、总结及展望
二十一世纪是生命科学的世纪,也是生物信息学快速不断整合发展的时代,整合生物学的研究和应用将对人类正确认识生命规律并合理利用产生巨大的作用。比如进行虚拟细胞的研究,整合生物信息学提供了从基因序列,蛋白结构到代谢功能各方面的生物数据,也提供了从序列分析,蛋白质拓扑到系统生物学建模等方面的信息技术,从多层次、多水平、多途径进行科学研究。
整合生物信息学是基于现有生物信息学的计算技术框架对生命科学领域的新一轮更系统全面的研究。它依赖于生物学,计算机学,生物信息学/系统生物学的研究成果(包括新数据、新理论、新技术和新方法等),但同时也给这些学科提供了更广阔的研究和应用空间,并推动整个人类科学的进程。
我国的生物信息学教育在近几年已经有了长足的进步和发展。未来整合生物信息学人才的培养还需要加强各学科有效交叉,尤其是计算机科学,要更紧密地与生命科学结合起来,共同发展,让我们的生命科学、计算机科学和生物信息学的教育和科研走得更高更前沿。
作者简介:
摘要:为培养医学院校生物科学和生物技术专业学生的生物信息学基础知识的掌握和软件的应用能力,结合近年该课程的教育教学改革实践,不断探索科学完善的教学体系和教学模式。从教学内容、教学方式和实践能力培养等几个方面进行了探索与实践。使学生在生物大数据时代,具备初步的生物信息学分析技能和实践操作能力。
关键词:生物信息学;生物科学;生物技术;教学模式改革
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2017)26-0145-02
一、开设生物信息学课程的必要性
生物信息学学科发展迅速,不断与其他学科相互渗透,而医学院校生物科学和生物技术专业的学生主要从事生命科学相关的研发和技术,涉及生物、医药、食品、环境、农业等领域。掌握生物信息学这门工具,为今后走上工作岗位,提供新的研究手段和途径是十分必要的。因此,在医学院校部分专业(如生物科学,生物技术等)开设生物信息学必选课程具有重要意义。
二、目前存在的问题
1.教学内容陈旧和教学资源缺乏。我国高等院校开设生物信息学时间相对较晚,在教材选择中首先调研了其他院校和目前出版的教材内容情况。发现大部分生物信息学教材都包括生物大分子(核酸和蛋白质)的信息资源,基因组分析信息资源,数据库搜索软件,核酸序列分析和多序列比对等软件的核心内容,除了共性的章节外,不同的教材内容和重点各不相同。但是生物信息学发展迅速,除了基础内容外,大部分内容都在快速地更新,比如引物设计软件的使用等。而目前,生物信息学教学资源较匮乏,完善的生物信息学课程的教学大纲、教案、教学视频、多媒体课件和习题等教学资源稀少。
2.课程内容与教学课时不匹配,教学进程安排不够合理。首先,由于生物信息学是一门多学科交叉的综合性学科,生物信息学课程学习前需要理解和掌握一些生命科学相关知识背景,如基因组学、蛋白质组学、生物化学、分子生物学和遗传学等,深刻理解一些生物学基本概念,如基因序列、蛋白质序列、非编码区、启动子等,并初步了解一些重要的生物学数据库。因此,讲解透彻该门课程需要教师在课堂上花费一定的时间介绍相关背景知识。然而由于医学院校学生课程门类众多,客观条件决定无法为生物信息学安排足够多的课时。目前我校教学大纲规定的授课仅为20学时,学时少与教学内容多的矛盾就显得非常突出。教师需要在有限的教学时数下灌输大量内容,因此无法深入讲解每个章节的内容,增加了学生学习的难度,降低了教学质量。
其次,教学进程安排不够合理。以我校生物技术专业学生为例,本科二年级第一学期学习生物信息学课程。此阶段学生虽然学习了一年多的专业基础理论知识,但是专业基础知识较为薄弱,同时实验设计等相关实践较少,缺乏对实验细节的理解与实验设计的整体把握。而生物信息学课程是一门实践性学科,所以有必要在生物信息学课程的教学中渗透实验设计的理念,课程学习中灵活运用专业基础知识,达到学生的专业基础知识与生物信息学的知识与不脱节,从而激发学生学习热情。
3.教学模式单一,理论与实践教学脱节。对于医学院校生物科学和生物技术专业的学生,本课程培养的主要目标是:如何在现有数据库中查找想要的信息,如何通过在线程序或利用现有的分析软件,处理相关数据,解决生物学问题。学生需要通过亲身实践,才能熟练掌握生物信息学的数据库、分析方法、软件。但是很多医学院校教学条件有限,没有相应的计算机实训室,配套软件也相对匮乏,教师在授课过程中根据课件照本宣科,并不能结合具体实例边讲解边示范操作,同时,多数高校开设的生物信息学课程以理论教学为主,缺乏实践教学课时。然而,生物信息学的学习,如数据库的检索与使用、序列比对分析软件的应用、引物设计软件的应用等都需要学生在实践课中进行验证或操作,理论知识与实践环节脱节严重,从而影响了学生对课程的理解和掌握。
三、生物信息学教学模式改革探索
1.修改理论教学大纲,精选教学内容。由于生物信息学内容繁多,应针对不同专业特点精心挑选授课内容,在有限的课时中让学生学到最基本且重要的生物信息学理论知识。目前我们选用的是浙江大学出版社第一版的生物信息学,结合生物科学和生物技术两个专业的特点,本教学团队编写了教学大纲,对教材内容进行了更新和优化,将重点集中于应用性较强的生物信息学实践分析技能和离线单机版生物信息学软件的使用上,具体内容包括核酸及蛋白序列数据库、序列的相似性搜索、序列比对、系统进化树的构建以及蛋白质的结构与预测和引物设计等基本内容。同时考虑生物信息学学科的前沿性和交叉性,我们又增加了蛋白质组学和非编码RNA,基因芯片、qPCR、深度测序等操作原理及流程预测等内容。为了适应生物信息学快速发展的要求,扩大学生的知识面,推荐了包括DavidW .Mount编写的《Bioinformatics Sequence and Genome Analysis》和国家“十一五”规划教材李霞主编的生物信息学等几种不同类型的参考教材供同学课外阅读。
2.创新教学方式,推行灵活多样的教学模式。生物信息学的课程学习和软件使用与网络的使用紧密相关,一方面,为克服学生多,无法使每位学生实时进行电脑操作的弊端,我们利用能够接收无线网络信号的设备,实现上课时教室内有网络,这样在授课过程中就可以实时在线带领学生进行生物信息学分析,如稻菘獠檠、序列提交过程、蛋白质结构域分析、蛋白理化性质及结构预测等重要内容,通过实时演示连贯教学内容,让学生得到了更加直观的实践体验,加深了对各种分析方法的学习和理解[1]。另一方面,由于课程学时(仅20学时)的限制,学生们不可能完全依赖课堂时间很好的掌握该课程,除了采取集中授课方式之外,本团队利用搭建的“分子生物学”省级精品资源共享课程网络平台,开辟了“生物信息学”专栏,提供相关文献、相关分析软件及其使用步骤等信息;并聘请校内外相关领域专家开展专题讲座,组织相关领域青年教师开展专题研讨等形式,从而加深学生对课程内容的理解。
3.紧密联系科研,开展基于实践的问题式教学。针对生物信息学课程的特点,打破应试考核方式,本教学团队注重理论结合实践的问题式教学方式引导。一方面,各专业课程中增加实践教学课程比例,根据生命科学的发展,不断充实实践教学内容,增加综合性、设计性实验,从而将生物信息学技术渗入日常教学环节中;另一方面,面向全校招募相关领域青年教师,鼓励并指导学生参与青年教师科研项目,并积极申报国家级和省级大学生科研项目。目前创新性实验和探索性实验全面覆盖生物科学和生物技术专业全体学生,学生在解决科研问题时逐步学会运用生物信息学知识,如文献查阅、目的基因序列的获取、基因序列的分析方法等,提高了学生生物信息学知识和技术的实践能力和理论理解力。
四、结语
生物信息学是生命科学领域研究的重要的工具和载体[2],针对生物信息学课程的特点,医学院校生物信息课程的改革可进一步加强理论教学的系统性、规范性和针对性,提高学生对生物信息学知识的应用能力。在课程体系建设基础上,大胆尝试新的教学方法和手段,突出医学特色,培养适用于现代精准医疗的创新型生物学专业人才。
参考文献:
关键词:石榴;二氢黄酮醇 4-还原酶(DFR);生物信息学;理化性质;跨膜结构
中图分类号:Q811.4文献标识号:A文章编号:1001-4942(2013)04-0008-04
基于生物学试验数据,由分子生物学和信息科学技术相结合的生物信息学已成为后基因组时代用于揭示和探索生命奥秘的重要方法[8,9]。本研究采用生物信息学的方法,以石榴为重点,对红花石榴、粉花石榴、姜荷花、芍药、水母雪莲、大丽花、瓜叶菊和兰花等植物DFR核苷酸及相应氨基酸序列的外显子、理化特性、亲水性/疏水性和跨膜结构等进行预测和推断,以期为深入开展二氢黄酮醇4-还原酶的酶学特性、花色素苷生物合成的分子机制等提供理论依据。
1材料与方法
11数据
12方法
DFR基因核苷酸序列分析采用在线软件 GENE SCAN 进行;DFR基因编码蛋白的理化性质采用Protparam 预测;疏水性/亲水性采用ProtScale进行预测;跨膜结构域采用 TMPred 预测。各分析软件的网站见表 1。
2结果与分析
21核苷酸序列的外显子分析
一般认为,P 值表示分析结果为外显子的可能性,当 P>099 时为外显子可能性极高;050
22氨基酸序列的理化性质分析
利用在线分析软件Protparam分别对石榴、姜荷花、芍药、水母雪莲、大丽花、瓜叶菊和兰花等植物DFR氨基酸序列的理化性质进行分析,结果(表3)表明,这几种植物DFR氨基酸残基数差异较大,分别编码280~1 345个氨基酸残基不等。几种植物的分子量大小差异也较大,粉花石榴DFR分子量最小为36 2487 D,姜荷花DFR分子量最大为108 3167 D。等电点PI差异较小,均在5左右。几种植物中,含量最丰富的氨基酸是Ala、Gly、Cys和Thr,带正电荷和负电荷氨基酸数均为0。通常不稳定系数小于 40 时,预测对应蛋白质在试验中比较稳定,反之则不稳定。因此,除粉花石榴和红花石榴中DFR属于不稳定蛋白质外,其余均属于稳定蛋白。
23疏水性/亲水性的预测与分析
利用在线分析软件ProtScale的Kyte and Doolittle算法对二氢黄酮醇还原酶进行疏水/亲水性分析(正值表示疏水性,负值表示亲水性,介于+05~-05 之间主要为两性氨基酸)。结果(表4)表明,红花石榴(图1,其它几种植物的图片分析结果未列出)和粉花石榴的DFR蛋白存在明显的疏水区和亲水区,其中第141位最低,为-0222,第216位最高,值为2022,为亲水性蛋白。
3讨论与结论
通过在线分析工具和生物软件对红花石榴、粉花石榴、姜荷花、芍药、水母雪莲、大丽花、瓜叶菊和兰花等植物进行分析,结果表明这几种植物的DFR基因都存在1个外显子。氨基酸序列的理化性质分析表明,粉花石榴和红花石榴的二氢黄酮醇还原酶蛋白属于不稳定蛋白,其余几种植物属于稳定性蛋白。几种观赏植物DFR基因中,含量最丰富的氨基酸是Ala、Gly、Cys和Thr,这与陈大志等[8]在拟南芥等植物上得到的含量最丰富的氨基酸基本均为Ala、Glu、Leu、Lys和Val不一致,可能与物种自身的特性有关。除红花石榴和粉花石榴外,其它植物的蛋白质均为稳定蛋白质。
疏水性是20种氨基酸都固有的特性,即氨基酸远离周围水分子,将自己包埋进蛋白质核心的相对趋势,通过了解肽链中不同肽段的疏水性,可以对跨膜蛋白的跨膜结构域进行预测[11]。因此,疏水性/亲水性的预测和分析,对蛋白二级结构的预测及功能结构域的分选提供了重要的参考依据。本试验结果表明,几种植物DFR蛋白中亲水性氨基酸和疏水性氨基酸均匀分布在整条肽链中,亲水性氨基酸多于疏水性氨基酸,均为亲水性蛋白,存在疏水区和亲水区,疏水位点和亲水位点个数不同,这与肖继坪等[12]在马铃薯上的研究结果一致。
跨膜结构是蛋白质通过与膜内在蛋白的静电相互作用和氢键键合作用与膜结合的一段氨基酸片段,一般由 20 个左右的疏水性氨基酸残基组成,主要形成α- 螺旋[13~14]。本试验结果表明,几种植物DFR蛋白存在强烈推荐和可选择2种跨膜模型,存在不同数量的跨膜螺旋,这为正确认识和理解蛋白质的功能、结构、分类、方位及细胞中的作用部位等均有重要的意义。
参考文献:
[1] Winkel-Shirley B Flavonoid biosynthesis A colorful model for genetics, biochemistry, cell biology and biotechnology [J] Plant Physiol, 2001, 126(2): 485-493
[2]李云, 卢其能, 赵昶灵, 等 二氢黄酮醇4-还原酶基因的结构与功能研究[J] 安徽农业科学, 2011, 39(26): 15858 -15859, 15861
[3]刘娟, 冯群芳, 张杰 二氢黄酮醇4-还原酶基因(DFR)与花色的修饰[J] 植物生理学通讯, 2005, 41(6): 715-719
[4]李春雷,崔国新,许志茹, 等植物二氢黄酮醇4-还原酶基因的研究进展[J]生物技术通讯,2009,20(3):442-445
[5]O’Reilly C, Shepherd N S, Pereira A, et al Molecular cloning of the allocus in Zea mays using the transposable elements En and Mul[J] EMBO J, 1985,4(4): 877-882
[6]Nakatsuka A, Izumi Y, Yamagishi M Spatial and temporal expression of chalcone synthase and dihydroflavonol 4 - reductase genes in the Asiatic hybrid lily[J] Plant Science, 2003, 165(4): 759-767
[7]Fukusaki E, Kawasaki K, Kajiyama S, et al Flower color modulations of Torenia hybridaby downregulation of chalcone synthase genes with RNA interference[J] J Biotechnol, 2004, 111(3): 229-240
[8]陈大志, 周嘉裕, 李萍 二氢黄酮醇4-还原酶的生物信息学分析[J] 生物技术通报, 2010, 12: 206-212
[9]孟鹏, 李根英, 陈国强, 等 向日葵抗坏血酸过氧化物酶的电子克隆和生物信息学分析[J] 山东农业科学, 2012, 44(6):1-6
[10]付海辉, 辛培尧, 许玉兰, 等 几种经济植物UFGT基因的生物信息学分析[J] 基因组学与应用生物学, 2010, 30(1):92-102
[11]李嵘, 王品之 植物萜类合成酶3-羟基-3-甲基戊二酰辅酶A还原酶的生物信息学分析[J] 广西植物, 2006,5:464-473
[12]肖继坪, 王琼, 郭华春 彩色马铃薯二氢黄酮醇4 -还原酶(DFR)基因的克隆及生物信息学分析[J] 分子植物育种, 2011, 9(6): 728-735
生物信息学是在生命科学、计算机科学和数学的基础上逐步发展而形成的一门新兴交叉学科,其实质就是利用信息科学与技术对生物数据进行获取、处理、存储、、分析和解释,进而揭示纷繁复杂的数据中所蕴含的生物学本质[1]。作为21世纪生命科学领域发展最为迅速的学科之一,生物信息学已经成为生命科学研究领域的重要学科[2]。实验室的每一项技术,从简单的基因克隆、基因数据分析到生物大分子进化研究都需要应用到生物信息学,因此,对于生物类专业的学生而言,掌握生物信息学的相关知识尤为重要。我国各大专院校都在不断努力创新和改进现有生物信息学课程的教学方法与方式。因此,作者结合近五年来开设生物信息学课程的教学实践,分析了目前生物信息学课程教学中存在的主要问题,提出几点建议,希望能够有助于推动生物类专业生物信息学课程教学质量的提高。
一、生物类专业生物信息学课程教学中的问题
1.生物信息学教材的选择。生物信息学的发展速度快、内容广泛,目前很多国内高校使用的教材多为国外教材的影印版或者中文翻译版本,国内引进的生物信息学相关的英文原版教材中有些属于科普性质,内容过于简单,而有些偏重介绍生物信息学的计算方法或模型的建立,过于复杂[3]。而国内相关教材更新较慢,课堂内容涵盖的知识面和知识点相对减缩,而且一些前沿的数据和先进软件没有讲授,这些对学生的发展和生物信息知识的合理运用极为不利[4],因此,目前导致很多高校教师无法选择适用于生物类专业的生物信息学教材。
2.教学大纲安排不合理。生物信息学是一门集分子生物学、计算机科学和数学等多个学科的交叉学科,它囊括了基因数据获取、基因预测、序列比对、序列拼接、分子进化、蛋白质序列分析、蛋白质结构预测、分子建模、药物设计以及基因芯片蛋白芯片等内容模块,同时各领域内容还涉及到具体的计算方法、概率统计、机器语言等知识模块。由于课时设置有限,如果教师在课堂教学对各领域内容面面俱到,会造成大部分内容都只是蜻蜓点水,学生学完以后虽然接触了很多东西,但在生物研究中遇到实际问题还是束手无策。
3.教学内容滞后。生物信息学是一个快速发展的学科,随着生物学科自身的发展和研究的深入,新的数据库和信息资源不断涌现,各种数据库和软件的更新换代非常频繁,如果教师所讲授的在线服务器、分析软件、讲解实例都不是当前最普遍的,学生学完后打开最新的在线服务器或是相关分析软件依然不会操作。
4.教学方法和教学手段存在不足。生物信息学教学普遍采用普通教室多媒体讲授,而生物信息学课程是一个实践操作课,学生经常要动手操作,普通多媒体教学与实践操作教学相脱节。传统的讲授很难与实践教学效果相比,很多学生虽完成了生物信息学课程学习,也接受了很多生物信息学的理论知识,但在进入大四阶段做课题研究完成毕业论文时,遇到需要在数据库查询序列、用软件分析序列或蛋白性质、结构特点等问题时依然束手无策。
二、生物类专业生物信息学课程教学建议
1.调整教学大纲。对于生物类专业的学生来说,生物信息学是生物研究中的辅助工具,不需要掌握生物信息学算法或软件编程细节,而是培养学生运用生物信息学的方法来解决生物研究中遇到的问题,比如能够应用检索工具查找序列等相关的数据信息、利用比对软件或是BLAST在线服务器对感兴趣的序列进行比对分析、选择适当的建树方法对DNA或蛋白序列进行系统发育树的构建、可分析蛋白序列信息并预测其三维结构以及引物设计等。因此对于生物类专业学生的教学,应重点培养学生的实践能力,尤其是关于数据库的使用和分析软件的操作,使他们以后在生物相关领域的工作中能学以致用,所以对于当前生物类专业的培养目标应以应用为核心安排教学大纲。据此,确定了以下的教学内容:教学内容共54学时,分为理论基础和上机实践两部分。理论教学内容共36学时包括:生物信息学绪论、生物信息数据库的查询与搜索、基因和蛋白质序列比对、序列拼接、生物进化与分子系统发育分析、基因预测与引物设计、蛋白质结构及其预测、计算机辅助药物设计;上机实践共18学时包括:常用生物数据库的查询与搜索、核酸序列检索与分析、多重序列比对和系统发育树的构建、PCR引物设计及评价、蛋白质序列分析及结构预测。
2.教学内容主次分明。由于生物信息学技术及分析手段更新迅速,教学内容会显得越来越臃肿,作者建议对于生物类专业的学生可以以生物信息学方法的掌握和生物信息学工具的应用来设计教学内容,关于生物信息学本身涉及到的一些数学模型和编程算法,可简略讲授,教学过程中尽量把有限的教学学时用到以生物信息学为工具解决生物学研究问题的教学中去,避免“面面俱到”的灌输式教育。例如,对于讲授序列比对这一章的知识,关于序列比对所使用的方法PAM和BLOSUN矩阵,对于如何采用数学方法构建这些计分矩阵过程可略过,只需简要介绍PAM和BLOSUN矩阵的概念意义以及用途,重点放在如何使用生物信息学软件进行序列比对,并理解各参数设置的意义。另外,在生物信息学各教学内容模块中涉及到的相关数据库及软件种类繁多,其数量在不断增加,版本也在不断更新。例如在讲授生物信息数据库的查询与搜索这一章节时,涉及到的数据库有核酸序列数据库、蛋白质序列数据库、蛋白质结构数据库、基因组数据库、蛋白组数据库、代谢组数据库等,而每个种类又含多个不同的数据库,比如核酸序列数据库有GenBank、EMBL和DDBJ等,蛋白质序列数据库有swiss-prot、TrEMBL、NCBI和UniProt等。因此,我们重点介绍了3大门户网站NCBI、EBI和SIB,其中我们着重介绍了NCBI的用于提取序列信息的工具――Entrez系统,Entrez将科学文献、DNA和蛋白质序列数据库、蛋白质三维结构数据、种群研究数据以及全基因组组装数据整合成一个高度集成的系统。因此我们给学生演示并要求学生掌握如何采用Entrez查询DNA和蛋白质序列等。另外在讲授分子进化与系统发育分析这一章节时,要进行序列比对及系统发育树的构建,可以使用ClustalW、BioEdit、DNAstar、phylip、MEGA、PAUP等本地软件,也可以使用The PhylOgenetic Web Repeater(POWER)和Evolutionary Trace Server等网络在线服务器分析。考虑到软件的通用型、易用性及本专业学生的英语水平、计算机操作水平,我们选择ClustalW进行多序列比对,然后采用phylip软件包构建系统发育树,并要求学生掌握如何使用这两个软件构建系统发育树。MEGA及其他在线服务器只简单介绍具体操作方法作为辅助资料供学生自学。
关键词 生物信息学 教学改革 医学 教学模式
中图分类号:Q811-4 文献标识码:A
21世纪是生命科学的世纪,人类及模式生物基因组计划的全面实施,使分子生物学数据以爆炸性速度增长。面对基因组学、蛋白质组学、基因芯片、分子进化等大量的生物信息,在计算机科学、网络技术以及生物分析技术的相互作用和渗透下,诞生了一门崭新的学科――生物信息学(Bioinformatics)。生物信息学利用计算机和互联网,以数据库为载体,运用数学算法和计算模型,研究生物信息数据的获取、处理、存储、分发、分析和解释等方面,进而阐明和解释庞杂的生物数据所蕴含的意义。生物信息学跨越了整个生命科学领域,近年来在医药学研究中发挥了不可替代的作用,无论是从分子生物学的角度阐述病因,还是对疾病的预防、诊断、治疗与新药研发都将产生巨大的推动作用,医学生物信息学必然在未来的医学研究中处于关键地位,但生物信息学的理工科特性决定了该课程在医学教育中开展的难度。本文结合医学院校特色和生物信息学课程特点,探讨开设医学生物信息学课程的必要性,分析生物信息学课程在教学实践中存在的问题,提出本校开展生物信息学教学的实施方法。
1 医学生物信息学的主要研究内容
1.1 疾病基因的发现与鉴定
约有6000种以上的人类疾患与特异基因的改变有关,某些关键性基因或其产物的结构功能异常,可以直接或间接地导致疾病的发生。使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段。例如:通过构建肿瘤cDNA文库或表达序列标签(expression sequence tag,EST)分析差异表达基因,揭示肿瘤发生的分子水平变化,寻找靶基因。
1.2 药物设计与新药研发
生物信息技术为药物研究、设计提供了崭新的研究思路和手段。利用数据资料、软件工具筛选药物作用的靶位和候选基因,阐明其结构和功能关系,指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物。
生物信息药物设计常用的方法有:①三维结构搜寻,寻找符合特定性质和三维结构的分子,从而发现合适的药物分子。②分子对接,建立大量化合物的三维结构数据库,依次搜索小分子配体使其与受体的活性位点结合,通过优化使得配体与受体的形状和相互作用最佳匹配。③全新药物设计,利用计算机自动设计出与受体活性部位的几何形状和化学性质相匹配的结构新颖的药物分子。
生物信息学方法为药物研制提供了更多的、潜在的靶标,大大减少药物研发的成本,提高研发的质量和效率。
1.3 流行病学研究中的应用
将流行病学的遗传和非遗传性的研究与生物信息学结合起来,会对疾病的机理、个体对某种疾病的易感性和疾病在群体中的分布有更明确的认识,对疾病的预防和治疗有极大的指导意义。
2 医学生物信息学课程的特点及主要困难分析
2.1 课程内容丰富,学科交叉,数据庞杂
生物信息学利用生物学,计算机科学和信息技术揭示大量复杂的生物数据所赋有的生物学奥秘,是一门交叉性学科,并且理科特性很强,需要深入理解分析。目前生物信息学包含了基因组、蛋白质组、代谢及药物等多个部分,每个部分都具有各自的特色和相应的分析技术。根据《Nucleic Acids Research》统计,全球共有约1000多个主要的生物医学数据库,涵盖了生物医学研究的诸多领域。学生不仅要掌握获取和利用海量生物信息的基本知识和技术,还应掌握相关的数学、物理学、计算机程序设计等知识和技术,又因为医学专业学生的数理知识有限,学习起来有一定的困难。
2.2 操作性和实践性强
生物信息学是一门操作性和实践性很强的学科,主要是在互联网环境中,依靠计算机,利用数据库和各种信息处理软件来进行生物信息学方面的分析工作。针对医学专业学生开设生物信息学课程,其教学内容应注重理论与实践紧密结合,着重学习利用计算机对各种生物信息资源和数据库的检索,使用方法与技巧,真正做到学有所用。
2.3 现状与困难分析
目前,国内的生物信息学教学基本沿用以“教师讲授为主”的传统教学模式,与生物信息学交叉前沿性特点不相适应,实验教学单一,多为验证性试验,缺乏综合性和设计性。此外,医学专业学生计算机知识薄弱,对生物信息学的算法与数据库的原理和特点等不甚了解,在高通量数据处理面前力不从心,影响对问题的分析能力。
3 医学生物信息学课程开设实施方法和对策
3.1 根据医学专业特点设计教学内容,建立具有模块化的教学大纲
目前尚未形成系统、成熟的生物信息学教学模式。开设课程之前,对医学专业学生进行问卷调查,让他们选择医学生物信息学课程中感兴趣的、需要学习的知识内容,并提出难点问题。教师汇总问卷结果,对授课内容进行调整,建立模块化的教学大纲,例如:导论模块、数据库及使用模块、基因组信息学及其分析方法模块、蛋白质组生物信息学模块、代谢和药物生物信息学及系统生物学模块等,使学生清楚每个模块的特点和作用,提高学生的学习兴趣,激发学生的学习热情。
3.2 强化实验教学,激发学生的创新思维和创新意识
生物信息学的学习是运用生物医学、数学、以及计算机科学等诸多学科知识进行分析、判断、推理、综合的实践过程,强化实验教学显得尤为重要。另外,采用PBL(Problem Based Learning)教学法,可以有效地激发学生的创新思维和创新意识。
3.2.1 注重实验操作
生物信息学实验课程以计算机操作为主,需要学生灵活应用互联网、数据库和多种生物信息学软件,所以实验操作显得尤为重要,加大实验比例,为学生提供较多的实验操作机会,不仅提高了学生的动手能力,而且大大提高了学生在因特网环境下对生物大分子序列、生物大分子结构进行生物信息学分析的能力,是提高学生学习生物信息学效果的有力保障。
3.2.2 采用PBL教学模式,优化实验内容
加大设计性实验的比例,采用PBL教学法,根据学生能力和兴趣进行分组,由教师提出问题并布置真实性任务,使学生在已有的知识基础上,通过查找文献、小组讨论、探索,最终完成任务,写出试验报告。由教师对任务完成过程及结果进行点评,对学生掌握知识的程度及学生的科研、应用能力进行评价,并提出进一步的提高方向。学生在实验操作的过程中,不断地发现问题、解决问题,有效地激发了学生的创新思维和创新意识。
3.3 改革教学方法,革新考核方式
3.3.1 结合多媒体技术与双语教学
多媒体技术教学灵活生动,教师在讲授难于理解的概念和生物信息学工具时,可以直接打开相关软件和网站进行演示,使抽象的生物信息学知识以具体的、动态的形式展现出来,从而加深学生对课程的掌握程度。此外,生物信息学涉及到的数据库、网站、应用软件多为英文界面,所以双语授课显得尤为重要,教师可借助多媒体,对课程进行中英整合讲解。
3.3.2 结合科研实例进行教学
生物信息学是一门不断完善和发展的学科,数据库的更新、相关软件的升级、算法的优化等,通常会随着科研中遇到的生物学问题变化而变化,所以教师可以结合现阶段的科研背景和具体的研究方向,结合实例进行教学,可以让学生真正掌握利用生物信息学方法解决生物学问题的思路,并培养和提高学生的科学思维能力,使学生由知识的被动接受者变为知识的主动发现者、探究者,教师则由知识的传授者转变为教学活动的指导者、组织者。
3.3.3 采用无纸化考核方式
适当降低课程理论难度,减少不必要的数学理论推导,注重实际应用、解决问题能力的培养,通过上机实践操作,考核学生对基本知识和原理的掌握情况,克服传统的死记硬背现象。
4.结语
生物信息学作为一门交叉学科,发挥了其独特的桥梁作用,已经广泛地渗透到医学的各个研究领域。本文针对开设医学生物信息学课程的必要性和教学模式进行了探讨,以提高学生学习的自主性、实际操作能力和解决问题的应用能力为目标,不断改进教学手段、加强教学过程的趣味性,以期培养综合型的、高素质、现代化医学人才。
参考文献
[1] 伍欣星,赵.生物信息学基础与临床医学应用指南[M].北京:科学出版社,2005.
[2] 张阳德.生物信息学[M].北京:科学出版社,2009.
[3] WeiLi-ping,YuJun.BioinformaticsinChina:APersonalPerspective[J].PlosComputationalBiology,2008,4(4):e1000020.
[4] 汪凡军,张楚瑜.生物信息学在医学上的应用[J].国际检验医学杂志,2006,27(2).
此书是WILEY从书“生物信息学:计算技术与应用”中的一本。蛋白质生物信息学在生物医药研发中具有广泛的应用,比如先导化合物设计、分子对接、药理活性预测等等。本书汇集了蛋白质生物信息学领域最为前沿的主题,既有对技术演变的解析,也有很多具体的应用实例。
本书共有5大部分26章。第1部分 从蛋白质序列到结构,含第1-5章:1.蛋白质技术成为研究植物发育遗传的重要工具;2.蛋白质序列主题信息的搜寻;3.识别蛋白质的钙结合位点;4.综述:利用非平衡数据学习方法进行蛋白质甲基化预测;5.蛋白质翻译后修饰位点的分析和预测。第2部分 蛋白质化学分析和测试,含第6-12章:6.蛋白质局部结构的预测;7.预测蛋白质结构的边界;8.预测蛋白质的RNA结合位点;9.检测蛋白质二硫键连接方式的算法框架;10.蛋白质接触序的预测技术进展;11.预测半胱氨酸氧化状态的计算策略;12.冷冻电镜三维结构重构的计算方法。第3部分 蛋白质序列比对及其评估,含第13-17章:13.蛋白质结构比对的基础知识;14.发掘蛋白质3D结构来优化结构比对;15.搜寻非序列性蛋白结构相似性的算法方法论;16.利用分形方法来预测蛋白质类属和功能;17.蛋白质三级结构评估。第4部分 生物网络中的蛋白质相互作用,含第18-22章:18.蛋白质相互作用的网络算法;19.识别蛋白质相互作用网络中的蛋白复合物;20.蛋白质相互作用网络中的功能模块分析;21.代谢网络的高效比对;22.蛋白质相互作用网络的比对:算法和工具。第5部分 蛋白质生物信息学的应用,含第23-26章:23.用支持向量机进行蛋白质分子与药物的活性匹配;24.寻找生物网络中的重复区:挑战、趋势与应用;25.MeTaDoR: 生物膜外周靶向蛋白的网络资源和预测服务;26.基于生物网络的基因表达特征分析。
潘毅是美国乔治亚州立大学计算机系的教授和系主任,中国长沙中南大学客座教授。他的研究兴趣是云计算、无线网络和生物信息学。目前发表了200余篇研究论文。
本书兼具系统性和深入性,每章都是由数位专家精心撰写,适合生物信息学、蛋白质组学、计算机科学领域人员参考。
魏玉保,博士生
单链抗体除本身的治疗作用外,还可作为载体与细胞因子等结合,构建成双功能抗体用于肿瘤的导像治疗。据文献报道[1~3]各衍生因子两个完整基因融合成单一蛋白,经抗肿瘤活性检测发现,融合蛋白具有双重活性,但融合蛋白的亲和性及抗肿瘤活性分别较衍生因子的功能及活性有所变化,可能由于融合蛋白结构变化导致功能及活性的变化。利用生物信息学网络资源分析融合蛋白的二级结构及其理化性质,为进一步探讨单链双功能抗体基因融合蛋白提供依据。
1 双功能抗体的研究进展
随着分子生物学的发展,肿瘤的药敏基因治疗成为各国学者研究的热点[3~5]。将目的基因导入靶细胞是基因治疗过程中的一个重要环节,因为目的基因导入靶细胞效率的高低将直接影响基因治疗的效果甚至成败。由逆转录病毒介导的基因转移所面临的最大问题是病毒转导效率较低,原因之一是由于包装后难以得到稳定产生较高滴度感染性逆转录病毒的包装细胞系。单链抗体(ScFv)是由Fv抗体衍生而来,将抗体重链可变区和轻链可变区通过一段连接肽连接而成,ScFv具有天然抗体的亲和力,而分子只有完整抗体的六分之一。具有分子小、穿透力强、容易进入实体瘤周围的血液循环等特点,体内应用具有较大的分布容积和较高的组织分布比例,ScFv是构建双功能抗体,双特异性抗体等多种新功能抗体分子的理想元件。一个蛋白或蛋白片段可以融合到ScFv片段上以配备附加的性质,如免疫毒素的产生,是通过将一个肿瘤特异的ScFv或Fab融合到一个内源化能杀死靶细胞的毒素上。许多细胞特异抗体可将试剂传递到肿瘤部位发挥其细胞毒元件的作用。肿瘤特异性抗体片段已经与细胞因子融合[4~8]。在这种情况下,称免疫细胞因子的分子注射到患者体内,在肿瘤细胞表面积聚,可以激活肿瘤附近的T淋巴细胞。这些融合蛋白内在的肿瘤结合活性允许使用低浓度,没有通常与系统细胞因子注射相关的副作用。
细胞因子融合蛋白均具有衍生因子的双重活性,其中有一些的活性较各自野生型低,或者与野生型因子的相加一致,或者其活性高于衍生因子的相加活性,人工构建的新蛋白可能具有与衍生因子无关的新活性[9~11]。事实证明:具有不同功能域的复合蛋白质以及连接肽的设计是今后寻找新的治疗因子的有效途径和研究方向。生物信息学可以促进药物的发现和开发过程,即充分利用生物信息学的生物学和遗传学信息来寻找和开发以基因为基础的药物。
2 双功能抗体的表达及其生物学性质的预测
对于cDNA序列包含一个完整的蛋白质编码区,重要的则是分析所编码蛋白质的功能。蛋白质序列的生物信息学分析是从理论分析迈向实验研究的最为重要的部分。如果拟对所感兴趣的基因投入实验研究,那么,基于生物信息学获得尽可能多的关于该基因/蛋白质的信息是十分重要和极其重要的,尤其是当采用生物信息学的分析得到其结构功能域的信息后,将对研究思路的制定提供重要的指导信息[12,13]。
传统生物学认为,蛋白质的序列决定了它的结构,也就决定了它的功能[14,15]。因此,随着近10年来生物学分子序列信息的爆炸性增长,大大促进了各种序列分析和预测技术的发展,目前已经可以用理论预测的方法获得大量的结构和功能信息,用生物信息学的方法,通过计算机模拟和计算来“预测”出未知蛋白质信息或提供与之相关的辅助信息,可以用较低的成本和较快的时间就能获得可靠的结果[16~18]。重组融合蛋白是通过DNA重组的方法,将功能上相关的两种蛋白用连接肽连接,以达到优化蛋白功能的目的,如免疫毒素和细胞因子融合蛋白,并已用于肿瘤治疗。我们在构建融合蛋白之后,运用生物信息学资源DNAssist核酸序列分析软件分析ScFv-TNF-αDNA序列翻译并获得了氨基酸序列,蛋白质分析软件(ANTHEPROT V5)分析融合蛋白的二级结构及其理化性质。利用生物信息学网络资源进行分析预测融合蛋白的性质,为进一步探讨单链双功能抗体基因融合蛋白提供依据。构建重组导向的融合蛋白[19],通过重组PCR方法在编码ScFv与TNF-α的碱基之间引入酶切位点,并克隆到逆转录病毒表达载体PLxSN上表达,用脂质体转染法转染PA317包装细胞,G418筛选10天后共挑选50个细胞集落,扩大培养后测定29个细胞集落的病毒滴度,筛选出一株cfu>1×109/L的感染性重组病毒产生细胞系C26。 转贴于
1 Strube RW,Chen SY.Characterization of anti-cyclin E single-chain Fv antibodies and intrabodies in breast cancer cells:enhanced intracellular stability of novel sFv-F(c) intrabodies.J Immunol MethodsK,2002,263(1-2):149-167.
2 Kim EJ,Cho D,Hwang SY,et al.Interleukin-2 fusion protein with anti-CD3 single-chain Fv (sFv) selectively protects T cells from dexamethasone-induced apoptosis.Vaccine,2001,20(3-4):608-615.
3 Peng LS,Penichet ML,Dela Cruz JS,et al.Mechanism of antitumor activity of a single-chain interleukin-12 IgG3 antibody fusion protein (mscIL-12.her2.IgG3).J Interferon Cytokine Res,2001,21(9):709-720.
4 Scherf U,Benhar I,Webber KO,et al.Cytotoxic and antitumor activity of a recombinant tumor necrosis factor-B1(Fv) fusion protein on LeY antigen-expressing human cancer cells.Clin Cancer Res,1996,2(9):1523-1531.
5 Chen P,Chen CQ,Yao LB,et al.Reconstruction and analysis of a Human small molecular antibody to tumor necrosis factor alpha.Shengwu Huaxue Yu Shengwu Wuli Xuebao,2001,33(1):71-76.
6 Wuest T,Gerlach E,Banerjee D,et al.TNF-Selectokine:a novel prodrug generated for tumor targeting and site-specific activation of tumor necrosis factor.Oncogene,2002,21(27):4257-4265.
7 Ma J,Li Z,Luo D.Single chain antibody vaccination in mice against human ovarian cancer enhanced by microspheres and cytokines.J Drug Target,2003,11(3):169-176.
8 Bremer E,Kuijlen J,Samplonius D,et al.Target cell-restricted and -enhanced apoptosis induction by a scFv:sTRAIL fusion protein with specificity for the pancarcinoma-associated antigen EGP2.Int J Cancer,2004,109(2):281-290.
9 Trevor KT,Hersh EM,Brailey J,et al.Transduction of human dendritic cells with a recombinant modified vaccinia Ankara virus encoding MUC1 and IL-2.Cancer Immunol Immunother,2001,50(8):397-407.
10 Niethammer AG,Xiang R,Ruehlmann JM,et al.Targeted interleukin 2 therapy enhances protective immunity induced by an autologous oral DNA vaccine against murine melanoma.Cancer Res,2001,61(16):6178-6184.
11 Liu X,Zhang L,Zhang M,et al.Co-modification of IL-2-TNF alpha fusion gene and B7.1 gene to murine breast tumor cells leads to improved tumor rejection and vaccine effect.Chin Med J (Engl),2000,113(2):167-171.
12 张成岗,贺福初.生物信息学方法与实践.北京:科学出版社,2002,126-136.
13 黄韧,薛成.生物信息学网络资源与应用.广州:中山大学出版社,2003,237-306.
14 Guex N,Peitsch MC.SWISS-MODEL and the Swiss-PdbViewer:An environment for comparative protein modelling.Electrophoresis,1997,18(15):2714-2723.
15 Guex N,DiemandA,Peitsch MC.Protein modelling for all.TiBS,1999,24(9):364-367.
16 Claverie JM.Effective large-scale sequence similarity searches.Methods Enzymol,1996,266:212-227
17 Guigo R.Computational gene identification.J Mol Med,1997,75(6):389-393.
单链抗体除本身的治疗作用外,还可作为载体与细胞因子等结合,构建成双功能抗体用于肿瘤的导像治疗。据文献报道[1~3]各衍生因子两个完整基因融合成单一蛋白,经抗肿瘤活性检测发现,融合蛋白具有双重活性,但融合蛋白的亲和性及抗肿瘤活性分别较衍生因子的功能及活性有所变化,可能由于融合蛋白结构变化导致功能及活性的变化。利用生物信息学网络资源分析融合蛋白的二级结构及其理化性质,为进一步探讨单链双功能抗体基因融合蛋白提供依据。
1双功能抗体的研究进展
随着分子生物学的发展,肿瘤的药敏基因治疗成为各国学者研究的热点[3~5]。将目的基因导入靶细胞是基因治疗过程中的一个重要环节,因为目的基因导入靶细胞效率的高低将直接影响基因治疗的效果甚至成败。由逆转录病毒介导的基因转移所面临的最大问题是病毒转导效率较低,原因之一是由于包装后难以得到稳定产生较高滴度感染性逆转录病毒的包装细胞系。单链抗体(ScFv)是由Fv抗体衍生而来,将抗体重链可变区和轻链可变区通过一段连接肽连接而成,ScFv具有天然抗体的亲和力,而分子只有完整抗体的六分之一。具有分子小、穿透力强、容易进入实体瘤周围的血液循环等特点,体内应用具有较大的分布容积和较高的组织分布比例,ScFv是构建双功能抗体,双特异性抗体等多种新功能抗体分子的理想元件。一个蛋白或蛋白片段可以融合到ScFv片段上以配备附加的性质,如免疫毒素的产生,是通过将一个肿瘤特异的ScFv或Fab融合到一个内源化能杀死靶细胞的毒素上。许多细胞特异抗体可将试剂传递到肿瘤部位发挥其细胞毒元件的作用。肿瘤特异性抗体片段已经与细胞因子融合[4~8]。在这种情况下,称免疫细胞因子的分子注射到患者体内,在肿瘤细胞表面积聚,可以激活肿瘤附近的T淋巴细胞。这些融合蛋白内在的肿瘤结合活性允许使用低浓度,没有通常与系统细胞因子注射相关的副作用。
细胞因子融合蛋白均具有衍生因子的双重活性,其中有一些的活性较各自野生型低,或者与野生型因子的相加一致,或者其活性高于衍生因子的相加活性,人工构建的新蛋白可能具有与衍生因子无关的新活性[9~11]。事实证明:具有不同功能域的复合蛋白质以及连接肽的设计是今后寻找新的治疗因子的有效途径和研究方向。生物信息学可以促进药物的发现和开发过程,即充分利用生物信息学的生物学和遗传学信息来寻找和开发以基因为基础的药物。
2双功能抗体的表达及其生物学性质的预测
对于cDNA序列包含一个完整的蛋白质编码区,重要的则是分析所编码蛋白质的功能。蛋白质序列的生物信息学分析是从理论分析迈向实验研究的最为重要的部分。如果拟对所感兴趣的基因投入实验研究,那么,基于生物信息学获得尽可能多的关于该基因/蛋白质的信息是十分重要和极其重要的,尤其是当采用生物信息学的分析得到其结构功能域的信息后,将对研究思路的制定提供重要的指导信息[12,13]。
传统生物学认为,蛋白质的序列决定了它的结构,也就决定了它的功能[14,15]。因此,随着近10年来生物学分子序列信息的爆炸性增长,大大促进了各种序列分析和预测技术的发展,目前已经可以用理论预测的方法获得大量的结构和功能信息,用生物信息学的方法,通过计算机模拟和计算来“预测”出未知蛋白质信息或提供与之相关的辅助信息,可以用较低的成本和较快的时间就能获得可靠的结果[16~18]。重组融合蛋白是通过DNA重组的方法,将功能上相关的两种蛋白用连接肽连接,以达到优化蛋白功能的目的,如免疫毒素和细胞因子融合蛋白,并已用于肿瘤治疗。我们在构建融合蛋白之后,运用生物信息学资源DNAssist核酸序列分析软件分析ScFv-TNF-αDNA序列翻译并获得了氨基酸序列,蛋白质分析软件(ANTHEPROTV5)分析融合蛋白的二级结构及其理化性质。利用生物信息学网络资源进行分析预测融合蛋白的性质,为进一步探讨单链双功能抗体基因融合蛋白提供依据。构建重组导向的融合蛋白[19],通过重组PCR方法在编码ScFv与TNF-α的碱基之间引入酶切位点,并克隆到逆转录病毒表达载体PLxSN上表达,用脂质体转染法转染PA317包装细胞,G418筛选10天后共挑选50个细胞集落,扩大培养后测定29个细胞集落的病毒滴度,筛选出一株cfu>1×109/L的感染性重组病毒产生细胞系C26。【参考文献】
1StrubeRW,ChenSY.Characterizationofanti-cyclinEsingle-chainFvantibodiesandintrabodiesinbreastcancercells:enhancedintracellularstabilityofnovelsFv-F(c)intrabodies.JImmunolMethodsK,2002,263(1-2):149-167.
2KimEJ,ChoD,HwangSY,etal.Interleukin-2fusionproteinwithanti-CD3single-chainFv(sFv)selectivelyprotectsTcellsfromdexamethasone-inducedapoptosis.Vaccine,2001,20(3-4):608-615.
3PengLS,PenichetML,DelaCruzJS,etal.Mechanismofantitumoractivityofasingle-chaininterleukin-12IgG3antibodyfusionprotein(mscIL-12.her2.IgG3).JInterferonCytokineRes,2001,21(9):709-720.
4ScherfU,BenharI,WebberKO,etal.Cytotoxicandantitumoractivityofarecombinanttumornecrosisfactor-B1(Fv)fusionproteinonLeYantigen-expressinghumancancercells.ClinCancerRes,1996,2(9):1523-1531.
5ChenP,ChenCQ,YaoLB,etal.ReconstructionandanalysisofaHumansmallmolecularantibodytotumornecrosisfactoralpha.ShengwuHuaxueYuShengwuWuliXuebao,2001,33(1):71-76.
6WuestT,GerlachE,BanerjeeD,etal.TNF-Selectokine:anovelprodruggeneratedfortumortargetingandsite-specificactivationoftumornecrosisfactor.Oncogene,2002,21(27):4257-4265.
7MaJ,LiZ,LuoD.Singlechainantibodyvaccinationinmiceagainsthumanovariancancerenhancedbymicrospheresandcytokines.JDrugTarget,2003,11(3):169-176.
8BremerE,KuijlenJ,SamploniusD,etal.Targetcell-restrictedand-enhancedapoptosisinductionbyascFv:sTRAILfusionproteinwithspecificityforthepancarcinoma-associatedantigenEGP2.IntJCancer,2004,109(2):281-290.
9TrevorKT,HershEM,BraileyJ,etal.TransductionofhumandendriticcellswitharecombinantmodifiedvacciniaAnkaravirusencodingMUC1andIL-2.CancerImmunolImmunother,2001,50(8):397-407.
10NiethammerAG,XiangR,RuehlmannJM,etal.Targetedinterleukin2therapyenhancesprotectiveimmunityinducedbyanautologousoralDNAvaccineagainstmurinemelanoma.CancerRes,2001,61(16):6178-6184.
11LiuX,ZhangL,ZhangM,etal.Co-modificationofIL-2-TNFalphafusiongeneandB7.1genetomurinebreasttumorcellsleadstoimprovedtumorrejectionandvaccineeffect.ChinMedJ(Engl),2000,113(2):167-171.
12张成岗,贺福初.生物信息学方法与实践.北京:科学出版社,2002,126-136.
13黄韧,薛成.生物信息学网络资源与应用.广州:中山大学出版社,2003,237-306.
14GuexN,PeitschMC.SWISS-MODELandtheSwiss-PdbViewer:Anenvironmentforcomparativeproteinmodelling.Electrophoresis,1997,18(15):2714-2723.
15GuexN,DiemandA,PeitschMC.Proteinmodellingforall.TiBS,1999,24(9):364-367.
16ClaverieJM.Effectivelarge-scalesequencesimilaritysearches.MethodsEnzymol,1996,266:212-227
putationalgeneidentification.JMolMed,1997,75(6):389-393.