0
首頁 精品范文 生物信息學(xué)分析

生物信息學(xué)分析

時間:2023-08-17 18:04:59

開篇:寫作不僅是一種記錄,更是一種創(chuàng)造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇生物信息學(xué)分析,希望這些內(nèi)容能成為您創(chuàng)作過程中的良師益友,陪伴您不斷探索和進(jìn)步。

生物信息學(xué)分析

第1篇

>> 擬南芥和大白菜YABBY蛋白家族的生物信息學(xué)分析 黃瓜DVR基因的生物信息學(xué)分析 新疆細(xì)粒棘球絳蟲EgAgB8/3蛋白的生物信息學(xué)分析及意義 人ALK-1近端啟動子的生物信息學(xué)分析 酵母轉(zhuǎn)錄因子結(jié)合位點(diǎn)保守性的生物信息學(xué)分析 FZ6基因及其蛋白的生物信息學(xué)分析 玉米谷胱甘肽過氧化物酶的生物信息學(xué)分析 歐文氏桿菌鐵代謝相關(guān)基因的生物信息學(xué)分析 丹參SmNAC1基因的克隆和生物信息學(xué)分析 小菜蛾p38MAPK基因的克隆與生物信息學(xué)分析 棉鈴蟲類胰蛋白酶的生物信息學(xué)分析 葡萄NAC轉(zhuǎn)錄因子的生物信息學(xué)分析 抗逆性轉(zhuǎn)錄因子NAC的生物信息學(xué)分析 沙棘WRI1轉(zhuǎn)錄因子基因的生物信息學(xué)分析 水稻2個F―box基因的生物信息學(xué)分析 小菜蛾P(guān)xALP1基因的克隆與生物信息學(xué)分析 白樺五個MYB轉(zhuǎn)錄因子的生物信息學(xué)分析 斑馬魚TATA結(jié)合蛋白的生物信息學(xué)分析 C3和C4植物中PEPC的生物信息學(xué)分析 丙酮醛誘導(dǎo)細(xì)胞凋亡相關(guān)基因SHMT2L的生物信息學(xué)分析 常見問題解答 當(dāng)前所在位置:)和WOLFPSORT server(http://psort.nibb.ac.jp)預(yù)測蛋白質(zhì)的亞細(xì)胞定位情況;利用在線軟件ScanProsite(http:///cgi-bin/prosite/ScanView)分析蛋白質(zhì)所含模體;蛋白質(zhì)二級結(jié)構(gòu)預(yù)測和三維建模分別使用在線軟件SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/secpred_sopma.pl)和SWISS-MODEL完成[11]。

2 結(jié)果與分析

2.1 不結(jié)球白菜BcGAPDH蛋白質(zhì)理化性質(zhì)分析

對不結(jié)球白菜BcGAPDH氨基酸序列的理化性質(zhì)進(jìn)行分析,結(jié)果表明,該酶含有328個氨基酸,總相對分子量為35 161.2,理論等電點(diǎn)pI值為9.03,負(fù)電荷氨基酸(Asp+Glu) 37個,正電荷氨基酸(Arg+Lys)36個,分子式C1558H2507N433O473S9,原子總數(shù)

4 980,摩爾消光系數(shù)1.043(胱氨酸全按半胱氨酸計(jì)),該酶蛋白不穩(wěn)定性參數(shù)為20.46,屬于穩(wěn)定蛋白,其脂肪系數(shù)為99.54,平均親水性(GRAVY)為0.006,預(yù)測該蛋白質(zhì)為水溶性蛋白質(zhì)。

2.2 不結(jié)球白菜BcGAPDH蛋白質(zhì)跨膜結(jié)構(gòu)域及疏水性的預(yù)測和分析

用TMpred在線軟件對不結(jié)球白菜BcGAPDH氨基酸序列的跨膜結(jié)構(gòu)域進(jìn)行預(yù)測,結(jié)果(圖1)表明,不結(jié)球白菜BcGAPDH整條肽鏈都位于細(xì)胞膜外,說明其不存在跨膜區(qū)。此外,利用在線軟件PHDhtm和ANTHEPROT對該酶跨膜螺旋進(jìn)行預(yù)測,結(jié)果與TMpred所預(yù)測的結(jié)果一致,即均沒有跨膜螺旋。因此,此被預(yù)測的跨膜螺旋區(qū)可信度較高。

蛋白質(zhì)的疏水性分析是蛋白質(zhì)二級結(jié)構(gòu)以及三級結(jié)構(gòu)預(yù)測中一個必要過程,通過分析可以得到蛋白質(zhì)的親疏水區(qū)域,一方面為二級結(jié)構(gòu)預(yù)測結(jié)果提供參考,另一方面為結(jié)構(gòu)域以及功能域的劃分提供依據(jù)。因此,對不結(jié)球白菜BcGAPDH氨基酸序列進(jìn)行疏水性分析,結(jié)果(圖2)表明,多肽鏈第304位的氨基酸具有最低分值-4.500,親水性最強(qiáng);第212位的氨基酸具有最高分值4.200,疏水性最強(qiáng)。整體來看,親水性氨基酸均勻分布在整個肽鏈中,且多于疏水性氨基酸。因此,整個多肽鏈表現(xiàn)為親水性,沒有明顯的疏水區(qū)域,可認(rèn)為不結(jié)球白菜BcGAPDH是親水性蛋白質(zhì)。結(jié)合跨膜結(jié)構(gòu)域的預(yù)測結(jié)果,可以推斷不結(jié)球白菜BcGAPDH不存在明顯的疏水區(qū)域,與其不存在跨膜結(jié)構(gòu)域的特征相吻合。

2.3 不結(jié)球白菜BcGAPDH信號肽及亞細(xì)胞定位的預(yù)測和分析

信號肽分析有助于蛋白質(zhì)功能域的區(qū)分及蛋白質(zhì)細(xì)胞定位。SignalP v3.0軟件是神經(jīng)網(wǎng)絡(luò)、隱馬爾科夫模式工具[12],將不結(jié)球白菜BcGAPDH的ORF通過該軟件分析(圖3),獲得ORF的Cmax值為0.083、Ymax值為0.083、Smean值為0.561、Smean值為0.182,前3個值的位點(diǎn)分別在第25、25、1位。根據(jù)軟件的默認(rèn)選擇,將Cmax值>0.5和Smean值>0.5的ORF確定為具有信號肽。根據(jù)分析結(jié)果,此信號肽計(jì)算結(jié)論為NO,表示沒有信號肽存在。

對基因產(chǎn)物在亞細(xì)胞位置的了解對判定這些基因產(chǎn)物的功能起著重要作用。用Target P server程序進(jìn)行不結(jié)球白菜BcGAPDH蛋白質(zhì)的亞細(xì)胞定位,結(jié)果表明,基本確認(rèn)BcGAPDH蛋白質(zhì)在線粒體中發(fā)揮生物學(xué)作用,氨基酸序列長度為328個,定位于葉綠體、線粒體和其他細(xì)胞部分的得分分別為0.031、0.745、0.572,作為信號肽的可能性為0.018,軟件的最終定位預(yù)測在線粒體,可信度為5。用 Subloc V server和WOLFPSORT server程序進(jìn)行驗(yàn)證分析,結(jié)果一致。

2.4 不結(jié)球白菜BcGAPDH蛋白質(zhì)的模體分析

將不結(jié)球白菜BcGAPDH蛋白質(zhì)的氨基酸序列利用在線軟件ScanProsite進(jìn)行分析,發(fā)現(xiàn)其含有多種模點(diǎn)(圖4),其中包括1個氨基化合物位點(diǎn)(M1),1個依賴于cAMP或cGMP的蛋白質(zhì)激酶磷酸化位點(diǎn)(M2),6個酪蛋白激酶Ⅱ磷酸化位點(diǎn)(M3),3個N-糖基化位點(diǎn)(M4),6個N-肉豆蔻酰化位點(diǎn)(M5),4個蛋白質(zhì)激酶C磷酸化位點(diǎn)(M6)。

2.5 不結(jié)球白菜BcGAPDH蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測分析

利用SOPMA在線工具預(yù)測不結(jié)球白菜 BcGAPDH蛋白質(zhì)的二級結(jié)構(gòu),結(jié)果如圖5所示,BcGAPDH含有比較豐富的二級結(jié)構(gòu),由112個氨基酸殘基組成α螺旋結(jié)構(gòu),占全部氨基酸殘基的34.15%;82個氨基酸殘基組成延伸鏈,占全部氨基酸殘基的25.00%;由21個氨基酸殘基組成β轉(zhuǎn)角,占全部氨基酸殘基的6.40%;由113個氨基酸殘基組成隨機(jī)卷曲,占全部氨基酸的34.45%。可以看出,隨機(jī)卷曲和α-螺旋是BcGAPDH多肽鏈中的主要結(jié)構(gòu)元件,延伸鏈散布于整個蛋白質(zhì)中。

2.6 不結(jié)球白菜BcGAPDH蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測

將不結(jié)球白菜BcGAPDH氨基酸序列上傳到SWISS-MODEL的建模服務(wù)器中進(jìn)行三維建模[13,14],然后在ViewerLite 4.2軟件中進(jìn)行序列編輯,獲得BcGAPDH的三級結(jié)構(gòu)模型,結(jié)果如圖6所示。

3 討論

GAPDH生物學(xué)的多功能性基于不同的研究結(jié)果,這些新的發(fā)現(xiàn)可以分為2組:第1組包括鑒定GAPDH新活性的研究,結(jié)果發(fā)現(xiàn)GAPDH有別于傳統(tǒng)的脫氫酶活性的新功能;第2組包括鑒定GAPDH與細(xì)胞內(nèi)大分子的特異性結(jié)合,為GAPDH新功能提供了重要證據(jù)。

早期的研究證明GAPDH是一個膜結(jié)合蛋白[15],發(fā)現(xiàn)細(xì)胞中60%~70%的GAPDH能與膜結(jié)合,但不結(jié)球白菜BcGAPDH不具有該活性,因?yàn)橥ㄟ^本試驗(yàn)分析該酶無跨膜區(qū),是親水性蛋白質(zhì)。另外,研究表明,GAPDH還具有磷酸轉(zhuǎn)移酶/激酶的活性,不僅能自身磷酸化,而且還能磷酸化其他蛋白質(zhì)。本試驗(yàn)對不結(jié)球白菜BcGAPDH蛋白質(zhì)的模體分析發(fā)現(xiàn),該酶包括蛋白質(zhì)激酶磷酸化位點(diǎn)、酪蛋白激酶Ⅱ磷酸化位點(diǎn)和蛋白質(zhì)激酶C磷酸化位點(diǎn),表明BcGAPDH在不結(jié)球白菜體內(nèi)具有磷酸化活性,BcGAPDH在其細(xì)胞病毒生理學(xué)上可能扮演著重要角色。

GAPDH廣泛存在于眾多生物體中,并且具有高度種屬保守序列,它作為一個多功能蛋白質(zhì),其結(jié)構(gòu)與功能的關(guān)系仍有待研究。目前,GAPDH在機(jī)體的生理和病理狀態(tài)下的作用越來越引起有關(guān)學(xué)者的關(guān)注。但迄今為止,GAPDH在細(xì)胞中的功能還沒有完全搞清楚,因此,本試驗(yàn)對不結(jié)球白菜BcGAPDH結(jié)構(gòu)和功能的分析將有助于研究者進(jìn)一步了解GAPDH反應(yīng)的機(jī)制及所需條件。

參考文獻(xiàn):

[1] 李曉澤,劉關(guān)君,楊傳平,等.西伯利亞蓼甘油醛-3-磷酸脫氫酶基因的cDNA克隆與序列分析[J].植物生理學(xué)通訊,2007,43(1):41-48.

[2] NAKAGAWA T,HIRANO Y,INOMATA A,et al. Participation of a fusogenic protein, glyceraldehyde-3-phosphate dehydrogenase, in nuclear membrane assembly[J]. J Biol Chem,2003, 278(22):20395-20404.

[3] TISDALE E J. Glyceraldehyde-3-phosphate dehydrogenase is required for vesicular transport in the early secretory pathway[J]. J Biol Chem,2001,276(4):2480-2486.

[4] TISDALE E J,KELLY C,ARTALEJO C R. Glyceraldehyde-3-phosphate dehydrogenase interacts with rab2 and plays an essential role in endoplasmic reticulum to golgi transport exclusive of its glycolytic activity[J]. J Biol Chem,2004,279(52): 54046-54052.

[5] ENGEL M, SEIFERT M, THEISINGER B, et al. Glyceraldehyde-3-phosphate dehydrogenase and Nm23-H1/nucleoside diphosphate kinase A. Two old enzymes combine for the novel Nm23 protein phosphor transferase function[J]. J Biol Chem, 1998,273(32):20058-20065.

[6] MEYER-SIEGLER K,MAURO D J,SEAL G,et al. A human nuclear uracil DNA glycosylase is the 37-kDa subunit of glyceraldehyde-3-phosphate dehydrogenase[J]. Proc Natl Acad Sci USA,1991,88(19):8460-8464.

[7] ANDRADE J,PEARCE S T,ZHAO H,et al. Interactions among p22, glyceraldehyde-3-phosphate dehydrogenase and microtubules[J]. Biochem J,2004,384(2):327-336.

[8] RAJE C I,KUMAR S,HARLE A,et al. The macrophage cell surface glyceraldehyde-3-phosphate dehydrogenase is a novel transferrin receptor[J]. J Biol Chem,2007,282(5):3252-3261.

[9] GASTEIGER E,HOOGLAND C,GATTIKER A,et al. The Proteomics Proto-cols Handbook[M]. Totowa,New Jersey:Humana Press,2005.

[10] HOFMANN K,STOFFEL W. TMbase-A database of membrane spanning proteins segments[J]. Biological Chemistry Hoppe-Seyler,1993,374:1-6.

[11] SODING J, BIEGERTA, LUPASA N. The HHpred interactive server for protein homology detection and structure prediction[J]. Nucleic Acids Research,2005,33:244-248.

[12] BENDTSEN J D, NIELSEN H, VON HEIJNE G, et al. Improved prediction of signal peptides:SignalP 3.0[J].J Mol Biol,2004,340:783-795.

[13] SCHWEDE T,KOPP J,GUEX N,et al. SWISS-MODEL:An automated protein homology-modeling server[J]. Nucleic Acids Research,2003,31(13):3381-3385.

第2篇

【摘要】 目的: 分析肉毒毒素E型重鏈(BoNT/E HC)的抗原表位及空間結(jié)構(gòu)。方法: 利用在線生物信息學(xué)分析工具以及其它分析軟件分析重鏈蛋白的抗原表位和空間結(jié)構(gòu)。結(jié)果: 預(yù)測并顯示了肉毒毒素E型重鏈的空間結(jié)構(gòu)圖,以及9個可能的重鏈的B細(xì)胞抗原表位,靜電勢圖揭示了重鏈分子結(jié)構(gòu)域的兩性特點(diǎn)。結(jié)論: 抗原表位的預(yù)測對于E型肉毒毒素相關(guān)診療試劑的開發(fā)有指導(dǎo)意義,而結(jié)構(gòu)域的極性分析提示其等電點(diǎn)的不同可能在pH介導(dǎo)的穿膜中起了作用。

【關(guān)鍵詞】 肉毒毒素類; 抗原; 表位,B淋巴細(xì)胞; 氨基酸序列; 基因重排,B淋巴細(xì)胞,重鏈

Bioinformatic Analysis of Botulinum Neurotoxin

[Abstract] Objective: To analyze botulinum neurotoxin type E heavy chain (BoNT/E HC) antigen epitopes and its spatial structure. Methods: Online bioinformatic analysis tools and some other analysis softwares were used. Results: Tertiary structure of BoNT/E HC chain was anticipated and demonstrated. Nine possible antigen epitopes of the HC were predicted, and electrical potential map revealed the amphoteric domains of the HC. Conclusions: The predicting of antigen epitopes is of importance to the exploiting of BONT/E related agents, and domain analysis suggests domain′s pI is important to pH mediated membrane-passing.

[Key words] botulinum toxins; antigens; epitopes,B-lymphocyte; amino acid sequence; gene rearrangement,B-lymphocyte,heavy chain

肉毒毒素是肉毒梭菌分泌的外毒素,具有抑制外周神經(jīng)末梢釋放膽堿神經(jīng)遞質(zhì),麻痹肌肉的毒性作用,微克量級的毒素可致成人死亡,它被認(rèn)為是已知的毒性最強(qiáng)的物質(zhì)。肉毒毒素根據(jù)血清型分為A、B、C、D、E、F和G7個類型,對人類常見的致病血清型主要是A、B和E型。對于肉毒毒素的結(jié)晶和結(jié)構(gòu)分析的相關(guān)研究主要集中在A、B兩型,而且各型抗原性差別主要在于重鏈,尤其是受體結(jié)合結(jié)構(gòu)域。2007-2008年,利用生物信息學(xué)技術(shù),對E型重鏈的三級結(jié)構(gòu)以及抗原表位進(jìn)行了分析,判定其潛在的抗原表位,為E型肉毒毒素相關(guān)的診療試劑的開發(fā)提供理論依據(jù)。同時,在肉毒毒素中毒機(jī)理的相關(guān)研究中,分析了BoNT/E HC(heavy chain)的不同結(jié)構(gòu)域的等電點(diǎn),繪制出三維的靜電勢圖像,顯示了組成HC的2個結(jié)構(gòu)域的酸堿雙極性,提示在pH誘導(dǎo)的穿膜機(jī)制中,這種不同亞基的等電點(diǎn)和靜電勢的差異是重要的分子理化基礎(chǔ)。

1 材料與方法

1.1 BoNT/E HC蛋白的氨基酸序列及結(jié)構(gòu)分析

從NCBI網(wǎng)站GenBank獲取全長BoNT/E型肉毒毒素的氨基酸序列(GenBank accession number CAA44558)[1]。第一位M翻譯后被切去,其全長共1 251個aa,近前1/3位置處的G419-R421三肽被蛋白酶切去后,單鏈蛋白分為輕重2條肽鏈,其中重鏈編碼830個氨基酸(K422~K1251),輕鏈編碼418個氨基酸(P1~K418)[2]。輕鏈和重鏈通過二硫鍵而連接在一起。重鏈的氨基酸序列如圖1所示。

1.2 BoNT/E HC的基本理化性質(zhì)

使用anthewin軟件分析BoNT/E HC全長,以及2個各約50 kD的結(jié)構(gòu)域,即重鏈N末端的跨膜轉(zhuǎn)運(yùn)結(jié)構(gòu)域HN (K1~Y408)和重鏈C末端的神經(jīng)細(xì)胞特異性結(jié)合結(jié)構(gòu)域HC (T409~K830)的等電點(diǎn)。

1.3 BoNT/E HC的抗原表位預(yù)測

使用anthewin軟件系統(tǒng)分析,采用其中的GOR算法,預(yù)測二級結(jié)構(gòu),尋找轉(zhuǎn)角易形成區(qū)域;采用Hopp & Woods算法,進(jìn)行親水性預(yù)測,預(yù)測蛋白質(zhì)中的親水區(qū)域;采用Boger & al.算法,進(jìn)行可及性預(yù)測,預(yù)測蛋白質(zhì)中的溶劑可及性區(qū)域;采用Parker方案,進(jìn)行抗原性指數(shù)分析,分析抗原性。對各個參數(shù)的結(jié)果進(jìn)行綜合分析,最后確定B細(xì)胞表位的可能位點(diǎn)[3]。

1.4 BoNT/E HC的空間結(jié)構(gòu)預(yù)測

利用在線的SWISS-MODEL軟件進(jìn)行3級結(jié)構(gòu)的同源建模,預(yù)測蛋白質(zhì)的空間構(gòu)象,并通過Vector NTI suite軟件顯示蛋白質(zhì)的3D結(jié)構(gòu)圖,并將BoNT/E HC的抗原表位標(biāo)記在三維結(jié)構(gòu)圖上[4]。利用Swiss-PdbViewer 3.7計(jì)算BoNT/E HC的靜電勢并顯示三維圖像。

2 結(jié)果

2.1 BoNT/E HC的一般理化性質(zhì)分析

利用anthewin軟件對BoNT/E HC和其HN結(jié)構(gòu)域和HC結(jié)構(gòu)域進(jìn)行理化性質(zhì)分析。HC全長分子量為95.7 kD,等電點(diǎn)為5.175。HN結(jié)構(gòu)域的等電點(diǎn)為4.365,HC結(jié)構(gòu)域的等電點(diǎn)為9.145。

2.2 BoNT/E HC的B細(xì)胞抗原表位的預(yù)測

本研究從4個方面對BoNT/E HC的抗原表位進(jìn)行預(yù)測,即二級結(jié)構(gòu)中形成轉(zhuǎn)角的可能性、親水性、可及性和抗原性。Anthewin軟件的具體分析結(jié)果見圖2和表1。

綜合不同的預(yù)測方法,發(fā)現(xiàn)其共有序列為:18-32、78-83、193-199、274-279、433-441、521-526、574-579、675-682、801-811,即為預(yù)測的可能的B細(xì)胞抗原表位。其中18-32、78-83、193-199、274-279 4個表位位于HN結(jié)構(gòu)域,433-441、521-526、574-579、675-682、801-811 5個表位位于HC結(jié)構(gòu)域。

2.3 重鏈的三維結(jié)構(gòu)圖以及預(yù)測的線性表位的位置表1 BoNT/E HC的B細(xì)胞抗原表位分析氨基酸序列與蛋白結(jié)構(gòu)數(shù)據(jù)庫中的蛋白質(zhì)3級結(jié)構(gòu)進(jìn)行匹配,將結(jié)果在vector NTI suite軟件中打開,觀察BoNT/E HC的三維結(jié)構(gòu)和結(jié)構(gòu)域組成。如圖2所示,BoNT/E HC分子含有2個結(jié)構(gòu)域,分別為HN跨膜轉(zhuǎn)運(yùn)結(jié)構(gòu)域和HC神經(jīng)細(xì)胞特異性結(jié)合結(jié)構(gòu)域,前者含有2個α螺旋和1個loop結(jié)構(gòu),后者包含2個亞結(jié)構(gòu)域。

利用vector NTI suite軟件將預(yù)測的抗原表位標(biāo)記在結(jié)構(gòu)圖中,觀察表位所處的空間位置,驗(yàn)證預(yù)測的抗原表位的可行性。如圖3、圖4所示,分析結(jié)果為所預(yù)測的抗原表位均位于BoNT/E HC的蛋白質(zhì)分子表面,其中HN結(jié)構(gòu)域中的274-279表位可能會受到loop結(jié)構(gòu)的空間位阻的影響,HC結(jié)構(gòu)域中的574-579表位可能會受到α螺旋的部分影響,其余的7個抗原表位均有較好的空間可及性。注:左側(cè)為HC神經(jīng)細(xì)胞特異性結(jié)合結(jié)構(gòu)域,右側(cè)為HN跨膜轉(zhuǎn)運(yùn)結(jié)構(gòu)域的2個α螺旋和loop結(jié)構(gòu),箭頭所示為抗原表位的位置

2.4 BoNT/E HC的靜電勢

將SWISS-MODEL的3級結(jié)構(gòu)預(yù)測結(jié)果在Swiss-PdbViewer中打開,計(jì)算靜電勢并圖像顯示。如圖5所示,該蛋白的HN結(jié)構(gòu)域的電負(fù)性很強(qiáng),而HC結(jié)構(gòu)域的電正性很強(qiáng),這與該蛋白質(zhì)做理化分析時發(fā)現(xiàn)的這2個結(jié)構(gòu)域的等電點(diǎn)分別為4.385和9.165相一致。注:圖中紅色表示電負(fù)性,藍(lán)色表示電正性。可見HN結(jié)構(gòu)域的2個α螺旋和 loop為電負(fù)性,HC結(jié)構(gòu)域?yàn)殡娬?/p>

3 討論

通過NCBI的GenBank中找到BoNT/E全長的氨基酸序列,其中K422~K1251共830個氨基酸為毒素重鏈,重鏈HC可以劃分為HN跨膜轉(zhuǎn)運(yùn)結(jié)構(gòu)域和HC神經(jīng)細(xì)胞特異性結(jié)合結(jié)構(gòu)域。

雖然對BoNT的A型、B型的全長結(jié)晶結(jié)構(gòu)研究較多,但E型僅有對其輕鏈的結(jié)晶結(jié)構(gòu)研究報(bào)告。本文利用在線的SWISS-MODEL軟件預(yù)測并繪制了BoNT/E重鏈的空間結(jié)構(gòu)圖,三維圖像顯示其N末端為HN結(jié)構(gòu)域中套索狀的的loop結(jié)構(gòu),中間區(qū)域?yàn)镠N結(jié)構(gòu)域中的2個長α螺旋為中心形成的圓柱體,C末端為HC結(jié)構(gòu)域中的2個亞結(jié)構(gòu)域,分別是近N端的lectin-like domain和受體結(jié)合域所在的近C端的β-trefoil fold[5,6]。此三維圖像顯示的結(jié)構(gòu)與文獻(xiàn)中描述的A型和B型肉毒毒素的結(jié)構(gòu)相一致。

利用生物信息學(xué)軟件anthewin中的2級結(jié)構(gòu)分析、抗原性分析、親水性分析和可及性分析,綜合分析BoNT/E HC的抗原表位,共在HN結(jié)構(gòu)域中找到4個抗原表位18-32、78-83、193-199、274-279,在HC結(jié)構(gòu)域中找到5個抗原表位433-441、521-526、574-579、675-682、801-811。將這9個表位利用vector NTI suite軟件標(biāo)在該蛋白的三維立體結(jié)構(gòu)圖中,提示表位272-277可能會受到loop結(jié)構(gòu)的空間位阻的影響,表位572-577可能會受到α螺旋的位阻影響,其余的7個抗原表位均有較好的空間可及性,從而驗(yàn)證了抗原表位的可行性,并為合成抗原肽、制備該蛋白的特異性抗體、開發(fā)疫苗和檢驗(yàn)試劑提供了理論依據(jù)。通過肉毒毒素A、B和E 3型間的序列比較,分析所得的抗原表位序列的保守性,可以發(fā)現(xiàn)78-83、274-279、675-682、801-811的保守性差,可以考慮用作肉毒毒素的型間鑒別。另一方面,通過對這些潛在的抗原位點(diǎn)進(jìn)行改造,獲得低免疫原性的毒素分子,有望解決肉毒毒素在美容抗皺治療中出現(xiàn)的耐受現(xiàn)象。劉艷華等[7]對E型肉毒毒素重鏈的抗原表位也做了預(yù)測,比較發(fā)現(xiàn)與本文預(yù)測的274-279、433-441、675-682 3個位點(diǎn)與其相同,其他位點(diǎn)均不同,可能與不同的預(yù)測方法有關(guān),實(shí)際的可行位點(diǎn)還需通過免疫實(shí)驗(yàn)進(jìn)一步驗(yàn)證。

由于肉毒毒素分子亞基的相對獨(dú)立性和劃分的相對明確性的特點(diǎn),使得我們可以將亞基作為獨(dú)立的多肽鏈進(jìn)行分析。BoNT/E重鏈的HN、HC的理化性質(zhì)顯示,HN的pI為4.385,HC的pI為9.165。利用Swiss-PdbViewer軟件,計(jì)算并顯示BoNT/E HC的三維結(jié)構(gòu)靜電勢圖,顯示HN結(jié)構(gòu)域有較強(qiáng)的電負(fù)性,HC結(jié)構(gòu)域有較強(qiáng)的電正性,這與結(jié)構(gòu)域的等電點(diǎn)預(yù)測相一致。眾所周知,肉毒毒素可以結(jié)合膽堿能神經(jīng)元末稍,并使其輕鏈進(jìn)入胞漿,抑制神經(jīng)遞質(zhì)囊泡的釋放。具體機(jī)制的探討中發(fā)現(xiàn),被吞入內(nèi)體中的毒素分子在酸性環(huán)境中,重鏈HN跨膜轉(zhuǎn)運(yùn)結(jié)構(gòu)域可以穿入內(nèi)體脂雙層膜,形成跨膜通道,并將輕鏈送入胞漿,而HN的具體穿膜機(jī)制尚不清楚[8,9]。本文對BoNT/E分子的不同結(jié)構(gòu)域的等電點(diǎn)分析以及靜電勢分析中,可以給出以下推測,肉毒毒素通過腸道入血液后,在pH約7.4的中性環(huán)境中,HN和HC結(jié)構(gòu)域分別帶較強(qiáng)的負(fù)電荷和正電荷,表現(xiàn)為較強(qiáng)的極性,有較好的水溶性,當(dāng)毒素和神經(jīng)細(xì)胞受體結(jié)合并被吞入內(nèi)體中,進(jìn)入pH約5的酸性環(huán)境中,從而使HC端的極性增強(qiáng)而HN端的極性減弱,進(jìn)而有利于HN的穿膜,至于HC端的極性增強(qiáng)對毒素和受體分子親和力的影響尚不確定。

參考文獻(xiàn)

[1] Whelan SM, Elmore MJ, Bodsworth NJ. The complete amino acid sequence of the Clostridium botulinum type-E neurotoxin, derived by nucleotide-sequence analysis of the encoding gene[J]. Eur J Biochem, 1992(2): 657-667.

[2] Antharavally BS, Dasgupta BR. Covalent structure of botulinum neurotoxin type E: location of sulfhydryl groups, and disulfide bridges and identification of C-termini of light and heavy chains[J]. J Protein Chem, 1997(8):787-99.

[3] 史晶, 蔭俊, 王慧. A型肉毒毒素Hc片段B細(xì)胞表位預(yù)測[J]. 生命科學(xué)研究,2004(8):139-142.

[4] Schwede T, Kopp J, Guex N, et al. SWISS-MODEL:An automated protein homology-modeling server[J]. Nucleic Acids Res, 2003(13):3381-3385.

[5] Giampietro Schiavo, Michela Matteoli, Cesare Montecucco.Neurotoxins Affecting Neuroexocytosis[J]. Physlologlcal Reviews, 2000(80):718-766.

[6] Chaddock JA, Marks PM. Clostridial neurotoxins: structure-function led design of new therapeutics[J]. Cell Mol Life Sci, 2006(5):540-551.

[7] 劉艷華, 賈揚(yáng), 王景林.E型肉毒神經(jīng)毒素(BoNT)基因序列分析及其B細(xì)胞表位預(yù)測[J]. 軍事醫(yī)學(xué)科學(xué)院院刊, 2006(5):419-423.

第3篇

【關(guān)鍵詞】 生物信息學(xué);2型糖尿病;SLC30A8

【Abstract】 Objective To investigate the structure and function of type 2 diabetes gene (SLC30A8) by bioinformatic methods. Methods Based on the human genome resource database, the programs of BioEdit, DANMAN and on line tools SMART, MHMM Server v. 2.0, NetPhos2.0 Serve, 3djigsaw were used for the analysis of protein basic characters, 3D structure and function prediction. Results The protein of gene SLC30A8 encoding was a transmembrane protein,it was important to transport zinc. Conclusions Protein encoded by SLC30A8 gene probably regulates and controls insulin secretion.

【Key words】 Bioinformatics; Type 2 diabetes; SLC30A8

眾多研究顯示,遺傳因素在2型糖尿病(T2DM)發(fā)病中起著非常重要的作用〔1,2〕,但由于T2DM系多基因遺傳病,研究的進(jìn)展非常緩慢,直到2005年,不管是采用候選基因法還是連鎖定位克隆法,只有極少數(shù)幾個T2DM的易感基因在一些種族的研究中得到重復(fù)驗(yàn)證,而它們僅輕度增加T2DM的發(fā)病風(fēng)險〔3〕。近2年多來,隨著高通量SNPS檢測技術(shù)的出現(xiàn)和全基因組關(guān)聯(lián)(GWA)研究策略的運(yùn)用,T2DM遺傳學(xué)的研究取得了一些突破性進(jìn)展,美國和歐洲多個基因研究組織采用全基因組分析法對1 464例T2DM患者和1 467例糖耐量正常個體的基因結(jié)構(gòu)進(jìn)行了系統(tǒng)研究,確認(rèn)了幾個與糖尿病相關(guān)的新基因位點(diǎn)——TCF7L2、SLC30A8、CDKN2A、CDKN2B、GF2BP2、CDKAL1〔4〕,這些基因的功能和調(diào)控機(jī)制還不十分清楚。在國內(nèi),鄔瑩等〔5〕研究發(fā)現(xiàn)在中國漢族人群中,CDKAL1、CDKN2A/B、SLC30A8等基因上的數(shù)個SNP位點(diǎn)與T2DM風(fēng)險顯著相關(guān)。SLC30A8基因也是中國人T2DM的一個易感基因,但對SLC30A8基因的研究還不夠深入。因此,本文利用生物信息學(xué)工具和數(shù)據(jù)庫,對SLC30A8進(jìn)行分析,研究SLC30A8基因的功能,了解中國人糖尿病的遺傳學(xué)基礎(chǔ),對預(yù)防和控制糖尿病具有重要的理論和臨床意義。

1 材料與方法

1.1 材料 人類糖尿病基因SLC30A8核苷酸序列來源于已經(jīng)提交到GenBank數(shù)據(jù)庫(GI:224589820)的序列。

1.2 SLC30A8基因結(jié)構(gòu)分析及SLC30A8基因編碼蛋白質(zhì)的理化性質(zhì)分析 通過NCBI的ORF Finder、Protparam、Computer pI/MW確定其完整編碼框并預(yù)測蛋白質(zhì)的理化性質(zhì);信號肽序列分析采用SignalP工具;蛋白質(zhì)翻譯后修飾的糖基化位點(diǎn)和磷酸化位點(diǎn)分析分別采用DictyOGlyc在線軟件和NetPhos 2.0 Server分析;氨基酸序列的同源性比對用ClustalW在線工具完成,通過蛋白分析專家系統(tǒng)Expasy所提供的在線分析工具ProtScale分析蛋白的疏水性。

1.3 SLC30A8基因編碼蛋白質(zhì)的結(jié)構(gòu)和功能分析 利用互聯(lián)網(wǎng)ExPaSy數(shù)據(jù)庫進(jìn)行SLC30A8蛋白質(zhì)的跨膜結(jié)構(gòu)域分析;利用PUMA2服務(wù)器的SOPM軟件進(jìn)行蛋白序列的二級結(jié)構(gòu)的分析;利用ExPasy的3djigsaw工具(bmm.icnet.uk/servers/3djigsaw/)向蛋白質(zhì)立體結(jié)構(gòu)數(shù)據(jù)庫PDB(Protein Data Bank)提交蛋白質(zhì)的序列;利用RasMol軟件顯示蛋白的三維分子結(jié)構(gòu)。利用在線工具TMHMM分析蛋白質(zhì)的跨膜結(jié)構(gòu)域;利用COILS進(jìn)行卷曲螺旋分析;利用Pfam進(jìn)行蛋白的結(jié)構(gòu)域功能分析〔6〕。

2 結(jié) 果

2.1 SLC30A8在染色體上的定位及基因結(jié)構(gòu) 人類糖尿病基因SLC30A8的Gene ID是169 026,定位在8q24.11。SLC30A8基因核苷酸序列全長41 617 bp(NC000008.9),含8個外顯子。mRNA序列長5 373 bp,編碼369個氨基酸的蛋白質(zhì)(NP776250),有2個PolyA信號區(qū)域分布位于1 933~1 938、 5 353~5 338,5個PolyA位點(diǎn)分別位于1 955、1 961、2 750、2 754、5 373。見表1。表1 SLC30A8外顯子序列和對應(yīng)的mRNA序列

2.2 SLC30A8基因編碼的蛋白基本性質(zhì)分析

2.2.1 開放閱讀框(ORF)分析 ORF從第231個核苷酸開始,終止于第1 340個核苷酸,由其推導(dǎo)的氨基酸序列以甲硫氨酸為起始氨基酸,長為369個氨基酸。

2.2.2 疏水性分析 疏水性是氨基酸的一種重要性質(zhì),疏水性氨基酸傾向于遠(yuǎn)離周圍水分子,將自己包埋進(jìn)蛋白質(zhì)的內(nèi)部,這一趨勢加上空間立體條件和其他一些因素最終決定了一個蛋白質(zhì)折疊形成的三維空間構(gòu)象〔7〕。通過分析可以得到蛋白質(zhì)的親疏水區(qū)域,這一結(jié)果一方面為二級結(jié)構(gòu)預(yù)測結(jié)果提供參考,另一方面還可為結(jié)構(gòu)域及功能域的劃分提供依據(jù)。ProtScale預(yù)測結(jié)果表明:疏水性最大值為3.044,最小值為-2.889(圖1)。

圖1 SLC30A8氨基酸序列的疏水性2.2.3 信號肽、跨膜結(jié)構(gòu)域及翻譯后修飾分析 進(jìn)行信號肽分析有助于蛋白質(zhì)功能域的區(qū)分及蛋白質(zhì)細(xì)胞定位。根據(jù)SignalP分析,蛋白質(zhì)C分值、Y分值和S分值分別在248、157和150位點(diǎn),分別為0.142、0.228和0.833,其信號肽計(jì)算結(jié)論為“NO”,表明其N端不含信號肽(圖2),推測其不是分泌蛋白。圖2 SLC30A8氨基酸序列的信號肽預(yù)測分析

跨膜結(jié)構(gòu)域是膜中蛋白和膜脂相結(jié)合的主要部位,它可能作為膜受體起作用,也可能定位于膜的錨定蛋白或離子通道蛋白等,通過跨膜結(jié)構(gòu)域預(yù)測可以正確認(rèn)識蛋白質(zhì)結(jié)構(gòu)、功能及在細(xì)胞中的作用部位。筆者利用通過TMPRED服務(wù)器分析,表明該蛋白質(zhì)是一個6次跨膜的蛋白質(zhì),在4和5螺旋之間有一個富含組氨酸的環(huán)(圖3)。用Smart對 SLC30A8基因的產(chǎn)物進(jìn)行蛋白質(zhì)序列結(jié)構(gòu)功能域分析,結(jié)果表明蛋白質(zhì)含有2個N糖基化位點(diǎn),2個N酰基化位點(diǎn)。NetPhos 2.0Server磷酸化位點(diǎn)分析結(jié)果表明:分值>0.5的磷酸化位點(diǎn)有:絲氨酸(Ser)磷酸化位點(diǎn)8個、蘇氨酸(Thr)磷酸化位點(diǎn)1個、酪氨酸(Tyr)磷酸化位點(diǎn)2個,計(jì)11個磷酸化位點(diǎn),這些位點(diǎn)均勻分布于整個多肽鏈中。見圖4。圖3 SLC30A8氨基酸序列的跨膜結(jié)構(gòu)域分析圖4 SLC30A8氨基酸序列的磷酸化位點(diǎn)分析 圖5 SLC30A8蛋白質(zhì)三級結(jié)構(gòu)的同源建模2.3 基因編碼蛋白質(zhì)結(jié)構(gòu)分析

2.3.1 三級結(jié)構(gòu)構(gòu)建與功能域分析 圖5可見,三級結(jié)構(gòu)是蛋白質(zhì)結(jié)構(gòu)預(yù)測的最終目的。要充分研究蛋白質(zhì)的功能,就需把蛋白質(zhì)的高級結(jié)構(gòu)研究清楚。從氨基酸序列預(yù)測三級結(jié)構(gòu)的技術(shù)很多,其中之一是同源建模,它通過比較未知結(jié)構(gòu)蛋白質(zhì)序列與已知結(jié)構(gòu)的蛋白質(zhì)序列來預(yù)測蛋白質(zhì)結(jié)構(gòu),可以通過同源建模以擊中序列的已知結(jié)構(gòu)為模板,對蛋白質(zhì)進(jìn)行精確的結(jié)構(gòu)模型構(gòu)建。作者利用Expasy的3djigsaw工具預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),利用Ramol軟件察看預(yù)測結(jié)果。

hhhhhhhhcccccccccccchhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhcccc

WHRAEILGALLSILCIWVVTGVLVYLACERLLYPDYQIQATVMIIV

eeeeeeeeeeehhhhhhhhhhhhhhhhhhhccccchhhhhhhhhhhhhhhhhhhhhh

SSCAVAANIVLTVVLHQRCLGHNHKEVQANASVRAAFVHALG

hhhhhhhhheeeccccccchhhhhhhhhhhhhhhhhhhhhhhheeehcccccccc

DLFQSISVLISALIIYFKPEYKIADPICTFIFSILVLASTITILKDFSILL

chhhhhhhhhhcchhhhhhheehhhchhhhhhhhhhhcccccchhhhhhhhhhhhh

MEGVPKSLNYSGVKELILAVDGVLSVHSLHIWSLTMNQVILSA

HVATAASRDSQVVRREIAKALSKSFTMHSLTIQMESPVDQDP

DCLFCEDPCD

hccceceeeeeecccccccccccccccccc(總長度369 bp)

圖6 SLC30A8氨基酸序列的二級結(jié)構(gòu)分析

3 討 論

從以上的研究和分析可以看出,糖尿病相關(guān)基因SLC30A8編碼的蛋白質(zhì)是一種多次跨膜蛋白,并且蛋白經(jīng)過了多種形式的修飾。磷酸化和去磷酸化是細(xì)胞內(nèi)信號傳導(dǎo)的重要方式,而此蛋白有11個位點(diǎn)發(fā)生了磷酸化,蛋白質(zhì)通過磷酸化和去磷酸化而發(fā)生構(gòu)象改變導(dǎo)致其活性或性質(zhì)的改變,從而調(diào)節(jié)細(xì)胞中各個生命活動過程, 所以推測SLC30A8基因編碼的蛋白質(zhì)是一個有功能的比較活躍的蛋白質(zhì)。另外蛋白質(zhì)還發(fā)生了糖基化和酰基化,推測蛋白質(zhì)具有傳導(dǎo)信號的功能。研究表明SLC30A8編碼的是一種在胰島細(xì)胞大量表達(dá)的鋅離子轉(zhuǎn)運(yùn)蛋白,其主要功能是將胞漿內(nèi)的鋅離子轉(zhuǎn)運(yùn)到胰島素分泌囊泡中,參與胰島素結(jié)晶六聚體的形成〔8〕。因此推測SLC30A8異常,可能會影響胰島細(xì)胞胰島素的正常分泌。本文利用生物信息學(xué)工具盒數(shù)據(jù)庫資源對SLC30A8基因的染色體定位、基因結(jié)構(gòu)及所編碼的蛋白質(zhì)性質(zhì)、結(jié)構(gòu)等進(jìn)行了分析,為進(jìn)一步研究SLC30A8基因在糖尿病發(fā)生中的作用提供參考依據(jù)。目前關(guān)于SLC30A8基因的研究還很少,其編碼的蛋白質(zhì)是如何調(diào)控鋅離子轉(zhuǎn)運(yùn)的以及如何參與胰島素分泌的都將有待于進(jìn)一步研究。

參考文獻(xiàn)

1 Kahn SE.The importance of betacell failure in the development and progression of type 2 diabetes〔J〕.J Clin Endocrinol Metab, 2001;86(19):404758.

2 Bergman RN,Ader M,Huecking K,et al.Accurate assessment of βcell function.The hyperbolic correction〔J〕.Diabetes,2002;51(suppl 1):21220.

3 Sladek R,Rocheleau G,Rung J,et al.A genomewide association study identifies novel risk loci for type 2 diabetes〔J〕.Nature,2007;445(7130):8815.

4 Scott LJ,Mohlke KL,Bonnycastle LL,et al.A genomewide association study of type 2 diabetes in Finns detects multiple susceptibility variants〔J〕.Science,2007;316(5829):13415.

5 Wu Y,Li HX,Ruth J,et al.Common Variants in CDKAL1,CDKN2A/B,IGF2BP2,SLC30A8,and HHEX/IDE Genes are associated with type 2 diabetes and impaired fasting glucose in a chinese han population〔J〕. Diabetes,2008;57(10):283442.

6 薛慶中.DNA和蛋白質(zhì)序列數(shù)據(jù)分析工具〔M〕.北京:科學(xué)出版社,2009:7298.

第4篇

【關(guān)鍵詞】金鐵鎖;糖基轉(zhuǎn)移酶;生物信息學(xué)

【中圖分類號】R9141【文獻(xiàn)標(biāo)志碼】 A【文章編號】1007-8517(2017)04-0023-04

Cloning of PtT1 genes of Psammosilene tunicoides and BioinformaticsLI YuanLI GuodongZHANG Aili*QIAN Zigang*

Engineering Research Center for Reproducing Fine Varieties of Chinese Medicinal Plants, Yunnan University

of Traditional, Chinese Medicine, Kunming 650500, ChinaAbstract:Subject To clone the glycosyltransferase gene(PtT1) in Psammosilene tunicoides, and to analyze the bioinformation of PtT1. Methods cDNA was reversely transcriped according to the Transcriptome Sequencing. The protein characteristics was analyzed and the phylogenetic tree of PtT1 was constructed using the bioinformatics. ResultsThe 1529bp sequence in P. tunicoides was obtained, which has a 1377bp ORF, encoding 458 amino acids. The protein molecular weight was5125KD, with the isoelectric point of 580. The protein was located at mitochondria. The PtT1 in P.tunicoides was most similar with Dianthus caryophyllus DcT227 by NCBI blast. Conclusions The PtT1 in P. tunicoides was successfully cloned and analyzed, which provides the foundation for this gene function characterization.

Keywords: Psammosilene tunicoides; Glycosyltransferase; Bioinformation

植物中化合物的糖基化是一種很普遍的生理現(xiàn)象,是植物細(xì)胞維持代謝平衡的主要機(jī)制之一[1]。糖基轉(zhuǎn)移酶則是負(fù)責(zé)催化分子糖基化修飾反應(yīng)的酶,其可將活性糖基從尿嘧啶核苷二磷酸-葡萄糖(UDP-glucose)轉(zhuǎn)移至次級代謝物及植物內(nèi)外源毒性物質(zhì)等一系列植物小分子化合物受體中[2]。糖基化經(jīng)常是次生代謝產(chǎn)物主要的后修飾方式,往往修飾合成途徑中的最終一步或幾步。植物三萜皂苷類次生代謝產(chǎn)物,往往都具有較高的藥理活性價值。其合成途徑可前體形成,骨架構(gòu)建及后修飾等三個過程[3]。次生代謝產(chǎn)物結(jié)構(gòu)的基本骨架形成之后,經(jīng)過細(xì)胞色素P450 酶和糖基轉(zhuǎn)移酶等一系列關(guān)鍵酶基因的后修飾,最終形成眾多種類繁多的三萜皂苷[4]。

金鐵鎖來源于石竹科金鐵鎖屬植物金鐵鎖Psammosilene tunicoides W C Wu et C Y Wu的干燥根[5]。主要分布在云南、貴州、等省,為云南的道地藥材[6],是云南白藥等中成藥的重要主要組成藥之一。其活性成分為齊墩果烷型的三萜總皂苷[7-8],具有顯著鎮(zhèn)痛、抗炎等的藥理活性[9-10]。目前,參與金鐵鎖三萜皂苷合成途徑前體形成,骨架構(gòu)建等過程的關(guān)鍵酶基因都已有報(bào)道[11-12],而后修飾環(huán)節(jié)中的糖基轉(zhuǎn)移酶基因還未見報(bào)道。

鑒于此,本研究根據(jù)前期轉(zhuǎn)錄組數(shù)據(jù),通過設(shè)計(jì)特異性引物克隆了一條金鐵鎖PtT1家族基因,命名為PtT1,并采用生物信息學(xué)軟件對其蛋白質(zhì)理化性質(zhì)、Y構(gòu)特征、功能及系統(tǒng)演化關(guān)系等進(jìn)行了預(yù)測分析。結(jié)果將為金鐵鎖PtT1基因的功能鑒定研究奠定基礎(chǔ),揭示金鐵鎖三萜皂苷的分子形成機(jī)制。

1儀器與材料

11植物材料金鐵鎖采集于云南省麗江市,經(jīng)云南中醫(yī)學(xué)院錢子剛教授鑒定為石竹科金鐵鎖屬植物金鐵鎖Psammosilene tunicoides WCWu et C Y Wu。

12儀器高速冷凍離心機(jī)(eppendorf);穩(wěn)壓穩(wěn)流電泳儀(BIO-RAD公司);DYC-33A微型電泳槽(BIO-RAD公司);凝膠成像系統(tǒng)(BIO-RAD公司);PCR反應(yīng)擴(kuò)增儀(BIO-RAD公司);移液槍(范圍100~1000μL,20~200μL,05~10μL)(eppendorf)。

13試劑EastepTM總RNA提取試劑盒(普洛麥格生產(chǎn)批號:7020001018); PrimeScriptTMⅡ1st strand cDNA Synthesis Kit(TaKaRa生產(chǎn)批號:AK3201);TransStart KD Plus DNA Polymerase(Trans生產(chǎn)批號:K10511);薄型瓊脂糖凝膠DNA回收試劑盒(GENEray生產(chǎn)批號:1601G20);pEASY-T1 cloning kit(Trans生產(chǎn)批號:I40914); DL2000 DNA Marker(TaKaRa生產(chǎn)批號:A2101A);引物由生工生物工程(上海)股份有限公司合成;測序由生工生物工程(上海)股份有限公司完成。

2方法

21引物設(shè)計(jì)根據(jù)金鐵鎖轉(zhuǎn)錄組中糖基轉(zhuǎn)移酶基因序列,設(shè)計(jì)1對特異性引物PtT1F: AAAAATGAAACACCAAGAAAAGCAG,PtT1R: GATTGAAGAAACCAAAGAAGGGGGC。

22PtT1基因的克隆按照EastepTM總RNA提取試劑盒(普洛麥格)說明書提取金鐵鎖根中的總RNA;并根據(jù)PrimeScriptTMⅡ1st strand cDNA Synthesis Kit(TaKaRa)說明書合成cDNA。以cDNA為模板使用TransStart KD Plus DNA Polymerase(AP301)通過PCR擴(kuò)增目的片段。表1PCR反應(yīng)體系

ComponentsVolumeTemplate1 μLForward Primer(10 μM)1 μLReverse Primer(10 μM)1 μL5×TransStart KD Plus Buffer10 μL25 mM dNTPs4 μLTransStart KD Plus DNA Polymerase1 μLddH2Oto 50 μLPCR反應(yīng)條件:94℃、5min;94℃、30s;45℃、30s,68℃、2 min30sec,35個循環(huán);68℃延伸10min。PCR產(chǎn)物經(jīng)10%瓊脂糖凝膠電泳檢測后,選取較亮的目的條帶進(jìn)行回收純化,并將回收產(chǎn)物與1μL pEASY-T1 cloning kit(Trans)配成連接體系,熱激轉(zhuǎn)化到大腸桿菌感受態(tài)細(xì)胞后,涂布于含Amp+ 抗性的LB固體培養(yǎng)基上,37℃過夜培養(yǎng)。挑選白色單克隆進(jìn)行菌液PCR鑒定,選取陽性單克隆過夜搖菌保種后測序。

23金鐵鎖糖基轉(zhuǎn)移酶基因的生物信息學(xué)分析在NCBI(http://wwwncbinlmnihgov)網(wǎng)站上通過BLAST程序進(jìn)行序列比對,應(yīng)用 BioEdit翻譯為氨基酸序列,使用ORF Finder(http://wwwncbinlmnihgov/gorf/gorfhtml)確定開放閱讀框。并用ProtParam(http://webexpasyorg/protparam/)預(yù)測蛋白質(zhì)相對分子質(zhì)量等;使用ProtScale(http://webexpasyorg/protscale/)軟件進(jìn)行疏水性分析;TMHMM(http://wwwcbsdtudk/services/TMHMM/)工具預(yù)測PtT1蛋白的跨膜螺旋區(qū);Signal 30(http://wwwcbsdtudk/services/SignalP-30/)A測蛋白質(zhì)信號肽;利用在線工具TargetP 11(http://wwwcbsdtudk/services/TargetP/)預(yù)測PtT1的亞細(xì)胞定位情況。使用PORTER對二級結(jié)構(gòu)預(yù)測SWISS-MODEL(http://swissmodel expasyorg/interactive/k5MUhF/models/)服務(wù)器對三級結(jié)構(gòu)預(yù)測;然后使用MEGA 50軟件內(nèi)置的NJ法構(gòu)建系統(tǒng)進(jìn)化樹。

3結(jié)果與分析

31金鐵鎖PtT1基因的克隆以金鐵鎖根cDNA為模板進(jìn)行PCR反應(yīng),擴(kuò)增得到2000bp左右的片段。使用pEASY-T1載體通用引物對單克隆進(jìn)行菌液PCR檢測為陽性克隆后送樣測序,結(jié)果表明擴(kuò)增序列與轉(zhuǎn)錄組序列基本一致。見圖1。

32PtT1基因的生物信息學(xué)分析PtT1糖基轉(zhuǎn)移酶cDNA全長1529bp,ORF長1377bp,編碼458個氨基酸。通過Blastn比對分析可知與石竹科香石竹同源性最高,為81%。采用ProtParam工具預(yù)測PtT1編碼的氨基酸序列的蛋白質(zhì)理化性質(zhì),從分析結(jié)果中可知PtT1的分子質(zhì)量為5125KDa,理論等電點(diǎn)為580;在組成糖基轉(zhuǎn)移酶的20種氨基酸中,亮氨酸(Leu)所占的比例最高,達(dá)到114%;PtT1的不穩(wěn)定指數(shù)為3719,為穩(wěn)定蛋白;脂肪指數(shù)為9044。采用ProtScale分析PtT1氨基酸序列的疏水性/親水性,結(jié)果顯示415左右位置有一個典型的親水性區(qū)域,見圖2。

利用TMHMM 20對PtT1蛋白進(jìn)行跨膜結(jié)構(gòu)預(yù)測。推測其不存在跨膜區(qū)域,該糖基轉(zhuǎn)移酶編碼的蛋白不屬于跨膜蛋白。見圖3

使用SignalP 30對PtT1蛋白質(zhì)的信號肽進(jìn)行預(yù)測,由神經(jīng)網(wǎng)絡(luò)模型分析可判斷該蛋白不存在信號肽。隱馬爾夫模型進(jìn)一步證實(shí)了金鐵鎖PtT1編碼的蛋白是非分泌蛋白質(zhì),沒有信號肽存在。將PtT1編碼的蛋白質(zhì)序列輸入在線細(xì)胞定位分析工具TargetP 11服務(wù)器,分析表明目的蛋白的分泌途徑為線粒體型,即定位在線粒體上。

對糖基轉(zhuǎn)移酶PtT1的結(jié)構(gòu)域進(jìn)行預(yù)測,在190位到442位之間存在高度保守的結(jié)構(gòu)功能域―UDPGT,即UDPGT家族成員共有的典型結(jié)構(gòu)域。見圖4。

利用PORTER對金鐵鎖PtT1進(jìn)行二級結(jié)構(gòu)分析,該蛋白二級結(jié)構(gòu)中α-螺旋(H)占4432%,β-折疊(E)占1245%,無規(guī)則卷曲(C)占4323%,該蛋白質(zhì)的二級結(jié)構(gòu)屬于混合型。利用Swiss-Model Workspace對糖基轉(zhuǎn)移酶的蛋白質(zhì)三維立體結(jié)構(gòu)進(jìn)行預(yù)測。見圖5。

將金鐵鎖PtT1與GenBank數(shù)據(jù)庫中17種植物的糖基轉(zhuǎn)移酶蛋白進(jìn)行Clustal W比對分析后,利用MEGA 51中的Neighbor-Joining 方法,構(gòu)建系統(tǒng)進(jìn)化樹。結(jié)果表明金鐵鎖與同科植物香石竹聚為一類,親緣關(guān)系最近;其次與北柴胡、小麥、擬南芥等植物的親緣關(guān)系也比較接近,與蓖麻等植物中的PtT1親緣關(guān)系較遠(yuǎn)。見圖6。

4 討論

糖基轉(zhuǎn)移酶催基因催化三萜皂苷骨架糖基化的反應(yīng),其通過催化生物物體內(nèi)已活化的糖,連接到不同的受體分子上,對一系列化合物進(jìn)行激活、抑制或者調(diào)節(jié)溶解度,從而參與植物體多種調(diào)控和代謝途徑。目前已發(fā)現(xiàn)的催化植物中天然產(chǎn)物糖基化的酶均屬于糖基轉(zhuǎn)移酶家族Ⅰ,其作用是將活性糖基從核苷糖(尿嘧啶核苷二磷酸糖)轉(zhuǎn)移到包括次生代謝物在內(nèi)的多種植物小分子化合物受體上[13]。

目前,僅有少數(shù)幾個參與三萜皂苷生物合成的糖基轉(zhuǎn)移酶被報(bào)道[14-19]。本研究立足于金鐵鎖轉(zhuǎn)錄組測序數(shù)據(jù),從金鐵鎖根中克隆得到一條糖基轉(zhuǎn)移酶基因PtT1,其cDNA全長1529bp,ORF長1377bp,編碼458個氨基酸。Blast比對分析可知與同科植物香石竹有較高的同源性,保守結(jié)構(gòu)域分析顯示其具有UDPGT家族成員共有的典型結(jié)構(gòu)域,說明所得糖基轉(zhuǎn)移酶蛋白具有較高的結(jié)構(gòu)保守性。通過構(gòu)建進(jìn)化樹,發(fā)現(xiàn)該基因與香石竹、北柴胡、擬南芥等植物的親緣關(guān)系比較接近。為進(jìn)一步研究金鐵鎖糖基轉(zhuǎn)移酶在大腸桿菌異源表達(dá),三萜皂苷合成代謝途徑及其關(guān)鍵酶表達(dá)模式等研究奠定一定的基礎(chǔ)。參考文獻(xiàn)

[1]Weis M, Lim EK, Bruce NC, et al. Engineering and kinetic characterisation of two glucosyltransferases from Arabidopsis thaliana[J]. Biochimie,2008,90: 830-834

[2] 邢愛佳. 羅漢果葡萄糖基轉(zhuǎn)移酶基因的克隆及原核表達(dá)[D]. 南寧:廣西大學(xué), 2013.

[3] Naoumkina M A, Modolo L V, Huhman D V, et al. Genomic and coexpression analyses predict multiple genes involved in triterpenes aponin biosynthesis in Medicagotruncatula[J]. The Plant Cell Online, 2010, 22(3): 85-86

[4] Seki H, Ohyama K, Sawai S, et al. Licorice β-amyrin 11-oxidase, a cytochrome P450 with a key role in the biosynthesis of the triterpene sweetener glycyrrhizin[J]. Proceedings of the National Academy of Sciences, 2008, 105(37): 1420

[5] 蘭茂.滇南本草[M].昆明:云南人民出版社,1976:86.

[6] 朱常成,徐土奎,錢子剛.金鐵鎖的地理分布及分布區(qū)的初步分析[J]. 中國現(xiàn)代應(yīng)用藥學(xué)雜志,2007,24(1): 28-31.

[7] 田均勉.中藥金鐵鎖的系統(tǒng)化學(xué)成分研究[D].上海:第二軍醫(yī)大學(xué),2011.

[8] 文波.中藥金鐵鎖地上部分的化學(xué)成分與生物活性研究[D].福州:福建中醫(yī)藥大學(xué),2014.

[9] 王學(xué)勇,張?jiān)S建陽,等.金鐵鎖總皂苷鎮(zhèn)痛作用及其對佐劑性關(guān)節(jié)炎大鼠c-fos基因的表達(dá)的影響[J].中實(shí)驗(yàn)方劑學(xué)雜志,2010,16(3):94-96.

[10]Zhang J, Cao W, Tian J, et al. Evaluation of novel saponins from Psammosilene tunicoides and their analogs as immunomodulators [J].Int Immunopharmacol,2012,14(1):21.

[11] 戴住波,錢子剛,胡運(yùn)乾,等.金鐵鎖鯊烯合酶cDNA的克隆和功能鑒定[J].藥學(xué)學(xué)報(bào),2008,43(12) : 1245-1250.

[12] 劉佳佳.金鐵鎖β-香樹素合酶cDNA的克隆、原核表達(dá)和功能鑒定[D].昆明:云南中醫(yī)學(xué)院,2012.

[13] 許曉雙,張福生,秦雪梅. 三萜皂苷生物合成途徑及關(guān)鍵酶的研究進(jìn)展[J]. 世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化,2014,16(11):2440-2448.

[14] Dai L, Liu C, Zhu Y, et al. Functional Characterization of Cucurbitadienol Synthase and Triterpene Glycosyltransferase Involved in Biosynthesis of Mogrosides from Siraitia grosvenorii[J]. Plant And Cell Physiology,2015,56(6):1172-1182.

[15] Achnine L, Huhman DV, Farag MA, et a1.Genomics-based selection and function alcharacterization of triterpene glycosyltrans-ferases from the model legume Medicago truncatula[J].Plant J,2005(41):875.

[16]Naoumkina M A, Modolo L V, Huhman D V, et a1.Genomic and coexpression analyses predict multiple genes involved in triterpene saponin biosynthesis in Medicago truncatula[J].Plant Cell,2010(22):850.

[17]Meesapyodsuk D, Balsevich J, Reed D W, et al.Saponin Biosynthesis in Saponaria vaccaria. cDNAs Encoding beta-Amyrin Synthase and a Triterpene Carboxylic Acid Glucosylansferase[J]. Plant Physiology,2006,143(2):959-969.

第5篇

關(guān)鍵詞:河八王;NpD53基因;克隆;序列分析;RACE

0引言

[研究意義]河八王[Narengaporphyrocoma(Hance)Bor]是一個甘蔗野生種,具有分蘗力強(qiáng)、耐貧瘠、耐旱等優(yōu)良性狀(李楊瑞,2010)。甘蔗產(chǎn)量受單位面積有效莖數(shù)影響,而有效莖數(shù)由甘蔗的有效分蘗決定(李楊瑞,2010)。可見,分蘗是農(nóng)作物莖數(shù)和穗數(shù)的重要性狀因子,對作物產(chǎn)量有重要影響(呂愛麗等,2016),而DWARF53(D53)基因編碼的D53蛋白與獨(dú)腳金內(nèi)酯信號分子D14蛋白和D3蛋白互作形成D53-D14-SCFm蛋白復(fù)合體,D53蛋白作為獨(dú)腳金內(nèi)酯信號途徑的抑制子,參與植物分蘗(分枝)等生長發(fā)育過程(Zhouetal.,2013)。因此,研究河八王分蘗基因D53及其分子調(diào)控機(jī)理,利用轉(zhuǎn)基因或雜交等技術(shù)進(jìn)行甘蔗遺傳改良對提高甘蔗產(chǎn)量具有重要意義。[前人研究進(jìn)展]獨(dú)腳金內(nèi)酯是一種新型植物激素,屬萜類內(nèi)酯,可抑制植物分枝生長、促進(jìn)側(cè)根形成和誘導(dǎo)根毛伸長,從而調(diào)節(jié)植物的生長發(fā)育(Gomez-Roldanetal.,2008;吳轉(zhuǎn)娣等,2017),D14蛋白、F-box蛋白和D53蛋白等參與其信號轉(zhuǎn)導(dǎo)(陳虞超等,2015)。已有研究發(fā)現(xiàn),水稻的3種DWARF蛋白(D27、D17和D10)將反式B-胡蘿卜素轉(zhuǎn)變成獨(dú)腳金內(nèi)酯的前體己內(nèi)酯(Alderetal.,2012),其他2種DWARF蛋白(D14和D3)在獨(dú)腳金內(nèi)酯的感知和轉(zhuǎn)導(dǎo)中起重要作用(Ishikawetal.,2005;Ariteetal.,2009)。其中D14蛋白屬于α/β-水解酶折疊家族,是獨(dú)腳金內(nèi)酯的受體(Aldereta1.,2012),D3蛋白是一個富集亮氨酸重復(fù)序列的F-box蛋白,參與獨(dú)腳金內(nèi)酯信號的接收(Zhaoetal.,2013)。D53蛋白是連接獨(dú)腳金內(nèi)酯信號接收和應(yīng)答的重要抑制因子,當(dāng)D53被降解,獨(dú)腳金內(nèi)酯抑制植物分蘗(分枝);當(dāng)D53未被降解,則獨(dú)腳金內(nèi)酯受到抑制,促使植物多分蘗(分枝)(Jiangetal.,2013)。D53基因是水稻的顯性基因之一。Wei等(2006)構(gòu)建了水稻顯性矮稈突變體dwarf(d53),通過圖譜定位發(fā)現(xiàn)D53基因定位于11號染色體的斷臂上。Jiang等(2013)克隆獲得水稻的D53基因全長。[本研究切入點(diǎn)]目前,未見有關(guān)甘蔗野生種河八王分蘗基因的研究報(bào)道。[擬解決的關(guān)鍵問題]利用RACE(cDNA末端快增)技術(shù)克隆河八王D53基因(NpD53)全長,并進(jìn)行生物信息學(xué)分析,為甘蔗野生種分蘗的分子調(diào)控機(jī)理研究提供理論參考。

1材料與方法

1.1試驗(yàn)材料

供試材料為河八王,保育于廣西農(nóng)業(yè)科學(xué)院甘蔗研究所。RNAprepPure植物總RNA提取試劑盒、DNaseIRecombinant和SMARTerRACE5'/3’Kit購白天根生化科技(北京)有限公司。其余試劑均為國產(chǎn)分析純。引物由生工生物工程(上海)股份有限公司合成。

1.2總RNA提取及cDNA合成

剪取約0.1g河八王幼嫩葉片,參照RNAprepPure植物總RNA提取試劑盒說明提取其總RNA,用1%瓊脂糖凝膠電泳檢測其質(zhì)量,并參照SMARTerRACE5’/3’Kit說明反轉(zhuǎn)錄合成cDNA。

1.3NpD53基因克隆

1.3.1中間序列擴(kuò)增參考水稻分蘗基因D53(GeneBank登錄號KF709434.1)設(shè)計(jì)其中問序列的擴(kuò)增引物(表1),反應(yīng)體系(25.0uL)配置和擴(kuò)增程序設(shè)置均參照2xESTaqMasterMix產(chǎn)品說明進(jìn)行。PCR產(chǎn)物經(jīng)膠回收純化后連接至pMD19-T克隆載體上,轉(zhuǎn)化DH5a感受態(tài)細(xì)胞,經(jīng)菌液PCR驗(yàn)證后,把含目的片段的陽性克隆送至生工生物工程(上海)股份有限公司進(jìn)行測序。

1.3.2兩端序列擴(kuò)增以NpD53基因的中間序列為基礎(chǔ),設(shè)計(jì)NpD53基因5’與3’端RACE特異性引物(表1),采用RACE技術(shù)克隆NpD53基因的5’與3’末端序列。PCR產(chǎn)物經(jīng)膠回收純化后連接至pMD19-T克隆載體上,轉(zhuǎn)化DH5a感受態(tài)細(xì)胞,經(jīng)菌液PCR驗(yàn)證后,把含目的片段的陽性克隆送至生工生物工程(上海)股份有限公司進(jìn)行測序。對測序正確的5’與3’端序列進(jìn)行拼接,得到NpD53基因cDNA全長序列。

1.4生物信息學(xué)分析

利用ORFFinder找出NpD53基因的開放閱讀框(ORF)編碼區(qū)。將獲得的NpD53基因cDNA提交至NCBI數(shù)據(jù)庫中進(jìn)行比對,利用BLASTI具對其編碼蛋白(NpD53)進(jìn)行氨基酸序列比對;基于NpD53蛋白的氨基酸序列與相似性較高的序列,利用MEGA6.0鄰接法構(gòu)建系統(tǒng)進(jìn)化樹,分析河八王與其他物種之間的親緣關(guān)系。

利用ExPASyProteomicsServer在線軟件ProtParam預(yù)測NpD53蛋白的理化性質(zhì);利用ProtScale預(yù)測NOD53蛋白的親/疏水性;利用NCBIBLAST-E具預(yù)測NpD53蛋白的結(jié)構(gòu)域;利用SOPMA軟件預(yù)測NOD53蛋白的二級結(jié)構(gòu);利用TMHMMServerv.2.0預(yù)測NpD53蛋白的跨膜結(jié)構(gòu);利用在線軟件SWISSMODEL構(gòu)建NpD53蛋白的三維結(jié)構(gòu)模型;利用Wolf-Sport在線軟件預(yù)測NpD53蛋白的亞細(xì)胞定位。

2結(jié)果與分析

2.1NpD53基因克隆結(jié)果

由圖1可知,總RNA的28S和18S條帶明亮、清晰、完整,無其他雜質(zhì)污染,說明提取的河八王幼嫩葉片總RNA質(zhì)量較好,可用于后續(xù)試驗(yàn)。

PCR擴(kuò)增NpD53基因,其測序結(jié)果顯示,NpD53基因的中間序列長度760bp,5’端序列長度1497bp,3’端序列長度1233bp,經(jīng)ContigExpress軟件拼接后,其cDNA序列全長為2597bp。

2.2NpD53基因同源性比對及系統(tǒng)進(jìn)化樹分析

將克隆獲得的NpD53基因cDNA序列提交至NCBI數(shù)據(jù)庫中進(jìn)行核苷酸序列比對,結(jié)果顯示,該序列與高粱(Sorghumbicolor)(XIVl002441614.2)、玉米(ZeamarsL_)(KUl31574.1)和水稻(Orvzasativa)(KF709434.1)的D53基因核苷酸序列的同源性分別為95%、86%和77%,說明本研究克隆獲得的基因?yàn)楹影送醴痔Y基因D53。利用ORFFinder找到NpD53基因的ORF編碼區(qū)(238-2364bp),長度為2037bp,編碼678個氨基酸,其中5’非編碼區(qū)長度為237bp,3’非編碼區(qū)長度為233bp(圖2)。

NpD53基因編碼蛋白(NOD53)與高粱(XP002441659.1)、山羊草(Aegilopstauschii)(XP02016-8048.1)、小麥(Triticumaestivum)(ARB18226.1)和海棗(Phoenixdactylifera)(XP008805019.1)D53蛋白的氨基酸序列同源性分別為91%、63%、59%和39%。利用MEGA6.0進(jìn)行氨基酸多序列比對,結(jié)果(圖3)顯示,NpD53與禾本科物種具有較高的同源性,其中與高粱的2個D53蛋白同源性最高,分別為91%和85%,而與海棗、油棕(Elaeisguineensis)、芭蕉(Musaacuminatasubsp.malaccensis)等物種的同源性僅30%-40%,說明河八王與海棗、油棕、芭蕉等物種的親緣關(guān)系較遠(yuǎn),而與高粱的親緣關(guān)系較近。

2.3NOD53蛋白的理化性質(zhì)及親/疏水性預(yù)測結(jié)果

NpD53蛋白的理化性質(zhì)及親/疏水性預(yù)測結(jié)果顯示,該蛋白分子式為C3226H5162N96401034532,分子量為75.02kD,由678個氨基酸組成,其中包含負(fù)電荷氨基酸殘基86個和正電荷氨基酸殘基82個,絲氨酸含量最高,達(dá)13.0%;理論等電點(diǎn)(pI)為6.59,為酸性蛋白質(zhì);親水性平均數(shù)為-0.506,有較多區(qū)段位于0分以下,以親水性為主(圖4),表明其為親水性蛋白;不穩(wěn)定系數(shù)為54.83,半衰期約為30h,說明其為不穩(wěn)定蛋白。

2.4NOD53蛋白的功能結(jié)構(gòu)域預(yù)測結(jié)果

利用NCBIBLAST-E具預(yù)測NOD53蛋白的結(jié)構(gòu)域,結(jié)果(圖5)顯示,該蛋白存在P-loopNTPase和ClpBD2-small超家族核心序列,含有4個非特異性位點(diǎn):ClpA、AAA2、ⅥClpVl和ClDC。與圖3中的其他物種均具有相同的保守結(jié)構(gòu)域ClpBD2-small。

2.5NOD53蛋白的二級結(jié)構(gòu)和三維結(jié)構(gòu)分析

NpD53蛋白的二級結(jié)構(gòu)預(yù)測結(jié)果(表2)顯示,該蛋白的二級結(jié)構(gòu)僅有4種卷曲類型,其中無規(guī)則卷曲最多,占42.77%,其次是α-螺旋,占35.55%,延伸鏈和β-轉(zhuǎn)角分別占15.34%和6.34%。NpD53蛋白跨膜結(jié)構(gòu)預(yù)測結(jié)果顯示,該蛋白無跨膜結(jié)構(gòu)域。NpD53蛋白三維結(jié)構(gòu)如圖6所示,同源模型為MecA-ClpC復(fù)合物(3j3u.1),但同源性較低,僅19.3%。NpD53蛋白的亞細(xì)胞定位預(yù)測結(jié)果顯示,該蛋白位于細(xì)胞核內(nèi),可信度94.1%。

3討論

獨(dú)腳金內(nèi)酯屬類胡蘿卜素植物激素,Jiang等(2013)、Zhou等(2013)研究發(fā)現(xiàn),在水稻中D53蛋白為獨(dú)腳金內(nèi)酯信號轉(zhuǎn)導(dǎo)途徑的抑制因子,Liu等(2017)發(fā)現(xiàn)D53基因在小麥分蘗和穗數(shù)上起一定的調(diào)控作用。本研究首次從河八王中克隆得到NpD53基因,可為后續(xù)河八王分蘗機(jī)制研究打下理論基礎(chǔ)。

應(yīng)用RACE技術(shù)可對mRNA末端進(jìn)行快速擴(kuò)增,具有快速、穩(wěn)定和成功率高等優(yōu)點(diǎn),是有效獲取cDNA全長的有效手段之一(唐克軒等,2002)。本研究采用RACE技術(shù)克隆獲得河八王NpD53基因,其具有完整的ORF,其編碼蛋白NpD53的氨基酸序列與其他物種的D53蛋白具有相同的保守結(jié)構(gòu)域clpBD2-small,與禾本科物種的同源性較高,其中與高梁的2個D53蛋白同源性最高,分別為91%和85%,而與海棗、油棕、芭蕉等物種的相似性僅30%-40%,說明不同物種問的D53蛋白可能有不同的結(jié)構(gòu)和功能。ClpB是HSP100/Clp蛋白家族的一員,與細(xì)胞的耐熱性緊密相關(guān),可溶解熱脅迫下的蛋白聚集體,從而減少熱激對細(xì)胞產(chǎn)生的損害,其序列具有高度保守特性(Katiyar-Agarwaletal.,2003)。其中胞質(zhì)型HSPl01/ClpB蛋白是植物抗高溫必需的因子,推測HSPl01/ClpB轉(zhuǎn)基因水稻有較高的耐熱性(Katiyar-Agarwaletal.,2003;楊金瑩等,2006)。由此推測河八王中的ClpB也與植株的自身耐熱性有關(guān)。

已有研究證實(shí),D53蛋白與I類ClpATP酶類有相似的結(jié)構(gòu)(Zhouetal.,2013),ClpATP酶是細(xì)菌中高度保守的調(diào)節(jié)亞基,是一種分子伴侶,其自身無水解活性,其中I類ClpATP酶類帶有2個不同的ATP結(jié)合區(qū)域(Freesetal.,2007)。本研究河八王NpD53蛋白序列中的非特異性位點(diǎn)ClpA和ClpC屬于I類,由此推測NpD53蛋白為一種分子伴侶,與河八王的自身耐熱性相關(guān)。

4結(jié)論

第6篇

[關(guān)鍵詞] 基因芯片;子宮內(nèi)膜異位癥;生物信息學(xué)分析;靶基因;microRNA

[中圖分類號] R711.710.46 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673-7210(2017)04(a)-0012-05

[Abstract] Objective To analyze and predict the expression of endometriosis (EMs) genes by bioinformatics methods, in order to provide a new basis for revealing the essence of EMs at the gene level and developing new treatment drugs. Methods Download gene dates which were related to EMs in Gene Expression Omnibus(GEO), were mined and analyzed by a series of bioinformatics tools, such as protparam, MotiScan, SignalP 4.0, NetPhos 2.0, TMHMM, GO, KEGG, STRING, BRB-Array Tools. Results 91 EMs related genes and 54 microRNA had been found in this study. These genes mainly involved in the process of cell proliferation regulation, cell apoptosis regulation and chemotaxis. Protein interaction network predicted 19 important EMs-related protein targets. Combined with target gene data mining, 134 EMs-related target genes were found. Conclusion Using bioinformatics method to analyze gene microarray data can acquire inner information of organisms, and provide new diagnostic markers and diagnostic thoughts for the early diagnosis of EMs.

[Key words] Microarray; Endometriosis; Bioinformatics; Target gene; MicroRNA

子m內(nèi)膜異位癥(endometriosis,EMs)是一種常見的慢性婦科疾病,在女性人群中,發(fā)病率為10%~15%[1],其臨床表現(xiàn)為不孕、痛經(jīng)、慢性盆腔痛、痛等[2],給年輕的女性帶來巨大的痛苦和經(jīng)濟(jì)負(fù)擔(dān)。EMs是在子宮腔外部出現(xiàn)經(jīng)過增殖、出血和再生的子宮內(nèi)膜樣組織,其發(fā)病機(jī)制尚不清楚[3-4]。由于EMs病因復(fù)雜,目前主要治療手段是手術(shù)和激素治療,但該病的復(fù)發(fā)率高,達(dá)40%~50%[5]。因此,亟需新的有效的EMs治療方法。

基因調(diào)控在EMs的發(fā)展中起重要作用[6]。研究EMs患者的基因特征是開發(fā)新療法的有效步驟[7-8],基因芯片數(shù)據(jù)能夠大規(guī)模地揭示基因遺傳背景。根據(jù)基因芯片數(shù)據(jù)可以發(fā)現(xiàn),免疫內(nèi)分泌的功能障礙是影響子宮內(nèi)膜異位的重要因素[9]。生物信息學(xué)被應(yīng)用于整理基因表達(dá)、基因功能、基因產(chǎn)物以及細(xì)胞功能相關(guān)的大量信息,來鑒定發(fā)病過程中的關(guān)鍵因子,預(yù)測合適的治療靶標(biāo)[10]。目前這種方法已被用于改進(jìn)肝細(xì)胞癌[11]、淋巴瘤[12]和口腔癌的診斷[13]。基因芯片技術(shù)與生物信息學(xué)分析的結(jié)合能夠?yàn)榧膊〉姆肿由飳W(xué)研究提供新的研究視角。

本研究應(yīng)用基因芯片分析軟件BRB-Array Tools對基因芯片公共數(shù)據(jù)庫的EMs相關(guān)基因和microRNA進(jìn)行數(shù)據(jù)挖掘,并進(jìn)行microRNA的靶基因預(yù)測。用生物信息學(xué)的方法對EMs的相關(guān)基因進(jìn)行通路和功能的分析,找出EMs相關(guān)蛋白質(zhì)相互作用的網(wǎng)絡(luò)調(diào)控的關(guān)鍵靶標(biāo),研究EMs的發(fā)病機(jī)制,為進(jìn)一步在基因水平上揭示EMs的本質(zhì)和發(fā)現(xiàn)藥物治療靶點(diǎn)、開發(fā)治療新藥提供新的依據(jù)。

1 材料與方法

1.1 材料

從美國國立生物信息技術(shù)中心(National Center for Biotechnology Information,NCBI)的公共基因芯片數(shù)據(jù)庫(Gene Expression Omnibus,GEO)[14]下載與EMs相關(guān)的基因和microRNA。

1.2 方法

①把EMs相關(guān)基因上傳到String(Search Tool for the Retrieval of Interacting Genes)數(shù)據(jù)庫在線分析工具(http://)[15-16]可獲得EMs相關(guān)基因蛋白-蛋白相互作用的網(wǎng)絡(luò),篩選節(jié)點(diǎn)(Hub)蛋白。

②把EMs相關(guān)基因上傳到DAVID(Database for Annotation,Visualization,and Integrated Discovery)[17],用功能注釋工具(Functional Annotation Tool),研究EMs相關(guān)基因參與FOTERM_MF_5以及GOTERM_BP_5基因本體數(shù)據(jù)庫(Gene Ontology,GO)[18]的分子功能和生物過程,分析EMs相關(guān)基因參與的PANTHER-PATHWAY和KEGG-PATHWAY數(shù)據(jù)庫中的生物學(xué)通路。

③應(yīng)用PicTar2005[19]、TargetScan 5.1[20]、miRanda V5[21]3種軟件預(yù)測靶基因,有兩種或兩種以上的軟件同時預(yù)測到的結(jié)果則認(rèn)為可靠。

2 結(jié)果

2.1 EMs相關(guān)基因的篩選

從公共基因芯片數(shù)據(jù)庫(Gene Expression Omnibus,GEO)下載與EMs相關(guān)的基因,共得到91個相關(guān)基因,結(jié)果見表1。

2.2 EMs相關(guān)基因的分析

對91個EMs相關(guān)基因編碼的蛋白進(jìn)行蛋白-蛋白的相互作用網(wǎng)絡(luò)分析顯示,處于網(wǎng)絡(luò)節(jié)點(diǎn)的蛋白質(zhì)有19個基因與之對應(yīng),分別是EGF、RELA、VEGFA、PCNA、PTEN、PIKCA、MDM2、MMP9、MMP1、NGF、PGR、PTGS2、IL11B、IL6、IL10、CD44、TP53、TNF、FOXO1,f明它們可能在致病中發(fā)揮著重要作用。GO富集分析結(jié)果顯示,EMs相關(guān)基因主要涉及細(xì)胞增殖、細(xì)胞凋亡、細(xì)胞代謝、信號轉(zhuǎn)導(dǎo)、趨化作用等反應(yīng)過程(圖1)。生物學(xué)通路分析表明,EMs相關(guān)基因主要參與細(xì)胞因子受體互作、腫瘤通路、造血細(xì)胞系、Jak-STAT信號等生物學(xué)的通路(圖2)。

2.3 microRNA的靶基因預(yù)測

在PubMed數(shù)據(jù)庫中檢測到54個EMs相關(guān)的microRNA,聯(lián)合靶基因的數(shù)據(jù)挖掘和預(yù)測,共得到134個EMs的相關(guān)基因。

3 討論

EMs給社會和婦女帶來了嚴(yán)重的臨床上和經(jīng)濟(jì)上的負(fù)擔(dān),因此,需要將研究和資源的效用最大化來提高對疾病的了解,以便發(fā)展新的有效的治療方法。隨著近幾年生物信息學(xué)技術(shù)的興起,基因芯片技術(shù)已經(jīng)成為生物醫(yī)學(xué)研究的基本方法。基因芯片是一種大規(guī)模高效率獲取生物信息的新型技術(shù),能夠檢測分析各個組織內(nèi)的表達(dá)基因的差異,隨著計(jì)算機(jī)技術(shù)的快速提高和生物數(shù)據(jù)的急劇增長,生物信息學(xué)這一剛剛興起的學(xué)科得到了前所未有的迅速發(fā)展[22],尤其是應(yīng)用生物信息學(xué)方法發(fā)現(xiàn)新基因和基因芯片,利用已知的核酸序列作為探針,與互補(bǔ)的靶核苷酸序列相互雜交,再進(jìn)行信號的監(jiān)測,最終完成定量或者定性的分析,在預(yù)防和新藥開發(fā)、輔助診斷疾病方面有廣闊的前景。生物信息學(xué)是涉及應(yīng)用物理學(xué)、數(shù)學(xué)、生物學(xué)、化學(xué)、計(jì)算機(jī)等交叉學(xué)科的一門新興學(xué)科,應(yīng)用現(xiàn)有的分析軟件和公共數(shù)據(jù)庫,可以探索生物分子結(jié)構(gòu)和功能特性,為后續(xù)研究提供新的研究思路和方向。EMs的生物學(xué)過程復(fù)雜,決定了從基因組水平篩選與轉(zhuǎn)移相關(guān)表型的功能基因成為EMs治療研究的重要方向[23]。

本研究發(fā)現(xiàn),EGF、RELA、VEGFA、PCNA、PTEN、PRKCA、MDM2、MMP9、MMP1、NGF、PGR、PTGS2、IL11B、IL6、IL10、CD44、TP53、TNF、FOXO1在EMs相關(guān)基因編碼蛋白-蛋白的作用網(wǎng)絡(luò)中起到節(jié)點(diǎn)蛋白的作用,推測這些基因?qū)Ms的發(fā)病起重要作用。本研究通過GO富集分析和通路分析發(fā)現(xiàn),EMs相關(guān)基因主要與細(xì)胞增殖調(diào)控、細(xì)胞凋亡調(diào)控、趨化作用有關(guān)。

綜上所述,本文應(yīng)用生物信息學(xué)的方法對基于基因芯片數(shù)據(jù)庫挖掘的EMs基因及蛋白進(jìn)行分析,為揭示EMs相關(guān)基因及microRNA的結(jié)構(gòu)、功能、蛋白的相互作用提供了重要依據(jù),發(fā)現(xiàn)了關(guān)鍵基因在EMs發(fā)生發(fā)展過程中可能起到重要的作用,為日后進(jìn)一步研究EMs的發(fā)病機(jī)制、發(fā)現(xiàn)藥物治療的靶點(diǎn),及為臨床治療和預(yù)防提供了新的切入點(diǎn)。

[參考文獻(xiàn)]

[1] Sourial S,Tempest N,Hapangama DK. Theories on the path?鄄ogenesis of Endometriosis [J]. International Journal of Reproductive Medicine,2014,2014:9.

[2] Giudice LC. Clinical pracice. Endometriosis [J]. N Engl J Med,2010,362(25):2389-2398.

[3] Mathew D,Drury JA,Valentijn AJ,et al. In silico,in vitro and in vivo analysis identifies a potential role for steroid hormone regulation of FOXD3 in endometriosis-associated genes [J]. Human Reproduction,2016,31(2):345-354.

[4] Aznaurova YB. Molecular aspects of development and regul?鄄ation of endometriosis [J]. Reproductive Biology and Endo?鄄crinology,2014,12(1):50.

[5] Guo SW. Recurrence of endometriosis and its control [J]. Human Reproduction Update,2009,15(4):441.

[6] Kobayashi H,Imanaka S,Nakamura H,et al. Understanding the role of epigenomic,genomic and genetic alterations in the development of endometriosis(review)[J].Molecular Medi?鄄cine Reports,2014,9(5):1483-1505.

[7] Burney RO,Talbi S,Hamilton AE,et al. Gene expression analysis of endometrium reveals progesterone resistance and candidate susceptibility genes in women with endome?鄄triosis [J]. Endocrinology,2007,148(8):3814-3826.

[8] Baranov VS,Ivaschenko TE,Liehr T,et al. Systems genetics view of endometriosis:a common complex disorder [J]. Euro?鄄pean Journal of Obstetrics & Gynecology & Reproductive Biology,2015,185:59-65.

[9] Khan MA. Genome-wide expressions in autologous euto?鄄pic and ectopic endometrium of fertile women with endom?鄄etriosis [J]. Reproductive Biology and Endocrinology,2012, 10(1):84.

[10] Ping S,Ma C,Liu P,et al. Molecular mechanisms underl?鄄ying endometriosis pathogenesis revealed by bioinformatics analysis of microarray data [J]. Archives of Gynecology and Obstetrics,2016,293(4):1-8.

[11] Zhang Y,Wang S,Dong L,et al. A Systems Biology-Based Classifier for Hepatocellular Carcinoma Diagnosis [J]. Plos One,2011,6(7):e22426.

[12] O'Neill MC,Li S. Neural network analysis of lymphoma microarray data:prognosis and diagnosis near-perfect [J]. BMC Bioinformatics,2003,4(1):13.

[13] Singaraju S,Prasad H,Singaraju M. Evolution of dental informatics as a major research tool in oral pathology [J]. Journal of Oral & Maxillofacial Pathology,2012,16(1):83-87.

[14] Barrett T,Wilhite SE,Ledoux P,et al. NCBI GEO:Archive for functional genomics data sets―update [J]. Nucleic Acids Res,2013,41(Database issue):D991-D995.

[15] Szklarczyk D,F(xiàn)ranceschini A,Kuhn M,et al. The STRING database in 2011:functional interaction networks of prot?鄄eins,globally integrated and scored [J]. Nucleic Acids Res,2011,39(Database issue):D561-D568.

[16] Franceschini A,Szklarczyk D,F(xiàn)rankild S,et al. STRING v9.1:protein-protein interaction networks,with increased coverage and integration [J]. Nucleic Acids Res,2013,41(Database issue):D808-D815.

[17] Huang DW,Sherman BT,Lempicki RA. Systematic and integrative analysis of large gene lists using DAVID bioinf?鄄ormatics resources [J]. Nature Protocol,2009,4(1):44-57.

[18] Ashburner M,Ball CA,Blake JA,et al. Gene ontology:tool for the unification of biology. The Gene Ontology Consortium [J]. Nat Genet,2000,25(1):25-29.

[19] Kerk A,Grun D,Poy MN,et al. Combinatorial microRNA target predictions [J]. Nat Genet,2005,37(5):495-500.

[20] Lewis BP,Burge CB,Bartel DP. Conserved seed pairing,often flanked by adenosines,indicates that thousands of human genes are microRNA targets [J]. Cell,2005,120(1):15-20.

[21] Griffiths-Jones S,Saini HK,Dongen SV,et al. Tools for microRNA genomics [J]. Nucleic Acids Research,2008, 36(Database issue):D154-D158.

[22] GuC,ShenT. cDNA microarray and bioinformatic analysis for the identification of key genes in Alzheimer's disease [J]. International Journal of Molecular Medicine,2014,33(2):457-461.

第7篇

關(guān)鍵詞:生物信息學(xué);雙語教學(xué);改革及實(shí)踐

中圖分類號:G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-9324(2015)46-0125-02

生物信息學(xué)是生物學(xué)、計(jì)算機(jī)科學(xué)及應(yīng)用數(shù)學(xué)等學(xué)科相互交叉而形成的一門新興學(xué)科。它以DNA和蛋白質(zhì)為研究對象,通過對生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的獲取、加工、存儲、檢索與分析,進(jìn)而達(dá)到揭示實(shí)驗(yàn)數(shù)據(jù)所蘊(yùn)含的生物學(xué)意義的目的[1]。基于“加強(qiáng)基礎(chǔ)、拓寬專業(yè)、強(qiáng)化能力、提高素質(zhì)”的人才培養(yǎng)指導(dǎo)思想,河南科技大學(xué)生物科學(xué)及生物技術(shù)本科專業(yè)開設(shè)了《生物信息學(xué)》課程,以便讓學(xué)生理解并掌握生物信息學(xué)領(lǐng)域的基本概念和基本理論,具備初步的生物信息學(xué)分析技能和實(shí)踐操作能力,從而適應(yīng)今后工作和學(xué)習(xí)的需要。

生物信息學(xué)的研究對象為各種分子生物學(xué)數(shù)據(jù),是在全世界各個實(shí)驗(yàn)室中產(chǎn)生的,然后再提交到相應(yīng)的數(shù)據(jù)庫中[2]。目前,這些大型分子生物學(xué)數(shù)據(jù)庫在存儲、檢索和可視化上,都是英文界面;《生物信息學(xué)》課程中講授的生物信息學(xué)軟件也均以英文為界面[3]。由于生物信息學(xué)學(xué)科的前沿性和交叉性,使得《生物信息學(xué)》課程的教學(xué)有其特殊性,其中一點(diǎn)就是適宜于開展較高水平的雙語教學(xué)。通過雙語教學(xué),可使學(xué)生盡快掌握以英文為界面的生物信息學(xué)網(wǎng)絡(luò)資源及相關(guān)生物信息學(xué)分析軟件的使用,提高本科生生物信息學(xué)基本的分析技能,繼而培養(yǎng)其創(chuàng)新能力。根據(jù)《生物信息學(xué)》的課程特點(diǎn),我們開展了雙語教學(xué)的改革和實(shí)踐,獲得了較好的教學(xué)效果。

一、激發(fā)學(xué)生學(xué)習(xí)興趣

《生物信息學(xué)》課程涉及的知識點(diǎn)較多,在線生物信息學(xué)分析平臺均為英文界面,多數(shù)學(xué)生因而存在一定的畏難情緒。因此,在授課的過程中,首先引導(dǎo)學(xué)生加強(qiáng)生物信息學(xué)基本分析方法及專業(yè)英語的學(xué)習(xí)。學(xué)生通過瀏覽英文網(wǎng)站,英文閱讀能力得到了很大提高;同時也開拓了視野,提升了知識面。總之,通過激發(fā)學(xué)生的學(xué)習(xí)興趣,幫助學(xué)生逐步建立起學(xué)習(xí)的興趣和自信心,為開展《生物信息學(xué)》雙語教學(xué)打下了堅(jiān)實(shí)的基礎(chǔ)。

二、選用英文原版教材

目前,適宜于本科生《生物信息學(xué)》雙語教學(xué)的英文原版教材較為欠缺[4]。其原因有兩點(diǎn):一方面,部分《生物信息學(xué)》原版英文教材非常昂貴,因成本原因不適宜于本科生選用;另一方面,通俗易懂、適合入門的《生物信息學(xué)》英文教材又少之又少。項(xiàng)目組最終篩選到了一本適宜于我校生物科學(xué)和生物技術(shù)專業(yè)本科生選用的英文原版教材《Bioinformatics For Dummies》,該教材淺顯易懂,實(shí)踐操作性強(qiáng),適宜于生物信息學(xué)初學(xué)者選用;另一方面,打印或復(fù)印該教材的成本較低,學(xué)生易于接受。

三、更新優(yōu)化教學(xué)內(nèi)容

基于英文原版教材《Bioinformatics For Dummies》,適當(dāng)更新并優(yōu)化了教學(xué)內(nèi)容,重點(diǎn)傳授了應(yīng)用性較強(qiáng)的生物信息學(xué)實(shí)踐分析技能。如核酸及蛋白序列數(shù)據(jù)庫的查詢、核酸及蛋白序列的相似性搜索、序列比對、分子系統(tǒng)進(jìn)化樹構(gòu)建、蛋白物理特性及3D結(jié)構(gòu)的預(yù)測等分析技能。另外還講授了離線單機(jī)版生物信息學(xué)軟件如DNAMAN 6.0、Primer Premier 5.0、MEGA 5.0的使用方法。

四、適當(dāng)講解理論算法

在注重傳授生物信息學(xué)實(shí)踐分析技能的同時,適當(dāng)講解生物信息學(xué)理論算法。由于生物信息學(xué)涉及的算法多數(shù)都較為枯燥,在授課過程中側(cè)重于分析方法的講解和應(yīng)用。如在講授Needleman-Wunsch全局比對和Smith-Waterman局部比對及分子系統(tǒng)發(fā)育樹構(gòu)建UPGMA(Unweighted pair group method with arithmetic mean,非加權(quán)算術(shù)平均組隊(duì)法)等算法時,在多媒體教學(xué)的基礎(chǔ)上,結(jié)合互動式“提問”及“板書”等方法輔助學(xué)生理解算法的基本原理及分析方法;同時布置課后計(jì)算題作業(yè),要求學(xué)生獨(dú)立完成后上交,從而促進(jìn)學(xué)生鞏固基本理論和基本知識[5]。

五、采用雙語多媒體授課

為了更好地執(zhí)行《生物信息學(xué)》課程的雙語教學(xué)任務(wù),我們首先制定了《生物信息學(xué)》課程雙語教學(xué)計(jì)劃。即選用英文教材,制作英文PPT教學(xué)課件,采用中英文相結(jié)合的授課方式。隨著學(xué)生生物信息學(xué)分析能力及專業(yè)英語水平的不斷提高,逐步在授課過程中由少到多地加大英文授課的比例。項(xiàng)目組已于2014-2015學(xué)年第2學(xué)期成功應(yīng)用英漢雙語完成了《生物信息學(xué)》課程的雙語教學(xué)任務(wù),教學(xué)效果良好。

六、實(shí)時演示在線分析過程

我校基于網(wǎng)絡(luò)安全的考慮,在教室內(nèi)僅能登陸校園網(wǎng)而不能登陸外網(wǎng)。在以往的《生物信息學(xué)》教學(xué)過程中,只能采用網(wǎng)頁抓圖的靜態(tài)教學(xué)方式,造成學(xué)生對生物信息學(xué)分析方法的體驗(yàn)不夠強(qiáng)烈。為了達(dá)到更好的教學(xué)效果,項(xiàng)目組購置了能夠接收無線網(wǎng)絡(luò)信號的設(shè)備,在教室內(nèi)可實(shí)時在線進(jìn)行生物信息學(xué)分析,在講解數(shù)據(jù)庫查詢、BLAST分析、Bankit序列提交、蛋白質(zhì)結(jié)構(gòu)域分析、蛋白質(zhì)物理特性及3D結(jié)構(gòu)預(yù)測等內(nèi)容時,學(xué)生得到了更加直觀的實(shí)踐體驗(yàn),加深了對生物信息學(xué)分析方法的印象,從而更加容易掌握這些實(shí)踐操作。

七、網(wǎng)絡(luò)教學(xué)資源建設(shè)

由于受學(xué)時的限制,《生物信息學(xué)》課堂教學(xué)的內(nèi)容非常有限。為了讓學(xué)生更好地利用生物信息學(xué)豐富的網(wǎng)絡(luò)資源,我們基于學(xué)校開發(fā)的網(wǎng)絡(luò)教學(xué)綜合平臺,構(gòu)建了《生物信息學(xué)》課程網(wǎng)絡(luò)平臺。平臺不僅提供雙語多媒體課件、教學(xué)視頻、作業(yè)及相關(guān)要求等教學(xué)資料;還提供了Primer Premier、DNASTAR、DNAMAN、MEGA、BioEdit軟件安裝程序和使用手冊、生物信息學(xué)英文文獻(xiàn)及常用的在線生物信息學(xué)分析工具的鏈接等內(nèi)容。

八、科研與教學(xué)相長

在生物信息學(xué)課程的雙語教學(xué)過程中,我們堅(jiān)持教學(xué)和科研互動,實(shí)現(xiàn)科研與教學(xué)相長。一方面,主講教師將科研中積累到的涉及到生物信息學(xué)的研究成果應(yīng)用于《生物信息學(xué)》教學(xué)過程中,豐富了教學(xué)內(nèi)容。如在講授Bankit在線序列提交序列時,我們以提交至國際核酸序列數(shù)據(jù)庫GenBank的芍藥(Paeonia lactiflora)乙烯受體ETR1(JX406435)、ETR2(KP265307)、ERS1(KP265307)、EIN4(KP265308)基因序列為例;在講授基因外顯子和內(nèi)含子結(jié)構(gòu)預(yù)測時,以芍藥ACO(KJ719260)和ACS(KP265309)基因組DNA序列為例;在講授Primer Premier軟件時,以芍藥ACO基因?yàn)槔謩e設(shè)計(jì)用于半定量RT-PCR、CDS擴(kuò)增及原核表達(dá)載體構(gòu)建所需的PCR引物。通過把科研思路帶入教學(xué)中,從而有效培養(yǎng)了學(xué)生的科研能力及創(chuàng)新能力。另一方面,教學(xué)實(shí)踐也有利于教師全面了解生物信息學(xué)和相關(guān)學(xué)科的最新進(jìn)展,不斷為科研提供新思路。

九、考試方式改革

《生物信息學(xué)》課程教學(xué)的目的是提高學(xué)生利用信息技術(shù)解決生物學(xué)問題的能力。因此,考試主要考查學(xué)生綜合利用所學(xué)知識分析問題和解決問題的能力。項(xiàng)目組對考試方式進(jìn)行了改革,改閉卷考試為大作業(yè)。要求學(xué)生一人一題,綜合應(yīng)用所學(xué)的生物信息學(xué)分析技能對所研究的核酸及其編碼的蛋白序列進(jìn)行序列查詢、序列同源性搜索,PCR引物的設(shè)計(jì),分子系統(tǒng)進(jìn)化樹的構(gòu)建,蛋白的物理性質(zhì)及3D結(jié)構(gòu)預(yù)測等分析,占考核成績的70%。采用這種考試方式,一方面促使學(xué)生在學(xué)習(xí)過程中不必花大量工夫去死記硬背,而把重點(diǎn)放在了基本理論、基本知識的鞏固及實(shí)踐操作技能的提高上,有效地提高了學(xué)生的實(shí)踐操作能力和創(chuàng)新能力;另一方面,也促使教師在教學(xué)過程中,注重從能力培養(yǎng)的角度進(jìn)行教學(xué)課堂設(shè)計(jì),提升教學(xué)質(zhì)量和水平。

參考文獻(xiàn):

[1]賀林.解碼生命――人類基因組計(jì)劃和后基因組計(jì)劃[M].北京:科學(xué)出版社,2000

[2]周到,黃敏.生物信息學(xué)雙語教學(xué)探討[J].科教文匯旬刊,2013,(231):48-49.

[3]戴凌燕,姜述君,高亞梅.《生物信息學(xué)》課程教學(xué)方法探索與實(shí)踐[J].生物信息學(xué),2009,7(4):311-313.

第8篇

一、整合生物信息學(xué)的研究領(lǐng)域

盡管目前一般意義上的生物信息學(xué)還局限在分子生物學(xué)層次,但廣義上的生物信息學(xué)是可以研究生物學(xué)的任何方面的。生命現(xiàn)象是在信息控制下不同層次上的物質(zhì)、能量與信息的交換,不同層次是指核酸、蛋白質(zhì)、細(xì)胞、器官、個體、群體和生態(tài)系統(tǒng)等。這些層次的系統(tǒng)生物學(xué)研究將成為后基因組時代的生物信息學(xué)研究和應(yīng)用的對象。隨著在完整基因組、功能基因組、生物大分子相互作用及基因調(diào)控網(wǎng)絡(luò)等方面大量數(shù)據(jù)的積累和基本研究規(guī)律的深入,生命科學(xué)正處在用統(tǒng)一的理論框架和先進(jìn)的實(shí)驗(yàn)方法來探討數(shù)據(jù)間的復(fù)雜關(guān)系,向定量生命科學(xué)發(fā)展的重要階段。采用物理、數(shù)學(xué)、化學(xué)、力學(xué)、生物等學(xué)科的方法從多層次、多水平、多途徑開展交叉綜合研究,在分子水平上揭示生物信息及其傳遞的機(jī)理與過程,描述和解釋生命活動規(guī)律,已成生命科學(xué)中的前沿科學(xué)問題(摘自:國家“十一五”生命科學(xué)發(fā)展規(guī)劃),為整合生物信息學(xué)的發(fā)展提供了數(shù)據(jù)資源和技術(shù)支撐。

當(dāng)前,由各種Omics組學(xué)技術(shù),如基因組學(xué)(DNA測序),轉(zhuǎn)錄組學(xué)(基因表達(dá)系列分析、基因芯片),蛋白質(zhì)組學(xué)(質(zhì)譜、二維凝膠電泳、蛋白質(zhì)芯片、X光衍射、核磁共振),代謝組學(xué)(核磁共振、X光衍射、毛細(xì)管電泳)等技術(shù),積累了大量的實(shí)驗(yàn)數(shù)據(jù)。約有800多個公共數(shù)據(jù)庫系統(tǒng)和許多分析工具可利用通過互聯(lián)網(wǎng)來解決各種各樣的生物任務(wù)。生物數(shù)據(jù)的計(jì)算分析基本上依賴于計(jì)算機(jī)科學(xué)的方法和概念,最終由生物學(xué)家來系統(tǒng)解決具體的生物問題。我們面臨的挑戰(zhàn)是如何從這些組學(xué)數(shù)據(jù)中,利用已有的生物信息學(xué)的技術(shù)手段,在新的系統(tǒng)層次、多水平、多途徑來了解生命過程。整合生物信息學(xué)便承擔(dān)了這一任務(wù)。

圖1簡單描述了生物信息學(xué)、系統(tǒng)生物學(xué)與信息學(xué)、生物學(xué)以及基因組計(jì)劃各個研究領(lǐng)域的相關(guān)性。可以看出基因組計(jì)劃將生物學(xué)與信息學(xué)前所未有地結(jié)合到了一起,而生物信息學(xué)的興起是與人類基因組的測序計(jì)劃分不開的,生物信息學(xué)自始至終提供了所需的技術(shù)與方法,系統(tǒng)生物學(xué)強(qiáng)調(diào)了生物信息學(xué)的生物反應(yīng)模型和機(jī)理研究,也是多學(xué)科高度交叉,促使理論生物學(xué)、生物信息學(xué)、計(jì)算生物學(xué)與生物學(xué)走得更近,也使我們研究基因型到表型的過程機(jī)理更加接近。虛線范圍代表整合生物信息學(xué)的研究領(lǐng)域,它包括了基因組計(jì)劃的序列、結(jié)構(gòu)、功能、應(yīng)用的整合,也涵蓋了生物信息學(xué)、系統(tǒng)生物學(xué)技術(shù)與方法的有機(jī)整合。

整合生物信息學(xué)的最大特點(diǎn)就是整合,不僅整合了生物信息學(xué)的研究方法和技術(shù),也是在更大的層次上整合生命科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、物理學(xué)、化學(xué)、醫(yī)學(xué),以及工程學(xué)等各學(xué)科。其生物數(shù)據(jù)整合從微觀到宏觀,應(yīng)用領(lǐng)域整合涉及工、農(nóng)、林、漁、牧、醫(yī)、藥。本文將就整合生物信息學(xué)的生物數(shù)據(jù)整合、學(xué)科技術(shù)整合及其他方面進(jìn)行初步的介紹和探討。

二、生物數(shù)據(jù)挖掘與整合

生物系統(tǒng)的不同性質(zhì)的組分?jǐn)?shù)據(jù),從基因到細(xì)胞、到組織、到個體的各個層次。大量組分?jǐn)?shù)據(jù)的收集來自實(shí)驗(yàn)室(濕數(shù)據(jù))和公共數(shù)據(jù)資源(干數(shù)據(jù))。但這些數(shù)據(jù)存在很多不利于處理分析的因素,如數(shù)據(jù)的類型差異,數(shù)據(jù)庫中存在大量數(shù)據(jù)冗余以及數(shù)據(jù)錯誤;存儲信息的數(shù)據(jù)結(jié)構(gòu)也存在很大的差異,包括文本文件、關(guān)系數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫等;缺乏統(tǒng)一的數(shù)據(jù)描述標(biāo)準(zhǔn),信息查詢方面大相徑庭;許多數(shù)據(jù)信息是描述性的信息,而不是結(jié)構(gòu)化的信息標(biāo)示。如何快速地在這些大量的包括錯誤數(shù)據(jù)的數(shù)據(jù)量中獲取正確數(shù)據(jù)模式和關(guān)系是數(shù)據(jù)挖掘與整合的主要任務(wù)。

數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的一個過程,其他各個環(huán)節(jié),如數(shù)據(jù)庫的選擇和取樣,數(shù)據(jù)的預(yù)處理和去冗余,錯誤和沖突,數(shù)據(jù)形式的轉(zhuǎn)換,挖掘數(shù)據(jù)的評估和評估的可視化等。數(shù)據(jù)挖掘的過程主要是從數(shù)據(jù)中提取模式,即模式識別。如DNA序列的特征核苷堿基,蛋白質(zhì)的功能域及相應(yīng)蛋白質(zhì)的三維結(jié)構(gòu)的自動化分類等。從信息處理的角度來說,模式識別可以被看作是根據(jù)一分類標(biāo)準(zhǔn)對外來數(shù)據(jù)進(jìn)行篩選的數(shù)據(jù)簡化過程。其主要步驟是:特征選擇,度量,處理,特征提取,分類和標(biāo)識。現(xiàn)有的數(shù)據(jù)挖掘技術(shù)常用的有:聚類、概念描述、連接分析、關(guān)聯(lián)分析、偏差檢測和預(yù)測模型等。生物信息學(xué)中用得比較多的數(shù)據(jù)挖掘的技術(shù)方法有:機(jī)器學(xué)習(xí),文本挖掘,網(wǎng)絡(luò)挖掘等。

機(jī)器學(xué)習(xí)通常用于數(shù)據(jù)挖掘中有關(guān)模式匹配和模式發(fā)現(xiàn)。機(jī)器學(xué)習(xí)包含了一系列用于統(tǒng)計(jì)、生物模擬、適應(yīng)控制理論、心理學(xué)和人工智能的方法。應(yīng)用于生物信息學(xué)中的機(jī)器學(xué)習(xí)技術(shù)有歸納邏輯程序,遺傳算法,神經(jīng)網(wǎng)絡(luò),統(tǒng)計(jì)方法,貝葉斯方法,決策樹和隱馬爾可夫模型等。值得一提的是,大多數(shù)數(shù)據(jù)挖掘產(chǎn)品使用的算法都是在計(jì)算機(jī)科學(xué)或統(tǒng)計(jì)數(shù)學(xué)雜志上發(fā)表過的成熟算法,所不同的是算法的實(shí)現(xiàn)和對性能的優(yōu)化。當(dāng)然也有一些人采用的是自己研發(fā)的未公開的算法,效果可能也不錯。

大量的生物學(xué)數(shù)據(jù)是以結(jié)構(gòu)化的形式存在于數(shù)據(jù)庫中的,例如基因序列、基因微陣列實(shí)驗(yàn)數(shù)據(jù)和分子三維結(jié)構(gòu)數(shù)據(jù)等,而大量的生物學(xué)數(shù)據(jù)更是以非結(jié)構(gòu)化的形式被記載在各種文本中,其中大量文獻(xiàn)以電子出版物形式存在,如PubMed Central中收集了大量的生物醫(yī)學(xué)文獻(xiàn)摘要。

文本挖掘就是利用數(shù)據(jù)挖掘技術(shù)在大量的文本集合中發(fā)現(xiàn)隱含的知識的過程。其任務(wù)包括在大量文本中進(jìn)行信息抽取、語詞識別、發(fā)現(xiàn)知識間的關(guān)聯(lián)等,以及利用文本挖掘技術(shù)提高數(shù)據(jù)分析的效率。近年來,文本挖掘技術(shù)在生物學(xué)領(lǐng)域中的應(yīng)用多是通過挖掘文本發(fā)現(xiàn)生物學(xué)規(guī)律,例如基因、蛋白及其相互作用,進(jìn)而對大型生物學(xué)數(shù)據(jù)庫進(jìn)行自動注釋。但是要自動地從大量非結(jié)構(gòu)性的文本中提取知識,并非易事。目前較為有效的方法是利用自然語言處理技術(shù)NLP,該技術(shù)包括一系列計(jì)算方法,從簡單的關(guān)鍵詞提取到語義學(xué)分析。最簡單的NLP系統(tǒng)工作通過確定的關(guān)鍵詞來解析和識別文檔。標(biāo)注后的文檔內(nèi)容將被拷貝到本地?cái)?shù)據(jù)庫以備分析。復(fù)雜些的NLP系統(tǒng)則利用統(tǒng)計(jì)方法來識別不僅僅相關(guān)的關(guān)鍵詞,以及它們在文本中的分布情況,從而可以進(jìn)行上下文的推斷。其結(jié)果是獲得相關(guān)文檔簇,可以推斷特定文本內(nèi)容的特定主題。最先進(jìn)的NLP系統(tǒng)是可以進(jìn)行語義分析的,主要是通過分析句子中的字、詞和句段及其相關(guān)性來斷定其含義。

生物信息學(xué)離不開Internet網(wǎng)絡(luò),大量的生物學(xué)數(shù)據(jù)都儲存到了網(wǎng)絡(luò)的各個角落。網(wǎng)絡(luò)挖掘指使用數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)數(shù)據(jù)中發(fā)現(xiàn)潛在的、有用的模式或信息。網(wǎng)絡(luò)挖掘研究覆蓋了多個研究領(lǐng)域,包括數(shù)據(jù)庫技術(shù)、信息獲取技術(shù)、統(tǒng)計(jì)學(xué)、人工智能中的機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等。根據(jù)對網(wǎng)絡(luò)數(shù)據(jù)的感興趣程度不同,網(wǎng)絡(luò)挖掘一般還可以分為三類:網(wǎng)絡(luò)內(nèi)容挖掘、網(wǎng)絡(luò)結(jié)構(gòu)挖掘、網(wǎng)絡(luò)用法挖掘。網(wǎng)絡(luò)內(nèi)容挖掘指從網(wǎng)絡(luò)內(nèi)容/數(shù)據(jù)/文檔中發(fā)現(xiàn)有用信息,網(wǎng)絡(luò)內(nèi)容挖掘的對象包括文本、圖像、音頻、視頻、多媒體和其他各種類型的數(shù)據(jù)。網(wǎng)絡(luò)結(jié)構(gòu)挖掘的對象是網(wǎng)絡(luò)本身的超連接,即對網(wǎng)絡(luò)文檔的結(jié)構(gòu)進(jìn)行挖掘,發(fā)現(xiàn)他們之間連接情況的有用信息(文檔之間的包含、引用或者從屬關(guān)系)。在網(wǎng)絡(luò)結(jié)構(gòu)挖掘領(lǐng)域最著名的算法是HITS算法和PageRank算法(如Google搜索引擎)。網(wǎng)絡(luò)用法挖掘通過挖掘相關(guān)的網(wǎng)絡(luò)日志記錄,來發(fā)現(xiàn)用戶訪問網(wǎng)絡(luò)頁面的模式,通過分析日志記錄中的規(guī)律。通常來講,經(jīng)典的數(shù)據(jù)挖掘算法都可以直接用到網(wǎng)絡(luò)用法挖掘上來,但為了提高挖掘質(zhì)量,研究人員在擴(kuò)展算法上進(jìn)行了努力,包括復(fù)合關(guān)聯(lián)規(guī)則算法、改進(jìn)的序列發(fā)現(xiàn)算法等。

網(wǎng)絡(luò)數(shù)據(jù)挖掘比單個數(shù)據(jù)倉庫的挖掘要復(fù)雜得多,是一項(xiàng)復(fù)雜的技術(shù),一個難以解決的問題。而XML的出現(xiàn)為解決網(wǎng)絡(luò)數(shù)據(jù)挖掘的難題帶來了機(jī)會。由于XML能夠使不同來源的結(jié)構(gòu)化的數(shù)據(jù)很容易地結(jié)合在一起,因而使搜索多個異質(zhì)數(shù)據(jù)庫成為可能,從而為解決網(wǎng)絡(luò)數(shù)據(jù)挖掘難題帶來了希望。隨著XML作為在網(wǎng)絡(luò)上交換數(shù)據(jù)的一種標(biāo)準(zhǔn)方式,目前主要的生物信息學(xué)數(shù)據(jù)庫都已經(jīng)提供了支持XML的技術(shù),面向網(wǎng)絡(luò)的數(shù)據(jù)挖掘?qū)兊梅浅]p松。如使用XQuery 標(biāo)準(zhǔn)查詢工具,完全可以將 Internet看作是一個大型的分布式XML數(shù)據(jù)庫進(jìn)行數(shù)據(jù)瀏覽獲取、結(jié)構(gòu)化操作等。

此外,數(shù)據(jù)挖掘還要考慮到的問題有:實(shí)時數(shù)據(jù)挖掘、人為因素的參與、硬件設(shè)施的支持、數(shù)據(jù)庫的誤差問題等。

一般的數(shù)據(jù)(庫)整合的方法有:聯(lián)合數(shù)據(jù)庫系統(tǒng)(如ISYS和DiscoveryLink), 多數(shù)據(jù)庫系統(tǒng)(如TAMBIS)和數(shù)據(jù)倉庫(如SRS和Entrez)。這些方法因?yàn)樵谡系某潭龋瑢?shí)體化,查詢語言,應(yīng)用程序接口標(biāo)準(zhǔn)及其支持的數(shù)據(jù)輸出格式等方面存在各自的特性而各有優(yōu)缺點(diǎn)。同時,指數(shù)增長的生物數(shù)據(jù)和日益進(jìn)步的信息技術(shù)給數(shù)據(jù)庫的整合也帶來了新的思路和解決方案。如傳統(tǒng)的數(shù)據(jù)庫主要是提供長期的實(shí)驗(yàn)數(shù)據(jù)存儲和簡便的數(shù)據(jù)訪問,重在數(shù)據(jù)管理,而系統(tǒng)生物學(xué)的數(shù)據(jù)庫則同時對這些實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,提供預(yù)測信息模型。數(shù)據(jù)庫的整合也將更趨向數(shù)據(jù)資源廣、異質(zhì)程度高、多種數(shù)據(jù)格式、多途徑驗(yàn)證(如本體學(xué)Ontology的功能對照)、多種挖掘技術(shù)、高度智能化等。

三、生命科學(xué)與生物信息學(xué)技術(shù)的整合

生物信息學(xué)的研究當(dāng)前還主要集中在分子水平,如基因組學(xué)/蛋白質(zhì)組學(xué)的分析,在亞細(xì)胞、細(xì)胞、生物組織、器官、生物體及生態(tài)上的研究才剛剛開始。從事這些新領(lǐng)域的研究,理解從基因型到表型的生命機(jī)理,整合生物信息學(xué)將起到關(guān)鍵性的作用。整合生物信息學(xué)將從系統(tǒng)的層次多角度地利用已有的生物、信息技術(shù)來研究生命現(xiàn)象。另外,由其發(fā)展出的新方法、新技術(shù),其應(yīng)用潛力也是巨大的。圖2顯示了生命科學(xué)與生物信息學(xué)技術(shù)的整合關(guān)系。

目前生命科學(xué)技術(shù)如基因測序、QTL定位、基因芯片、蛋白質(zhì)芯片、凝膠電泳、蛋白雙雜交、核磁共振、質(zhì)譜等實(shí)驗(yàn)技術(shù),可以從多方面,多角度來分析研究某一生命現(xiàn)象,從而針對單一的實(shí)驗(yàn)可能就產(chǎn)生大量的不同層次的生物數(shù)據(jù)。對于每個技術(shù)的數(shù)據(jù)分析,都有了大量的生物信息學(xué)技術(shù),如序列分析、motif尋找、基因預(yù)測、基因注解、RNA分析、基因芯片的數(shù)據(jù)分析、基因表達(dá)分析、基因調(diào)控網(wǎng)絡(luò)分析、蛋白質(zhì)表達(dá)分析、蛋白質(zhì)結(jié)構(gòu)預(yù)測和分子模擬、比較基因組學(xué)研究、分子進(jìn)化和系統(tǒng)發(fā)育分析、生物學(xué)系統(tǒng)建模、群體遺傳學(xué)分析等。整合生物信息學(xué)就是以整合的理論方法,通過整合生物數(shù)據(jù),整合信息技術(shù)來推動生命科學(xué)干實(shí)驗(yàn)室與濕實(shí)驗(yàn)室的組合研究。其實(shí)踐應(yīng)用涉及到生物數(shù)據(jù)庫的整合、功能基因的發(fā)現(xiàn)、單核苷酸多態(tài)性/單體型的了解、代謝疾病的機(jī)理研究、藥物設(shè)計(jì)與對接、軟件工具以及其他應(yīng)用。

在整合過程中,還應(yīng)該注意以下幾方面內(nèi)容:整合數(shù)據(jù)和文本數(shù)據(jù)挖掘方法,數(shù)據(jù)倉庫的設(shè)計(jì)管理,生物數(shù)據(jù)庫的錯誤與矛盾,生物本體學(xué)及其質(zhì)量控制,整合模型和模擬框架,生物技術(shù)的計(jì)算設(shè)施,生物信息學(xué)技術(shù)流程優(yōu)化管理,以及工程應(yīng)用所涉及的范圍。

四、學(xué)科、人才的整合

整合生物信息學(xué)也是學(xué)科、教育、人才的整合。對于綜合性高等院校,計(jì)算機(jī)科學(xué)/信息學(xué)、生物學(xué)等學(xué)科為生物信息學(xué)的發(fā)展提供了學(xué)科基礎(chǔ)和保障。如何充分利用高校雄厚的學(xué)科資源,合理搭建生物信息學(xué)專業(yè)結(jié)構(gòu),培養(yǎng)一流的生物信息學(xué)人才,是我們的任務(wù)和目標(biāo)。

計(jì)算機(jī)科學(xué)/信息學(xué)是利用傳統(tǒng)的計(jì)算機(jī)科學(xué),數(shù)學(xué),物理學(xué)等計(jì)算、數(shù)學(xué)方法,如數(shù)據(jù)庫、數(shù)據(jù)發(fā)掘、人工智能、算法、圖形計(jì)算、軟件工程、平行計(jì)算、網(wǎng)絡(luò)技術(shù)進(jìn)行數(shù)據(jù)分析處理,模擬預(yù)測等。生物信息學(xué)的快速發(fā)展給計(jì)算機(jī)科學(xué)也帶來了巨大的挑戰(zhàn)和機(jī)遇,如高通量的數(shù)據(jù)處理、儲存、檢索、查詢,高效率的算法研究,人工智能的全新應(yīng)用,復(fù)雜系統(tǒng)的有效模擬和預(yù)測。整合生物信息學(xué)的課程設(shè)計(jì)可以提供以下課程:Windows/Unix/Linux操作系統(tǒng)、C++/Perl/Java程序設(shè)計(jì)、數(shù)據(jù)庫技術(shù)、網(wǎng)絡(luò)技術(shù)、網(wǎng)絡(luò)編程、SQL、XML相關(guān)技術(shù)、數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí)、可視化技術(shù)、軟件工程、計(jì)算機(jī)與網(wǎng)絡(luò)安全、計(jì)算機(jī)硬件、嵌入式系統(tǒng)、控制論、計(jì)算智能,微積幾何、概率論、數(shù)理統(tǒng)計(jì)、線性代數(shù)、離散數(shù)學(xué)、組合數(shù)學(xué)、計(jì)算方法、隨機(jī)過程、常微分方程、模擬和仿真、非線性分析等等。

生物學(xué)是研究生命現(xiàn)象、過程及其規(guī)律的科學(xué),主要包括植物學(xué)等十幾個一級分支學(xué)科。整合生物信息學(xué)的課程設(shè)計(jì)可以提供以下課程:普通生物學(xué)、生物化學(xué)、分子生物學(xué)、細(xì)胞生物學(xué)、遺傳學(xué)、分子生物學(xué)、發(fā)育生物學(xué)、病毒學(xué)、免疫學(xué)、流行病學(xué)、保護(hù)生物學(xué)、生態(tài)學(xué)、進(jìn)化生物學(xué)、神經(jīng)生物學(xué)、基礎(chǔ)醫(yī)學(xué)、生物物理學(xué)、細(xì)胞工程、基因工程、分子動力學(xué)、生物儀器分析及技術(shù)、植物學(xué)、動物學(xué)、微生物學(xué)及其他生物科學(xué)、生物技術(shù)專業(yè)的技能課程。

作為獨(dú)立學(xué)科的生物信息學(xué),其基本的新算法,新技術(shù),新模型,新應(yīng)用的研究是根本。課程涉及到生物信息學(xué)基礎(chǔ)、生物學(xué)數(shù)據(jù)庫、生物序列與基因組分析、生物統(tǒng)計(jì)學(xué)、生物芯片數(shù)據(jù)分析、蛋白質(zhì)組學(xué)分析、系統(tǒng)生物學(xué)、生物數(shù)據(jù)挖掘與知識發(fā)現(xiàn)、計(jì)算生物學(xué)、藥物設(shè)計(jì)、生物網(wǎng)絡(luò)分析等。另外,整合生物信息學(xué)的工程應(yīng)用,也需要了解以下學(xué)科,如生物工程、生物技術(shù)、醫(yī)學(xué)影像、信號處理、生化反應(yīng)控制、生物醫(yī)學(xué)工程、數(shù)學(xué)模型、試驗(yàn)設(shè)計(jì)、農(nóng)業(yè)系統(tǒng)與生產(chǎn)等。

此外,整合生物信息學(xué)的人才培養(yǎng)具有很大的國際競爭壓力,培養(yǎng)優(yōu)秀的專業(yè)人才,必須使其具備優(yōu)良的生物信息科學(xué)素養(yǎng),具有國際視野,知識能力、科研創(chuàng)新潛力俱佳的現(xiàn)代化一流人才。所以要始終緊跟最新的學(xué)術(shù)動態(tài)和發(fā)展方向,整合學(xué)科優(yōu)勢和強(qiáng)化師資力量,促進(jìn)國際交流。

五、總結(jié)及展望

二十一世紀(jì)是生命科學(xué)的世紀(jì),也是生物信息學(xué)快速不斷整合發(fā)展的時代,整合生物學(xué)的研究和應(yīng)用將對人類正確認(rèn)識生命規(guī)律并合理利用產(chǎn)生巨大的作用。比如進(jìn)行虛擬細(xì)胞的研究,整合生物信息學(xué)提供了從基因序列,蛋白結(jié)構(gòu)到代謝功能各方面的生物數(shù)據(jù),也提供了從序列分析,蛋白質(zhì)拓?fù)涞较到y(tǒng)生物學(xué)建模等方面的信息技術(shù),從多層次、多水平、多途徑進(jìn)行科學(xué)研究。

整合生物信息學(xué)是基于現(xiàn)有生物信息學(xué)的計(jì)算技術(shù)框架對生命科學(xué)領(lǐng)域的新一輪更系統(tǒng)全面的研究。它依賴于生物學(xué),計(jì)算機(jī)學(xué),生物信息學(xué)/系統(tǒng)生物學(xué)的研究成果(包括新數(shù)據(jù)、新理論、新技術(shù)和新方法等),但同時也給這些學(xué)科提供了更廣闊的研究和應(yīng)用空間,并推動整個人類科學(xué)的進(jìn)程。

我國的生物信息學(xué)教育在近幾年已經(jīng)有了長足的進(jìn)步和發(fā)展。未來整合生物信息學(xué)人才的培養(yǎng)還需要加強(qiáng)各學(xué)科有效交叉,尤其是計(jì)算機(jī)科學(xué),要更緊密地與生命科學(xué)結(jié)合起來,共同發(fā)展,讓我們的生命科學(xué)、計(jì)算機(jī)科學(xué)和生物信息學(xué)的教育和科研走得更高更前沿。

作者簡介:

第9篇

關(guān)鍵詞:生物信息學(xué);生物芯片;藥物開發(fā);疾病檢測

Abstract: Bioinformatics was emerged in the 1980s,which is a new cross- discipline and then was applicated in the wide range of areas. Bioinformatics in biochips, drug development, energy fields, crop genetic analysis, disease detection are introduced in the context . Bioinformatics focuses on the collection, collation and services of biological data to discover laws guiding research,which is an indispensable tool for bioinformatics research.

Keywords: Bioinformatics;Biochip;Drug development;Disease detection

現(xiàn)代生物信息學(xué)是現(xiàn)代生命科學(xué)與信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)和化學(xué)等學(xué)科相互參透而形成的交叉學(xué)科,是應(yīng)用計(jì)算機(jī)技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列等各種信息的采集、存儲、傳遞、檢索、分析和解讀,以幫助了解生物學(xué)和遺傳學(xué)信息的科學(xué)[1]。

1.生物芯片

生物芯片(Biochip)是指通過微電子、微加工技術(shù)在芯片表面構(gòu)建的微型生物化學(xué)分析系統(tǒng),以實(shí)現(xiàn)對細(xì)胞、DNA、蛋白質(zhì)、組織、糖類及其他生物組分進(jìn)行快速、敏感、高效的處理和分析

基因芯片是目前最重要的生物芯片。

基因微陣列是通過將核苷酸或DNA作為探針,緊密地排列在硅片等固相支持物上,然后將經(jīng)過某種標(biāo)記后的樣品與微點(diǎn)陣雜交進(jìn)行檢測。根據(jù)雜交信息可以確定靶DNA的表達(dá)情況以及突變和多態(tài)性存在與否。芯片技術(shù)的突出特點(diǎn)是高度并行化、多樣化、微型化和自動化等,因而被廣泛用于測序、轉(zhuǎn)錄情況分析、不同基因型細(xì)胞的表現(xiàn)分析以及基因診斷、藥物設(shè)計(jì)等領(lǐng)域,成為后基因組時代基因功能分析的制程技術(shù)之一 [2]。

2.藥物開發(fā)

未來的藥物研究過程將是基于生物信息知識挖掘的過程。基因組研究對現(xiàn)代與未來藥物學(xué)和藥理學(xué)產(chǎn)生了重大影響,尤其為新藥篩選、藥靶設(shè)計(jì)和分子藥理學(xué)研究,以及疑難病的藥物設(shè)計(jì)和途徑選擇等提供了新的方法論基礎(chǔ)。基因組學(xué)與藥物學(xué)的結(jié)合已經(jīng)產(chǎn)生出一門新的分支學(xué)科---藥物基因組學(xué)[3]。制藥公司特將充分應(yīng)用藥物基因組學(xué)及生物信息學(xué)的理論知識和技術(shù)手段來設(shè)計(jì)臨床試驗(yàn)并模擬和分析理論與實(shí)驗(yàn)數(shù)據(jù)。這將大大減少新藥開發(fā)成本,縮短開發(fā)周期,為患者、醫(yī)生和健康醫(yī)療機(jī)構(gòu)等諸方面帶來選擇性治療的革命。生物信息學(xué)也可用于破譯遺傳密碼、篩選免疫基因以及進(jìn)行新藥研發(fā)等領(lǐng)域[4]。

3.生物信息學(xué)在能源領(lǐng)域的應(yīng)用

綜合運(yùn)用GenBank等數(shù)據(jù)庫以及各種分析軟件將各類數(shù)據(jù)對比分析,人們已經(jīng)能夠使用酶來降解生物聚合物,通過篩選有益細(xì)菌來獲取高級的生物催化劑,從而提高使用的產(chǎn)量[5-6]。原核生物采礦技術(shù)也得到了迅速發(fā)展。同樣,不同類型的煤也會發(fā)生類似的生物轉(zhuǎn)變,可以轉(zhuǎn)變成甲烷。人們通過生物信息學(xué)技術(shù)手段開采能源的新方法,可提高能源的采出率和降低開采難度。

通過生物信息學(xué)技術(shù)改良生物基因,使之轉(zhuǎn)變?yōu)樯锬茉矗@是解決能源短缺問題的途徑之一。這主要通過生物催化劑的基因轉(zhuǎn)變和代謝工程,利用酶和細(xì)菌對生物體的碳?xì)浠衔镞M(jìn)行新陳代謝優(yōu)化,從而用于開發(fā)生產(chǎn)生物乙醇等生物能源。

4.農(nóng)作物基因分析

對重要農(nóng)作物及經(jīng)濟(jì)植物進(jìn)行基因組分析也需要生物信息學(xué)工具。例如,在植物基因組調(diào)控和結(jié)構(gòu)研究中,涉及生物信息學(xué)的內(nèi)容有:調(diào)控序列數(shù)據(jù)庫;基因表達(dá)的調(diào)控分析;基因組序列識別;基因結(jié)構(gòu)預(yù)測,轉(zhuǎn)錄與翻譯控制模型;大規(guī)模基因數(shù)據(jù)集分析。

通過數(shù)據(jù)檢索、序列對比、同源性分析、結(jié)構(gòu)預(yù)測等工具軟件的運(yùn)用,可將分析數(shù)據(jù)應(yīng)用于農(nóng)作物模式植物研究、種質(zhì)資源保存、病蟲害防治、作物遺傳育種等[7]方面,從而為解決模式植物的基因組測序、保護(hù)瀕危種質(zhì)資源、控制動植物病蟲害和培育優(yōu)良高產(chǎn)的農(nóng)作物品種方面提供可靠保障。

5.疾病檢測

基因組計(jì)劃產(chǎn)生的基因及基因多態(tài)性數(shù)據(jù)與臨床醫(yī)學(xué)檢驗(yàn)結(jié)果之間的關(guān)系需要利用生物信息學(xué)的方法去分析、去揭示,根據(jù)這樣的分析結(jié)果,科學(xué)家能夠更準(zhǔn)確地了解疾病產(chǎn)生的根本原因,更精確地預(yù)測某個人患癌癥、糖尿病或者心臟病的可能性,從而徹底改變我們診斷、治療和預(yù)防疾病的方式[8]。

6.小結(jié)與展望

生物信息學(xué)的發(fā)展將給生命科學(xué)研究帶來明顯的變革,將幫助人類認(rèn)識生命的起源、進(jìn)化、遺傳和發(fā)育的本質(zhì),解釋人體生理和病理過程的分子基礎(chǔ),為人類疾病的預(yù)測、診斷、預(yù)防和治療提供合理和有效地方法或途徑,同時還將對醫(yī)藥、衛(wèi)生、食品、農(nóng)業(yè)等產(chǎn)業(yè)產(chǎn)生巨大的推動作用,甚至可能引發(fā)新的產(chǎn)業(yè)革命。21世紀(jì)是生命科學(xué)的時代,生物信息學(xué)為生命科學(xué)的發(fā)展提供了遍歷和強(qiáng)有力的技術(shù)支持,推動者生命的迅速發(fā)展。

參考文獻(xiàn):

[1] 張明德.生物信息學(xué)[M].北京:科學(xué)出版社,2004.

[2] 蔡祿.生物信息學(xué)教程[M].北京:化學(xué)工業(yè)出版社,2008.

[3] 姜遠(yuǎn)英.藥物基因組學(xué)[M].北京:人民衛(wèi)生出報(bào)社,2011.

[4] 李松,王英.生物信息學(xué)在生命科學(xué)研究中的應(yīng)用[J].熱帶醫(yī)學(xué)雜志,2009,9(10)1:218-1220.

[5] 趙進(jìn),駱江濤.能源:未來生物技術(shù)的挑戰(zhàn)[J].國外油田工程,2008,24(8)5:3-54.

[6] 劉永軍,金鵬康.石油集輸系統(tǒng)中微生物群落結(jié)構(gòu)研究[J].微生物學(xué)雜志,2009,29(3) 2:5-31.

第10篇

關(guān)鍵詞:生物信息學(xué) 實(shí)踐能力 課程體系 培養(yǎng)模式

中圖分類號:G4 文獻(xiàn)標(biāo)識碼:A 文章編號:1673-9795(2013)07(a)-0047-02

1 生物信息學(xué)概述

伴隨現(xiàn)代高通量分子生物學(xué)技術(shù)的快速發(fā)展,生物信息學(xué)在生物醫(yī)藥領(lǐng)域的應(yīng)用日益深入[1]。作為數(shù)學(xué)理論、計(jì)算機(jī)技術(shù)和生物醫(yī)藥研究的整合學(xué)科,生物信息學(xué)在生物進(jìn)化、生理功能、疾病治療、藥物開發(fā)、農(nóng)林產(chǎn)業(yè)等眾多領(lǐng)域均具有重要的應(yīng)用價值,是研究生命科學(xué)、醫(yī)藥科學(xué)內(nèi)在定量規(guī)律的重大交叉前沿學(xué)科。鑒于生物信息學(xué)的重要研究價值和廣闊的產(chǎn)業(yè)化前景,發(fā)展生物信息學(xué)專業(yè)教育,有計(jì)劃的建設(shè)生物信息學(xué)專業(yè)課程體系,開展面向?qū)嵺`能力的生物信息學(xué)人才培養(yǎng)對促進(jìn)現(xiàn)代生物醫(yī)學(xué)發(fā)展有重要的意義[2]。

2 生物信息學(xué)教育發(fā)展現(xiàn)狀

生物信息學(xué)發(fā)展起步于20世紀(jì)末,在短短的十幾年中,生物信息學(xué)已經(jīng)發(fā)展成為了橫跨多個研究領(lǐng)域的朝陽專業(yè),國內(nèi)眾多高等學(xué)府、科研院所相繼開設(shè)了生物信息本科和研究生專業(yè)[3]。但是,在實(shí)際的教學(xué)和研究過程中,絕大數(shù)單位依托于單一的數(shù)學(xué)、計(jì)算機(jī)或生物學(xué)專業(yè)開展,人才培養(yǎng)模式尚處于探索階段,在培養(yǎng)過程存在生物信學(xué)理論基礎(chǔ)薄弱、課程體系不健全、課程內(nèi)容不完善、專業(yè)教材匱乏、專業(yè)師資隊(duì)伍缺乏等問題。

哈爾濱醫(yī)科大學(xué)生物信息科學(xué)與技術(shù)學(xué)院是全國領(lǐng)先創(chuàng)辦生物信息學(xué)專業(yè)的單位之一,多年來致力于生物信息學(xué)的科學(xué)研究和本、碩、博各類人才培養(yǎng),堅(jiān)持以學(xué)生為本,以培養(yǎng)高素質(zhì)生物信息學(xué)專門人才為目標(biāo),深化教學(xué)改革,以滿足日益發(fā)展的生物信息學(xué)高端人才需要[4]。為解決生物信息學(xué)的教育教學(xué)問題,培養(yǎng)高水平的現(xiàn)代生物信息學(xué)人才,我們提出立足國內(nèi)高等生命科學(xué)與醫(yī)學(xué)教育,建立面向?qū)嵺`能力培養(yǎng)的生物信息學(xué)專業(yè)課程體系,以實(shí)現(xiàn)高質(zhì)量培養(yǎng)具有理工科創(chuàng)新思維能力的生物醫(yī)學(xué)人才,為我國生命科學(xué)―醫(yī)藥學(xué)科教育教學(xué)、科學(xué)研究和產(chǎn)業(yè)化輸送大批專門人才。

3 生物信息課程體系建設(shè)

3.1 課程建設(shè)目標(biāo)和指導(dǎo)方針

結(jié)合生物信息學(xué)才培養(yǎng)目標(biāo),經(jīng)過數(shù)十名骨干教師十余年生物信息學(xué)教學(xué)實(shí)踐及人才培養(yǎng)成果經(jīng)驗(yàn)反饋,我們適時調(diào)整本科生課程及教學(xué)內(nèi)容,逐步建立起面向?qū)嵺`能力培養(yǎng)的生物信息學(xué)專業(yè)課程體系。奠定了本科生的人文素養(yǎng)與科學(xué)素養(yǎng)并重,公共基礎(chǔ)理論及專業(yè)理論相輔相乘,重視學(xué)生理工生物醫(yī)學(xué)全方面素質(zhì)提高,重點(diǎn)突出學(xué)生實(shí)踐能力的人才培養(yǎng)方針,并在實(shí)踐中培養(yǎng)了大批具有創(chuàng)新思維能力的優(yōu)秀高端生物信息學(xué)專業(yè)人才。

3.2 生物信息學(xué)課程體系建設(shè)方案

考慮到生物信息學(xué)多學(xué)科交叉特點(diǎn)和國家大學(xué)生培養(yǎng)要求,及學(xué)生未來就業(yè)深造所必需的基礎(chǔ)和專業(yè)能力,我們在國內(nèi)率先開創(chuàng)了生物信息學(xué)專業(yè)人才培養(yǎng)課程體系,并在醫(yī)學(xué)院校獨(dú)立開展近40余門數(shù)理基礎(chǔ)課程和生物信息學(xué)專業(yè)課程。主要的課程建設(shè)情況如下:

(1)公共基礎(chǔ)課程(國家限修課):政治理論課程、公共外語、體育。

(2)生物醫(yī)學(xué)基礎(chǔ)課程:解剖生理學(xué)、發(fā)育生物學(xué)、生物化學(xué)、細(xì)胞生物學(xué)、分子生物學(xué)、生物技術(shù)實(shí)驗(yàn)、分子藥理學(xué)等。

(3)計(jì)算機(jī)基礎(chǔ)課程:計(jì)算機(jī)基礎(chǔ)、高級語言程序設(shè)計(jì)(C++&JAVA)、數(shù)據(jù)結(jié)構(gòu)、Perl語言程序設(shè)計(jì)、數(shù)據(jù)庫系統(tǒng)原理、Linux操作系統(tǒng)與程序設(shè)計(jì)等(上述課程均含上機(jī)實(shí)踐)。

(4)數(shù)學(xué)基礎(chǔ)課程:數(shù)學(xué)分析、高等代數(shù)、概率論與數(shù)理統(tǒng)計(jì)、數(shù)理邏輯、組合數(shù)學(xué)與圖論、微分動力學(xué)方程、運(yùn)籌學(xué)等(上述課程均含上機(jī)實(shí)踐)。

(5)專業(yè)基礎(chǔ)課程:信息論基礎(chǔ)、生物統(tǒng)計(jì)學(xué)、生物醫(yī)學(xué)圖像處理、模式識別、優(yōu)化算法、隨機(jī)過程、生物信息學(xué)概論、生物信息數(shù)據(jù)挖掘、生物信息軟件設(shè)計(jì)與開發(fā)、分子生物軟件工程、生物信息學(xué)數(shù)據(jù)可視化、專業(yè)外語等(上述課程均含實(shí)驗(yàn))。

(6)專業(yè)課程:生物芯片技術(shù)、結(jié)構(gòu)生物學(xué)、分子進(jìn)化、分子生物網(wǎng)絡(luò)、基因組信息學(xué)、蛋白質(zhì)組信息學(xué)、藥物基因組信息學(xué)、統(tǒng)計(jì)遺傳學(xué)、計(jì)算表觀遺傳學(xué)、計(jì)算機(jī)輔助藥物設(shè)計(jì)等(上述課程均含實(shí)驗(yàn))。

(7)綜合實(shí)踐課程:課題標(biāo)書設(shè)計(jì)、科研論文寫作、生物信息學(xué)進(jìn)展等。

我們在實(shí)踐基礎(chǔ)上開創(chuàng)的面向?qū)嵺`能力培養(yǎng)的生物信息學(xué)專業(yè)課程體系不同于其他院校,具有明顯的跨專業(yè)交叉性教學(xué)計(jì)劃特色。該課程體系著眼于基礎(chǔ)理論與實(shí)踐應(yīng)用相結(jié)合、素質(zhì)培養(yǎng)與專業(yè)培養(yǎng)相結(jié)合、扎實(shí)穩(wěn)妥與創(chuàng)新思維相結(jié)合。注重學(xué)生在醫(yī)學(xué)、生物學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)方面的基礎(chǔ)性教育,同時,強(qiáng)調(diào)了創(chuàng)新型人才培養(yǎng)、高精尖人才培養(yǎng)、特色化人才培養(yǎng)。厚基礎(chǔ)、寬口徑,使學(xué)生在本科階段不但打好將來從事生物信息學(xué)、系統(tǒng)生物學(xué)、生物醫(yī)藥等相關(guān)領(lǐng)域創(chuàng)新性研究工作基礎(chǔ),更重要的是該專業(yè)課程體系與實(shí)踐密切聯(lián)系,切合相關(guān)研究開發(fā)與產(chǎn)業(yè)實(shí)際,能夠培養(yǎng)學(xué)生從事原始創(chuàng)新研究與產(chǎn)業(yè)開發(fā)的能力。

4 生物信息學(xué)本科生培養(yǎng)模式建設(shè)

4.1 五年制分段培養(yǎng)與多學(xué)科教育體系

目前,我們根據(jù)生物信息學(xué)交叉學(xué)科人才培養(yǎng)特點(diǎn),考慮到基礎(chǔ)課程多,實(shí)踐能力要求高等因素,采取“2+2+1”的五年制本科人才培養(yǎng)模式,包括兩年理論基礎(chǔ)課程、兩年專業(yè)課程與一年實(shí)踐應(yīng)用課程培養(yǎng)(含科研訓(xùn)練+畢業(yè)設(shè)計(jì))。此模式在學(xué)生就業(yè)和用人單位反饋中證實(shí)具有顯著的人才培養(yǎng)效果。

課程體系建設(shè)依托于生物醫(yī)學(xué)綜合優(yōu)勢及深厚的數(shù)學(xué)、計(jì)算機(jī)科學(xué)功底,通過理論教學(xué)與實(shí)踐訓(xùn)練中的知識技能交叉、滲透,培養(yǎng)適應(yīng)21世紀(jì)生命學(xué)科與轉(zhuǎn)化醫(yī)學(xué)領(lǐng)域急需的生物信息學(xué)復(fù)合型人才。在此基礎(chǔ)上,從學(xué)科的交叉性出發(fā),進(jìn)一步加強(qiáng)不同類別課程之間的有機(jī)融合,加大相關(guān)領(lǐng)域知識的整合力度,建立更為緊密、完善,符合生物信息學(xué)學(xué)科特點(diǎn)的課程體系,將進(jìn)一步推動學(xué)科的發(fā)展和系統(tǒng)性教育理論體系的建立。

4.2 面向?qū)嵺`能力培養(yǎng)的本科生教育模式

在本科學(xué)生的培養(yǎng)過程中,我們特別重視學(xué)生實(shí)踐能力的培養(yǎng),通過教研一體化、學(xué)業(yè)導(dǎo)師制、報(bào)告研討制等先進(jìn)的教學(xué)方法,引導(dǎo)學(xué)生早期接觸生物信息學(xué)應(yīng)用領(lǐng)域和科學(xué)研究,在鞏固學(xué)習(xí)知識的同時,加強(qiáng)對學(xué)科的認(rèn)識和對未來的把握。

“教研一體化”的實(shí)踐教學(xué)模式:面向?qū)嵺`能力培養(yǎng)的課程體系建設(shè),要求教學(xué)模式上的改革,使得人才培養(yǎng)模式由注重多數(shù)學(xué)生基礎(chǔ)理論知識培養(yǎng)的大眾教育,向注重少數(shù)高精尖創(chuàng)新能力培養(yǎng)的精英式教育轉(zhuǎn)變。充分利用骨干教師在生物信息學(xué)領(lǐng)域的研究經(jīng)驗(yàn),將科學(xué)研究成果快速轉(zhuǎn)化成優(yōu)秀的教學(xué)素材,培養(yǎng)學(xué)生動手、實(shí)踐、創(chuàng)新能力,注重培養(yǎng)學(xué)生實(shí)際產(chǎn)業(yè)化的認(rèn)知水平和實(shí)踐能力。

本科生學(xué)業(yè)導(dǎo)師制:本科生進(jìn)入專業(yè)課教學(xué)階段,實(shí)行學(xué)業(yè)導(dǎo)師制。采取學(xué)生與一線骨干教師雙向選擇方式,使每名學(xué)生擁有自己的學(xué)業(yè)指導(dǎo)教師。導(dǎo)師為學(xué)生提供思想教育和專業(yè)輔導(dǎo),并通過指導(dǎo)大學(xué)生數(shù)學(xué)建模競賽、創(chuàng)新創(chuàng)業(yè)科研訓(xùn)練、早期科學(xué)研究等方法促進(jìn)學(xué)生的學(xué)習(xí)盡頭和對專業(yè)的深入認(rèn)識。

專題報(bào)告與研討制度:本科生畢業(yè)設(shè)計(jì)階段,強(qiáng)調(diào)學(xué)生的“主體”學(xué)習(xí)地位,使學(xué)生選擇感興趣的學(xué)科方向,在導(dǎo)師指導(dǎo)下進(jìn)行科研訓(xùn)練與實(shí)踐。要求學(xué)生自主利用網(wǎng)絡(luò)等各方面資源,獲取學(xué)科前沿信息,并以專題報(bào)告形式展示學(xué)習(xí)成果,通過提問、研討、總結(jié),提升自身專業(yè)素養(yǎng)及專業(yè)技能,獨(dú)立完成達(dá)到核心期刊發(fā)表水平的生物信息這科研課題。

5 生物信息學(xué)課程體系建設(shè)的意義

在全體師生的努力下,經(jīng)過多年的實(shí)踐探索,我們對生物信息學(xué)課程體系從基礎(chǔ)到實(shí)踐的不同階段進(jìn)行分段式、推進(jìn)式的改革與建設(shè)。在政策措施、人員配備、經(jīng)費(fèi)匹配等各方面給予鼎力支持。優(yōu)先保證面向?qū)嵺`能力培養(yǎng)的生物信息學(xué)課程體系快速、有效的建設(shè),已經(jīng)形成國內(nèi)頂尖的生物信息學(xué)本科教育理論和實(shí)踐團(tuán)隊(duì),并為國家輸送著大批高水平生物信息學(xué)人才。

面向?qū)嵺`能力培養(yǎng)的生物信息學(xué)課程體系建設(shè),一方面能夠完善生物醫(yī)學(xué)本科生、研究生的知識結(jié)構(gòu),提高運(yùn)用理工科思維和技能解決復(fù)雜生命科學(xué)問題的綜合科研能力,更為有效的實(shí)現(xiàn)生命科學(xué)攻關(guān)和創(chuàng)新研究理論形成;另一方面,生物醫(yī)藥是我國科技研發(fā)的薄弱環(huán)節(jié),在課程體系建設(shè)基礎(chǔ)上,培養(yǎng)適用于現(xiàn)代高通量分子生物學(xué)技術(shù)的創(chuàng)新型生物信息學(xué)人才,將為我國的醫(yī)藥物研發(fā)提供強(qiáng)有力的推動作用,并有利于創(chuàng)新臨床診斷技術(shù)開發(fā)和個性化醫(yī)療的實(shí)現(xiàn),促進(jìn)科技轉(zhuǎn)化,產(chǎn)生潛在的、不可估量的經(jīng)濟(jì)價值。

6 致謝

本文研究內(nèi)容是在黑龍江省高等教育教學(xué)改革專項(xiàng)項(xiàng)目,黑龍江省高教學(xué)會重點(diǎn)課題創(chuàng)新型生物醫(yī)學(xué)信息學(xué)人才培養(yǎng)模式研究,黑龍省創(chuàng)新創(chuàng)業(yè)人才培養(yǎng)項(xiàng)目面向生物信息產(chǎn)業(yè)開發(fā)的創(chuàng)新型專業(yè)人才培養(yǎng)模式研究與實(shí)踐,哈爾濱醫(yī)科大學(xué)醫(yī)學(xué)教育研究課題面向?qū)嵺`能力培養(yǎng)的生物信息學(xué)專業(yè)課程整合設(shè)計(jì)研究資助下完成的,課程體系的建設(shè)得到哈爾濱醫(yī)科大學(xué)學(xué)校領(lǐng)導(dǎo)的支持,并得到兄弟院校相關(guān)領(lǐng)域?qū)<摇W(xué)者的幫助,在此一并感謝。

參考文獻(xiàn)

[1] Ned Wingreen and David Botstein. Back to the Future:Education for Systems-level Biologists[J].Nature Review Molecular Cell Biology,2006,7(11):829-832.

[2] 徐良德,馬曄,孫紅梅,等.八年制醫(yī)學(xué)教育中開展《生物信息學(xué)》教學(xué)的實(shí)踐探討[J].素質(zhì)教育,2011,11:33-34.

第11篇

【摘要】

目的 應(yīng)用生物信息學(xué)分析軟件預(yù)測分析結(jié)核分支桿菌ESAT-6基因及相關(guān)蛋白的特性。方法 應(yīng)用NCBI、Expasy等在線生物信息學(xué)網(wǎng)站及DNAstar、Rasmol等軟件包分析ESAT-6并進(jìn)行同源比對;預(yù)測二級、三級結(jié)構(gòu),以及預(yù)測主要抗原表位等。結(jié)果 結(jié)核分支桿菌重組抗原ESAT-6與已發(fā)表氨基酸序列同源性為90%。預(yù)測該蛋白分子質(zhì)量約為9885.7Da,PI為4.6,4個抗原表位,其結(jié)構(gòu)域位于56-87位。結(jié)論 生物信息學(xué)技術(shù)在結(jié)核分支桿菌ESAT-6重組抗原研究中有一定的理論和應(yīng)用價值。

【關(guān)鍵詞】 生物信息學(xué);結(jié)核分支桿菌;ESAT-6;重組抗原

Abstract: Objective To predict the structure and function of recombinant antigen ESAT-6 of Mycobacterium tuberculosis using bioinformatics method. Methods By online analysis at bioinformatics websites such as NCBInibi.nlm.nih.gov/)and Expasy (cn.expasy. org/), and employing software packages such as DNAstar and Rasmol to do multi-sequence homological alignment, secondary structure and tertiary structure,antigenic epitope analysis,etc. Results Compared with the amino acid sequence of ESAT-6 of Mycobacterium tuberculosis published , the homologies was 90%. Analysis of the predicted protein indicated a molecular mass of 9885.7 KDa, PI was 4.6, function sites and four antigen pitope were found. Conclusion Bioinformatic is valuable to the study ESAT-6 of Mycobacterium tuberculosis.

Key words:bioinformatics; mycobacterium tuberculosis;ESAT-6;recombinant protein

生物信息學(xué)是在生命科學(xué)的研究中, 以計(jì)算機(jī)為工具對生物信息進(jìn)行儲存、檢索和分析的科學(xué)。它是當(dāng)今生命科學(xué)和自然科學(xué)的重大前沿領(lǐng)域之一, 同時也是21 世紀(jì)包括臨床醫(yī)學(xué)在內(nèi)的自然科學(xué)的核心領(lǐng)域之一。對于感染性疾病中病原體、生物傳播媒介、宿主的整體基因信息分析, 抗感染藥物的設(shè)計(jì), 耐藥機(jī)制的闡明, 疫苗的研發(fā)、個體化的預(yù)防策略等均有著日益重要的作用[1]。本文通過生物信息學(xué)方法對本室已獲得的ESAT- 6( 6KDa Early Secretory Antigenic Target)基因進(jìn)行進(jìn)一步預(yù)測分析,希望從中盡可能多地搜索和了解該基因的特性及相關(guān)蛋白的結(jié)構(gòu)與功能的信息,以便為結(jié)核病防治篩選新的診斷抗原分子,為實(shí)驗(yàn)研究和應(yīng)用前景分析提供信息。

1 材料與方法

1.1 材料

1.1.1 ESAT-6 DNA序列

全長基因序列為本實(shí)驗(yàn)室從結(jié)核分支桿菌標(biāo)準(zhǔn)菌株H37Rv中通過PCR方法獲得并亞克隆于pGEM-T中,經(jīng)BamH I、Xohl I雙酶切初步鑒定為陽性克隆菌株送往上海生物工程公司進(jìn)行核苷酸測序。將克隆基因測序結(jié)果輸入DNAStar /EditSeq,查找開放閱讀框,并對其所編碼的氨基酸序列用DNAStar /Protean軟件進(jìn)行分析。

1.1.2 分析軟件

DNAStar(V5.01),下載網(wǎng)址:dnastar.com; RasMoL Windows2.7.3,下載網(wǎng)址:Berns tein-plus-so ns. Com/ software/ RasMol-2.7.3/。

1.2 方法

通過NCBI網(wǎng)站(ncbi.nlm.nih.gov/)ORF finder 以及Prot Param(ca.expasy.org/tools/protparam/html)對序列與GenBank中的序列進(jìn)行在線比對、確定其完整編碼序列并預(yù)測蛋白質(zhì)理化性質(zhì)。通過蛋白質(zhì)分析專家系統(tǒng)Expasy(ca.expasy.org/)所提供的蛋白質(zhì)組學(xué)和序列在線分析工具:PredictProtein (http:cubic.bioc. columbia. edu/predi ctprotein/)預(yù)測氨基酸序列的跨膜區(qū)和二級結(jié)構(gòu);通過SMART(http: //smart. embl-heidelberg.de/smart/show_motifs.pl)預(yù)測其結(jié)構(gòu)域;通過Mobyle (mobyle. pasteur.fr/cgi-bin/portal. py?form= psort)進(jìn)行亞細(xì)胞定位;利用SWISS-MODEL(swissmodel.expasy.org/)進(jìn)行二級三級結(jié)構(gòu)的預(yù)測分析,用Rasmol軟件包中的三維分子視屏顯示。

2 結(jié)果

2.1 ESAT-6核苷酸及編碼的氨基酸序列及理化特性

ESAT-6基因序列由288個bp組成,編碼95個氨基酸,氨基酸序列為:

MTEQQWNFAGIEAAASAIQGNVTSIHSLLDEG

KQSLTKLAAAWGGSGSEAYQGVQQKWDATATELN

NALQNLARTISEAGQAMASTEGNVAGMFA。用DNAStar軟件及ExPASy Protemics Server protparam 預(yù)測氨基酸序列的分子質(zhì)量、等電點(diǎn)、穩(wěn)定性指數(shù)等。綜合二者結(jié)果如下:ESAT-6分子質(zhì)量單位為9885.7KDa,理論等電點(diǎn)為4.6,堿性氨基酸殘基(Arg+Lys)百分比為4.3%,酸性氨基酸殘基(Asp+Glu)百分比為9.5%,在哺乳動物、酵母、大腸埃希菌中的半衰期分別為30h(體外)、>20h(體內(nèi))和>10h(體內(nèi)),不穩(wěn)定指數(shù)為53.37,脂溶性指數(shù)為69.05,兩親性指數(shù)為-0.359。

2.2 ESAT-6氨基酸序列的同源性分析

與NCBI/GenBank上發(fā)表的ESAT-6(GenBank序列號:pdb|1WA8|B)氨基酸序列進(jìn)行比較分析,結(jié)果發(fā)現(xiàn)同源性為90%(圖1)。

2.3 ESAT-6二級結(jié)構(gòu)預(yù)測

用DNAStar /Protean分析重組蛋白特性及二級結(jié)構(gòu)見圖2(封3)。結(jié)果顯示ESAT-6的二級結(jié)構(gòu)中含有較多的α-螺旋結(jié)構(gòu)(占78%),β-片層、轉(zhuǎn)角(Turn)、無規(guī)則卷曲(Coil)依次為1%、5%和16%。

2.4 ESAT-6的跨膜區(qū)域、結(jié)構(gòu)域預(yù)測及亞細(xì)胞定位

跨膜區(qū)域如圖3所示(封3),該蛋白位于細(xì)胞外,說明為分泌性蛋白。SMART預(yù)測結(jié)果顯示ESAT-6的結(jié)構(gòu)域位于56-87位(QKWDATATELNNALQNLARTISEAGQAMASTE)。存在于細(xì)胞核的可能性為26.1%,在線粒體上存在的可能性為39.1%,在胞漿的可能性為34.8%。

2.5 ESAT-6的親水性及疏水性分析

根據(jù)ProtScale軟件預(yù)測結(jié)果(分值越高,其疏水性越強(qiáng),分值越低,親水性越強(qiáng)),與跨膜區(qū)域的推測結(jié)果一致,其疏水性較強(qiáng)。就整體而言,親水性氨基酸分布在整條鏈上,為兩親性蛋白,見圖4(封3)。

2.6 ESAT-6的抗原表位肽段的預(yù)測

用Predicting Antigenic Peptides對ESAT-6抗原表位進(jìn)行預(yù)測,結(jié)果表明該蛋白有4個抗原位點(diǎn),見圖5(封3),分別為:10-16(GIEAAAS)、18-30(IQGNVTSIHSLLD)、35-41(SLTKLAA)、50-56(AYQGVQQ)。

2.7 ESAT-6的三維結(jié)構(gòu)預(yù)測

Internet/SW ISSMODEL /EXPASY/ swiss2spdbv37 sp5分析模擬ESAT-6重組蛋白質(zhì)三維結(jié)構(gòu)見圖6(封3)。

3 討論

近年來研究表明,重組蛋白抗原研究是結(jié)核病血清學(xué)診斷研究的熱點(diǎn)。重組蛋白抗原的獲得為結(jié)核病診斷提供了極大的方便。利用基因工程技術(shù)可獲得質(zhì)量更好,純度更高的蛋白抗原,為結(jié)核病血清學(xué)診斷方法及蛋白質(zhì)芯片檢測技術(shù)的建立奠定了堅(jiān)實(shí)的基礎(chǔ)。目前發(fā)現(xiàn)的結(jié)核分枝桿菌蛋白抗原主要有14KD、16KD、38KD、mtb81和ESAT-6等[2-6]。其中,ESAT-6抗原是早期分泌抗原,是區(qū)別結(jié)核桿菌和非結(jié)核桿菌的最佳候選蛋白抗原,也是目前研究蛋白抗原中較為敏感和特異的一種較為理想的免疫診斷蛋白抗原。

傳統(tǒng)生物學(xué)認(rèn)為,蛋白質(zhì)的序列決定了它的結(jié)構(gòu),也就決定了它的功能[7]。蛋白質(zhì)的功能不僅取決于其氨基酸組成順序決定的一級結(jié)構(gòu),在很大程度上生物學(xué)活性取決于其高級結(jié)構(gòu)。然而通過實(shí)驗(yàn)方法獲得蛋白質(zhì)結(jié)構(gòu)不僅成本高而且速度慢。因此,隨著近10年來生物學(xué)分子序列信息的發(fā)展,目前已經(jīng)可以用理論預(yù)測的方法獲得大量的結(jié)構(gòu)和功能信息,用生物信息學(xué)的方法,通過計(jì)算機(jī)模擬相關(guān)的輔助信息,可以用較低的成本和較快的時間就能獲得可靠的結(jié)果[8]。DNAStar軟件是一個常用的功能強(qiáng)大的基因和蛋白質(zhì)綜合分析軟件。

本研究中我們利用生物信息學(xué)技術(shù)對獲得的重組ESAT-6基因所編碼蛋白分子在一級結(jié)構(gòu)分析的基礎(chǔ)上,又進(jìn)行了蛋白特性及高級結(jié)構(gòu)的初步分析。根據(jù)對ESAT-6蛋白氨基酸序列的一、二級結(jié)構(gòu)分析預(yù)測, 我們對此新基因有了一定的了解:該基因開放閱讀框長度為288bp,推導(dǎo)編碼95個氨基酸,分子量約為9885.7Da,理論等電點(diǎn)為4.6,不穩(wěn)定指數(shù)為53.37,脂溶性指數(shù)為69.05,兩親性指數(shù)為-0.359。同源性比對發(fā)現(xiàn)其基因序列與Genbank公共數(shù)據(jù)庫檢索出的ESAT-6基因序列的同源性比較發(fā)現(xiàn),它們的基因幾乎完全相同(同源性達(dá)99%)。提示該蛋白具有較好的遺傳學(xué)穩(wěn)定性,適合作為結(jié)核病診斷抗原研究的候選分子。一般來說,由于在有機(jī)體內(nèi)部親水性殘基位于表面,因此蛋白質(zhì)的親水部位與蛋白質(zhì)的抗原位點(diǎn)有密切的關(guān)系。而無規(guī)則卷曲區(qū)域除了決定蛋白質(zhì)的功能外, 與抗原表位也有關(guān)[8]。經(jīng)分析,該序列中α螺旋和無規(guī)則卷曲的比例為94%,提示該蛋白有很好的可塑性,可能與其功能有關(guān)。SMART預(yù)測結(jié)果顯示ESAT-6的結(jié)構(gòu)域位于56-87位。亞細(xì)胞定位表明該蛋白存在于細(xì)胞核的可能性為26.1%,在線粒體上存在的可能性為39.1%,在胞漿的可能性為34.8%。綜合本研究的親水性、疏水性、二級結(jié)構(gòu)等預(yù)測結(jié)果發(fā)現(xiàn):ESAT-6親水性和可塑性較大、抗原性指數(shù)較高,這為ESAT-6抗原表位的確定提供有力的證據(jù)。此外,通過專業(yè)分析軟件明確了ESAT-6蛋白抗原表位位點(diǎn)有4個,抗原表位的肽段序列的確定,為將來進(jìn)一步開展的結(jié)核病診斷血清價值的研究提供理論依據(jù),并為其他蛋白質(zhì)抗原表位的分析提供了一種可借鑒的手段。ESAT-6重組蛋白的三級結(jié)構(gòu)模擬能夠直接提供更多的蛋白質(zhì)立體構(gòu)象信息,這對ESAT-6進(jìn)一步的研究和應(yīng)用提供很好的線索及數(shù)據(jù)平臺。

對ESAT-6基因的生物信息學(xué)分析為研究該基因的功能和其在診斷、治療及預(yù)防方面的應(yīng)用價值研究提供了信息。

參考文獻(xiàn)

[1]李大江,劉焱斌,劉 凱.生物信息學(xué)在未來感染病學(xué)教學(xué)中的地位和作用[J].華西醫(yī)學(xué),2006,21 (3):474-476.

[2]Verbon A, Hartskeerl RA,Sehttitema A,et al.The 14,000 moleceular-weight antigen of Mycobacterium tuberculosis is related to the alpha-crystallin family of low-molecular-weight heat shock proteins[J].J Bacteriol,1992,174:1352-1359.

[3]Jacket PS,Bothamley GH,Barta HV,et al.Specificity of antibodes to immunodominant mycobsterial antigens in pulmnonary tuberoulosis[J].J Clin Mierobiol,1988,26:2313-2318.

[4]Andersen AB,Hansen EB.Structure and mapping of antigentic domains of protein antigen b, 38000-molecular-weight of Myeobacterium tuberculosis[J].Infect Immun,1989,57:2481-2488.

[5]Arend SM,Engelhord AC,Groot G,et al.Tuberculin skin testing compared with T-cell responses to Myeobectedum tubercufosis specific and noaspecific antigens for detection of latent infection in persons with recent tuberculosis contact[J].Clin Diagn Lab Immunol ,2001, 8: 1089-1096.

[6]Doherty TM,Demissie A, Olobo J, et al. Immune responses to the Mycobacterium tuberculosis specific antigen ESAT-6 signal subclinical infection arroag contacts of tuberculosis patients[J].J Clin Micmblol, 2002, 40: 704-706.

第12篇

【關(guān)鍵詞】 亞洲帶絳蟲 烯醇酶 結(jié)構(gòu) 能 生物信息學(xué)

Abstract: 【Objective】 To get the messages on the structures and characteristics of enolase from Taenia asiatica(T.a(chǎn).ENO) by bioinformatics. 【Methods】 A full-length cDNA sequence encoding enolase from cDNA plasmid library of Taenia asiatica was identified by using tools of bioinformatics at webs sites of NCBI. The characteristics of the deduced protein including the physico-chemical characteristics, modification sites after translation, domains, subcelluar location, topological structure, secondary structures, and 3D structure were predicted by employing bioinformatics software package supplied by the website of ExPaSy. 【Results】 The full cDNA sequence encoding T.a(chǎn).ENO includes a complete open reading frame of 1299bp which encoded a putative protein of 433 amino acids. The coding region is 205 bp ~ 1503 bp. The amino acids sequence has a high identity with enolase from other species in GenBank. The protein has one transmembrane region and stable physico-chemical characteristics. The molecular weight of T.a(chǎn).ENO is predicted to be 46653.5u. The protein has three hydrophilic regions. The relationship of phylogenesis between T.a(chǎn).ENO and enolase of other trematodes is close. 【Conclusion】 The cDNA sequence encoding enolase was screened from cDNA library of adult Taenia asiatica by bioinformatics. The structure and characteristics of the gene and protein of T.a(chǎn).ENO were obtained.

Key words:Taenia asiatica; Enolase; structure; function;bioinformatics

亞洲帶絳蟲(Taenia asiatica,T.a(chǎn).)廣泛分布于東南亞,包括我國西南地區(qū)及臺灣, 韓國、泰國、印尼和菲律賓等地[1-3]。人們通過食生或半生含有亞洲帶絳蟲囊尾蚴的豬、或野豬的內(nèi)臟, 特別是肝臟而感染,對勞動生產(chǎn)力和畜產(chǎn)品破壞極大。亞洲帶絳蟲成蟲形態(tài)與牛帶絳蟲成蟲相似,但其幼蟲卻與豬帶絳蟲的囊尾蚴相似。亞洲帶絳蟲成蟲與牛帶絳蟲成蟲的形態(tài)極為相似,人們長期以來把亞洲帶絳蟲誤認(rèn)為是牛帶絳蟲。上世紀(jì)80年代以來人們對其形態(tài)學(xué)、流行分布、中間宿主及實(shí)驗(yàn)動物感染、遺傳學(xué)進(jìn)行了研究,但大部分工作仍局限在細(xì)胞水平[4]。本課題組構(gòu)建了亞洲帶絳蟲成蟲的cDNA質(zhì)粒文庫,獲得了大量的Unigene,在這些工作的基礎(chǔ)上開展了對亞洲帶絳蟲基因組及蛋白質(zhì)組學(xué)的研究,以期從分子水平尋求3種帶絳蟲的起源、演化和彼此間的親緣關(guān)系及宿主選擇性的形成等問題的答案。本文分析的烯醇酶(enolase, ENO)是進(jìn)行這方面研究中感興趣的分子之一。

1 材料與方法

1.1 材 料

亞洲帶絳蟲成蟲全長cDNA質(zhì)粒文庫, 由上海聯(lián)合基因公司構(gòu)建。大規(guī)模測序得到多個表達(dá)序列標(biāo)簽(EST),Washington University BLAST(WU-BLASTX)方法歸并EST獲得UniGene[5], 由本課題組與該公司合作完成。編碼亞洲帶絳蟲烯醇酶(T.a(chǎn).ENO)基因的文庫質(zhì)粒編號為HC1-G6。其他寄生蟲及其他物種的ENO氨基酸序列源自GenBank(http://www.ncbi.nlm.nih.gov/Genbank/index.html):肝片形吸蟲烯醇酶基因(Fasciola hepatica ENO,登錄號AAA57450),棘口吸蟲烯醇酶基因(Echinostoma caproni ENO,登錄號ABI26619),秀麗隱桿線蟲烯醇酶基因(Caenorhabditis elegans ENO,登錄號CAH10783),布氏錐蟲烯醇酶基因(Trypanosoma brucei ENO,登錄號EAN77714),人烯醇酶基因(Homo sapiens ENO1,登錄號AAY43128;Homo sapiens ENO2,登錄號AAH02745;Homo sapiens ENO3 登錄號AH17249),褐鼠(Rattus norvegicus ENO 登錄號AAH83566), 牛烯醇酶基因(Bos taurus ENO 登錄號AAI02989),野豬烯醇酶基因(Sus scrofa ENO 登錄號ABC75829)。

1.2 方 法

1.2.1 T.a(chǎn).ENO基因的識別

通過美國國家生物技術(shù)信息中心(National Center for Biotechnology Information, NCBI, http://www.ncbi.nlm.nih.gov/)網(wǎng)站的基本局部比對搜索工具(basic local alignment search tool,BlastX,http://www.ncbi.nlm.nih.gov/BLAST/)程序[6],將文庫質(zhì)粒編號為HC1-G6的插入序列與GenBank中的序列進(jìn)行比對,分析該基因的翻譯序列與其他蛋白質(zhì)氨基酸序列的一致性、判斷其是否為全長基因。利用rpsblast分析其保守功能域。

1.2.2 T.a(chǎn).ENO核酸和氨基酸序列分析

綜合性蛋白核酸分析工具包(vector NTI suite)中的ORF Finder確定其完整的編碼序列(complete coding sequence,cds),然后用Translation程序推導(dǎo)并輸出氨基酸序列。AlignX對T.a(chǎn).ENO與GenBank中其他物種的同源蛋白氨基酸序列進(jìn)行比對分析,構(gòu)建分子進(jìn)化樹。

1.2.3 T.a(chǎn).ENO蛋白理化性質(zhì)及結(jié)構(gòu)分析

通過瑞士生物信息學(xué)研究所的蛋白分析專家系統(tǒng)(Expert Protein Analysis Systerm,ExPASy, http://ca.expasy.org/)所提供的蛋白組學(xué)和序列分析工具, 對目的基因及其產(chǎn)物進(jìn)行生物信息學(xué)分析。 預(yù)測T.a(chǎn).ENO的理化性質(zhì),如分子量、等電點(diǎn)、氨基酸組成、摩爾消光系數(shù)、重組產(chǎn)物在細(xì)菌、酵母和哺乳動物細(xì)胞中的半衰期、在溶液中的穩(wěn)定性等。預(yù)測T.a(chǎn).ENO一級結(jié)構(gòu)中糖基化、脂酰化、磷酸化、硫酸化等修飾位點(diǎn)、亞細(xì)胞定位。預(yù)測氨基酸序列的跨膜區(qū)和拓?fù)浣Y(jié)構(gòu)以及二級結(jié)構(gòu)、分子的親水性、溶液中的分子形態(tài)等, 通過二級結(jié)構(gòu)比對和折疊,對蛋白質(zhì)的空間構(gòu)象建模。

1.2.4 T.a(chǎn).ENO的親水性分析

Pcgene軟件分析繪制氨基酸親水性分布圖,確定強(qiáng)親水性的線性表位位置。

2 結(jié) 果

2.1 文庫質(zhì)粒編號為HC1-G6插入序列的Blastx分析

該基因是烯醇酶的同源基因,與GenBank中棘口吸蟲(Echinostomatidae caproni)的烯醇酶同源性高達(dá)78%。該克隆基因的5'端序列長于棘口吸蟲烯醇酶的完整編碼序列,所以該基因應(yīng)該是亞洲帶絳蟲烯醇酶的全長基因序列,其最大的ORF就是其完整的編碼區(qū)(圖1)。用rpsblast分析發(fā)現(xiàn)有完整的烯醇酶的保守結(jié)構(gòu)域(圖2)。

2.2 T.a(chǎn).ENO蛋白質(zhì)的理化性質(zhì)

T.a(chǎn).ENO的相對分子量理論值和等電點(diǎn)分別為46 653.5和6.77。含有5個半胱氨酸,預(yù)測這5個半胱氨酸之間形成二硫鍵的可能性較小,該蛋白在水溶液中280 nm處的摩爾消光系數(shù)為33 140 mol·L-1·cm-1;蛋白濃度為1 g/L時,半胱氨酸未形成二硫鍵時吸光系數(shù)(Abs)為 0.708。若其成熟肽N端為蛋氨酸時,在哺乳動物網(wǎng)狀紅細(xì)胞體外表達(dá)的半衰期為30 h, 在酵母和大腸埃希菌中表達(dá)的半衰期分別大于20 h和10 h。在溶液中的不穩(wěn)定指數(shù)為32.33, 在溶液中性質(zhì)穩(wěn)定。疏水指數(shù)為89.47, 疏水性較高。

轉(zhuǎn)貼于

2.3 T.a(chǎn).ENO翻譯后修飾、亞細(xì)胞定位的預(yù)測

用Motif scanning(Motifscan)分析T.a(chǎn).ENO特定位點(diǎn)結(jié)果顯示,T.a(chǎn).ENO含有6個潛在的酪蛋白激酶Ⅱ(CK2)磷酸化位點(diǎn), 5個潛在的蛋白激酶C(PKC)磷酸化位點(diǎn),2個酪氨酸激酶磷酸化位點(diǎn),10個潛在的N-肉豆蔻酰位點(diǎn), 1個潛在的天冬氨酸糖基化位點(diǎn)。T.a(chǎn).ENO沒有分泌信號肽序列和質(zhì)體以及線粒體定位序列。

2.4 T.a(chǎn).ENO的拓?fù)浣Y(jié)構(gòu)、二級結(jié)構(gòu)和親水性特征

用Predict protein預(yù)測結(jié)果如圖3所示。Htm預(yù)測該蛋白是一個膜蛋白,有1個跨膜區(qū)(M),N端位于膜內(nèi)(i),C端位于膜外(o)。Sec預(yù)測α螺旋(H)、β折疊(E)和無規(guī)卷曲(空白部分)的比例分別是40.42 ∶ 21.15 ∶ 38.43。

2.5 T.a(chǎn).ENO的親水性分析

利用 Pcgene軟件包預(yù)測T.a(chǎn).ENO氨基酸的親水性分布(圖4)。推導(dǎo)其線性抗原決定簇的位置分別是:①Ah = 2.03 From 50 to 55:Arg-Asp-Gly-Asp-Lys-Asn;②Ah = 1.73 From 86 to 92: Asp-Gln-Glu-Lys-Ile-Asp-Glu;③Ah = 1.48 From 373 to 380:Arg-Ser-Gly-Glu-Thr-Glu-Asp-Ser(Ah,average hydrophilicity,平均親水性)。

根據(jù)拓?fù)鋱D,其中①和②序列位于膜內(nèi),③序列位于膜外,是另一個高親水性的線性表位。該序列位于膜外區(qū)域,而且③的序列是ENO蛋白質(zhì)特征指紋序列。

2.6 T.a(chǎn).ENO的三維結(jié)構(gòu)圖和酶關(guān)鍵氨基酸的位置

利用同源建模法服務(wù)器(SWISS-MODEL)將T.a(chǎn).ENO 與蛋白結(jié)構(gòu)數(shù)據(jù)庫中的蛋白質(zhì)三維結(jié)構(gòu)進(jìn)行匹配,輸回模擬的T.a(chǎn).ENO三維結(jié)構(gòu)圖,文件在綜合性蛋白核酸分析工具包中打開該蛋白質(zhì)結(jié)構(gòu)文件,將構(gòu)成酶活性中心的關(guān)鍵氨基酸標(biāo)示在結(jié)構(gòu)圖上:ENO的關(guān)鍵氨基酸分別為第211位的谷氨酸(Glu211)、第343位的賴氨酸(Lys343)、和第371位的組氨酸(His371)[7],它們在空間位置上十分靠近,并且 His 371 出現(xiàn)在ENO的蛋白指紋區(qū)域[8](圖5)。

2.7 T.a(chǎn).ENO與其他物種ENO的比較和分子進(jìn)化樹的構(gòu)建

應(yīng)用vector NTI suite軟件鄰位相連法(neighbour joining 法)對 9 個物種11個ENO的氨基酸序列構(gòu)建分子進(jìn)化樹(圖6)。結(jié)果顯示在這9個物種中T.a(chǎn).ENO與吸蟲屬的ENO的進(jìn)化關(guān)系最近。這幾個物種ENO的關(guān)鍵氨基酸都處在相對保守的區(qū)域中。在與人的3個型別的ENO比對中,T.a(chǎn).ENO與ENO3的同源性高達(dá)74.7%,與ENO1、ENO2同源性為74.3%(圖6),這與BlastX分析的結(jié)果是一致的。

3 討 論

生物信息學(xué)可以通過對已有的核酸和蛋白質(zhì)序列數(shù)據(jù)庫進(jìn)行掃描和比對,搜索目標(biāo)序列特殊的結(jié)構(gòu)特征(如各種亞細(xì)胞的定位信號、翻譯后的修飾位點(diǎn)、功能域等),對基因的功能進(jìn)行初步的理論預(yù)測,為其功能研究尋找線索。生物信息學(xué)對基因的編碼區(qū)、限制性酶識別位點(diǎn)、編碼的蛋白質(zhì)的理化性質(zhì)(包括等電點(diǎn)、分子量、半衰期、穩(wěn)定性、疏水性等)的分析,有助于采取合理的克隆和表達(dá)策略,選用適合的表達(dá)載體,提高目的蛋白高效的可溶性表達(dá)的可能性,獲得有活性的重組蛋白[5]。

本文分析亞洲帶絳蟲烯醇酶基因,在GenBank中有其同源序列,經(jīng)多個生物信息學(xué)分析軟件預(yù)測,該基因與其他物種的烯醇酶編碼基因同源性較高,具有烯醇酶的特征氨基酸序列和保守功能域。基于這個分析結(jié)果,作者認(rèn)為可以在以后的實(shí)驗(yàn)中驗(yàn)證其是否具有催化2-磷酸甘油酸與磷酸烯醇式丙酮酸間轉(zhuǎn)化的活性、是否具有烯醇酶的其他已被確定的特點(diǎn),從而確定其是否為亞洲帶絳蟲的烯醇酶編碼基因。

在進(jìn)行驗(yàn)證性的工作時,生物信息學(xué)分析獲得的結(jié)果(如:烯醇酶的分子量、等電點(diǎn)、在溶液中的穩(wěn)定性、在不同系統(tǒng)或細(xì)胞中的半衰期等)可以幫助我們更好地進(jìn)行實(shí)驗(yàn),避免實(shí)驗(yàn)的盲目性。

烯醇酶是糖酵解途徑中催化2-磷酸甘油酸與磷酸烯醇式丙酮酸之間進(jìn)行轉(zhuǎn)化的酶,是一個比較保守的蛋白,對它的分析可以提供一些亞洲帶絳蟲進(jìn)化的信息。但由于目前GenBank中還沒有豬帶絳蟲、牛帶絳蟲及其他絳蟲的烯醇酶氨基酸序列,所以在本文中僅將T.a(chǎn).ENO氨基酸序列與可以作為亞洲帶絳蟲的宿主的人、豬、牛、鼠,以及其他寄生蟲的烯醇酶進(jìn)行了比對、構(gòu)建了進(jìn)化樹。這個比對結(jié)果雖然不能判斷T.a(chǎn).ENO與豬帶絳蟲、牛帶絳蟲或其他絳蟲的進(jìn)化關(guān)系,但是如果把T.a(chǎn).ENO作為藥物靶點(diǎn), 或者從其中尋找表位來研制疫苗, 則必需考慮它與宿主烯醇酶氨基酸的同源性,要選取T.a(chǎn).ENO與宿主有差別、但又比較關(guān)鍵的序列來進(jìn)行實(shí)驗(yàn)研究。

另外,對T.a(chǎn).ENO拓?fù)浣Y(jié)構(gòu)的預(yù)測顯示,T.a(chǎn).ENO是一個膜蛋白,沒有質(zhì)體及線粒體的定位序列,很多研究發(fā)現(xiàn)烯醇酶定位于細(xì)菌、真菌、原蟲[9]、蠕蟲[10]的表面,也可通過免疫定位來確定T.a(chǎn).ENO是否位于亞洲帶絳蟲的表膜, 從而進(jìn)一步研究其在致病及免疫方面的作用。

絳蟲生理代謝所需的能量來自糖酵解,雖然烯醇酶不是糖酵解途徑的關(guān)鍵酶,但它是一種多功能蛋白,是一個嗜神經(jīng)因子。它能與細(xì)胞骨架蛋白和多聚核苷酸結(jié)合、還具有熱休克蛋白的功能[11-13]。此外,它還是纖溶酶原及層粘連蛋白的受體[14],在寄生蟲侵襲宿主組織過程中發(fā)揮作用[9],它在感染和免疫中還作為抗體作用的靶分子[15]。利用生物信息學(xué)方法分析得到的結(jié)果將有助于全面了解T.a(chǎn).ENO的功能。

【參考文獻(xiàn)】

Fan PC, Lin CY, Kosman ML, et al. Experimental infection of Indonesia Taenia (Somosir strain) in domestic animals [J]. Int J Parasitol, 1989,19(7):809-812.

Fan PC, Chung WC, Lin CY, et al. Experimental infection of Thailand Taenia (Chiengma strain) in domestic animals [J]. Int J Parasitol, 1990, 20(1):121-123.

Fan PC, Lin CY, Chung WC, et al. Experimental infevtion of philippine Taenia in domestic animals [J]. Int J Parasitol, 1992, 22(2):235-238.

王正蓉. 亞洲牛帶絳蟲分類學(xué)研究進(jìn)展[J].貴陽醫(yī)學(xué)院學(xué)報(bào),2001,26(1):43-45.

黃 江,胡旭初,包懷恩,等. 亞洲帶絳蟲成蟲全長cDNA質(zhì)粒文庫的構(gòu)建及EST測序[J]. 熱帶醫(yī)學(xué)雜志, 2007,7(2):116-118.

吳忠道,余新炳,徐 勁,等.日本血吸蟲(大陸株)成蟲基因表達(dá)譜的研究[J].中山醫(yī)科大學(xué)學(xué)報(bào), 2002,23(6):401-404.

Zhang E, Brewer JM, Minor W, et al. Mechanism of enolase: the crystal structure of asymmetric dimer enolase-2-phospho-D-glycerate/enolase-phosphoenolpy-ruvate at 2.0 A resolution [J]. Biochemistry, 1997, 36(41):12526-12534.

Babitt PC, Hasson MS, Wedekind JE, et al. The enolase superfamily: a general strategy for enzyme-catalyzed abstraction of the a-protons of carboxylic acids [J]. Biochemistry, 1996, 35(51):16401-16489.

Pancholi V. Multifunctional alpha-enolase: its role in diseases [J]. Cell Mol Life Sci, 2001, 58(7):902-920.

Jolodar A, Fischer P, Bergmann S, et al. Molecular cloning of an alpha-enolase from the human filarial parasite Onchocerca volvulus that binds human plasminogen [J]. Biochim Biophys Acta, 2003, 1627(2-3):111-120.

Williams LA, Ding L, Horwitz J, et al. Tau-crystallin from the turtle lens: purification and partial characteri-zation [J]. Exp Eye Res, 1985,40(5):741-749.

Takei N, Kondo J, Nagaike K, et al. Neuronal survival factor from bovine brain is identical to neuron-specific enolase [J]. J Neurochem,1991,57(4):1178-1184.

亚洲精品无码久久久久久久性色,淫荡人妻一区二区三区在线视频,精品一级片高清无码,国产一区中文字幕无码
亚洲乱理片在线观看中字 | 亚洲成Aⅴ人片在线影院八 亚洲人人夜夜澡人人爽 | 一区二区三区精品视频在线观看 | 欧美日韩免费福利视频 | 日韩中文无线码免费观看 | 亚洲精品中字在线 |