端粒資料庫
1. 關於論文前言
我是復制的,希望對樓主能有所幫助
※ Multiplexing:一種同時採用多種樣品的測序方法,能夠大大提高測序速度。
※ 突變(Mutation):DNA序列上任一種可以被遺傳的變易。
※ 核苷酸(Nucleotide):DNA和RNA的基本組成部分,通常包含一分子核糖,一分子磷酸和一分子鹼基。多個核苷酸通過磷酸二酯鍵連接成一條鏈狀。
※ 細胞核(Nucleos):真核細胞中的一種細胞器,內含遺傳物質。
癌基因(Oncogene):一種能夠導致癌症的基因。許多致癌基因都直接或間接地控制細胞的成長速度。
※ 噬菌體(phage):一種以細菌為宿主細胞的病毒。
※ 物理圖譜(Physics Map):物理圖譜描繪DNA上可以識別的標記的位置和相互之間的距離(以鹼基對的數目為衡量單位),這些可以識別的標記包括限制性內切酶的酶切位點,基因等。物理圖譜不考慮兩個標記共同遺傳的概率等信息。對於人類基因組來說,最粗的物理圖譜是染色體的條帶染色模式,最精細的圖譜是測出DNA的完整鹼基序列。
※ 質粒(Plasmid):質粒是細菌的染色體外能夠自我復制的環狀DNA分子。它能夠和細胞核中的染色體明顯地區別開來,而且並不是細胞生存的必要物質。一些質粒適宜於引入到宿主細胞中去,並利用宿主細胞的DNA大量繁殖,因此我們常常採用質粒作為外源DNA的載體,外源DNA藉助於質粒在宿主細胞中大量繁殖。
※ 多基因病(Polygenic Disorder):有多個基因位點共同決定的遺傳病(如心臟病、糖尿病、一些癌症等)。這類疾病的遺傳由多個基因位點共同控制,因而比單基因病的遺傳更為復雜。
※ 多聚酶鏈式反應(PCR):一種體外擴增DNA的方法。PCR使用一種耐熱的多聚酶,以及兩個含有20個鹼基的單鏈引物。經過高溫變性將模板DNA分離成兩條鏈,低溫退火使得引物和一條模板單鏈結合,然後是中溫延伸,反應液的游離核苷酸緊接著引物從5『端到3』端合成一條互補的新鏈。而新合成的DNA又可以繼續進行上述循環,因此DNA的數目不斷倍增。
※ 多聚酶(Polymerase):多聚酶具有催化作用,能夠加快游離的核苷酸和DNA模板結合形成新鏈的反應速度。
※ 多態性(Polymorphism):多個個體之間DNA的差異稱為多態性。DNA變異概率超過1%的變異,比較適宜作為繪制連接圖譜的證據。
※ 引物(Primer):預先制備的比較短的核苷酸鏈,在新鏈合成過程中作為引物,游離的核苷酸在引物之後按順序和模板上的鹼基結合,形成新鏈。
※ 原核生物(Prokaryote):原核生物沒有細胞膜,結構清晰的核以及其他細胞器。細菌是原核生物。
※ 探針(Probe):是一條DNA單鏈或者一條RNA鏈,具有特定的序列,並且使用放射性元素或者免疫特性物質進行標記。探針和克隆庫中的某條互補片段結合成一條雙鏈結構,我們可以藉助於探針的檢測來獲知與其互補的鏈的位置。
※ 啟動子(Promoter):DNA上的一個特定位點,RNA聚合酶在此和DNA結合,並由此開始轉錄過程。
※ 蛋白質(Protein):一種由一條或者多條肽鏈構成的大分子。每條肽鏈上核苷酸的順序是由基因外顯子部分的鹼基序列決定的。蛋白質是細胞、組織和器官的重要組成部分,每種蛋白質都具有特定的功能。酶、抗體和激素等都是蛋白質。
※ 嘌呤(Purine):一種含氮的單環結構物。是核苷酸的重要組成部分,有腺嘌呤A和鳥嘌呤G兩種。
※ 嘧啶(Pyrimidine):一種含氮的雙環結構,是核苷酸的重要組成部分。分為胞嘧啶C,胸腺嘧啶T和尿嘧啶U三種。
※ 重組克隆(Recombinant Clone):將不同來源的DNA片段合成在一個DNA分子中,這種技術稱為重組,得到的分子為重組克隆。
※ DNA重組技術(Recombinant DNA Technology):在細胞體外將兩個DNA片段連接成一個DNA分子的技術。在適宜的條件下,一個重組DNA分子能夠被引入到宿主細胞中並在宿主細胞中大量繁殖。
※ 調控序列(regulatory regions and sequence):一段控制基因表達的DNA片段。
※ 限制性內切酶(Restriction enzyme, endonuclease):這種酶能夠識別出DNA上特定的鹼基序列,並在這個位點將DNA酶切。細菌中有400中限制性內切酶,能夠識別出100中DNA序列。
※ 酶切位點(Restriction Enzyme cutting site):DNA上一段鹼基的特定序列,限制性內切酶能夠識別出這個序列並在此將DNA酶切成兩段。
※ 限制性長度多態性(Restriction fragment length polymorphsm):從不同個體制備的DNA,使用同一種限制性內切酶酶切,切得的片段長度各不相同。酶切片段的長度可以作為物理圖譜或者連接圖譜中的標記子。通常是在酶切位點處發生突變而引發的。
※ 核糖核酸RNA(Ribonucleic acid):從細胞的細胞核和細胞質部分分離出來的化學物質。在蛋白質合成和其他生化反應中起著重要作用,RNA的結構和DNA的結構類似,都是有核苷酸按照一定順序排列成的長鏈。RNA可以分為信使RNA、轉運RNA、核糖體RNA以及其他類型的RNA。
※ 核糖體RNA(Ribonsomal RNA rRNA):存在於核糖體中的RNA。
※ 核糖體(Ribonsome):細胞質中含有rRNA和相關蛋白質的細胞器,是蛋白質的合成場所。
序列位置標簽(Sequence Tagged Site, STS):一段短的DNA序列(200-500個鹼基對),這種序列在染色體上只出現一次,其位置和鹼基順序都是已知的。在PCR反應中可以檢測處STS來,STS適宜於作為人類基因組的一種地標,據此可以判定DNA的方向和特定序列的相對位置。ETS是cDNA上的STS。
※ 性染色體(Sex Chromosome):在人類細胞中是X或者Y染色體,性染色體決定了個體的性別。雌性細胞中含有兩個X染色體,而雄性細胞中含有1個X染色體和1個Y染色體。
※ 鳥槍法(Shotgun method):使用基因組中的隨機產生的片段作為模板進行克隆的方法。
※ 單基因病(Single Gene Disorder):一個基因的等位基因之間發生了突變造成的疾病。
※ 體細胞(Somatic Cells):個體中除了生殖細胞及其母細胞之外的細胞,都是體細胞。
※ 串聯重復序列(Tandem repeat sequences):在染色體上一段序列的多次重復,稱為串聯重復序列。常用來作為物理圖譜中的標記子。
※ 端粒(Telomere):是染色體的末端部分,這一特殊結構區域對於線型染色體的結構和穩定起重要作用。
※ 轉錄(Transcription):以某一DNA鏈為模板,按照鹼基互補原則形成一條新的RNA鏈的過程,是基因表達的第一步。
※ 轉運RNA(tRNA):轉運RNA具有特殊的結構,其一端包含3個特定的核苷酸序列,能和信使RNA上的密碼子按照鹼基配對原則進行結合。另一端則帶有一個氨基酸。因此轉運RNA能夠同細胞質中游離的氨基酸結合並運到核糖體上,核糖體按mRNA上的遺傳信息將氨基酸裝配成蛋白質。
※ 轉化(Transformation):將外源DNA整合到某一細胞基因組中的過程。。
※ 翻譯(Translation):mRNA上攜帶的遺傳信息指導蛋白質的合成過程,稱為翻譯。
※ 病毒(Virus):一種不具備細胞結構的生物體。只能寄生在宿主細胞中才能生存。病毒一般包含核酸以及外殼蛋白,有些動物的病毒的外面也偶爾覆蓋一層細胞膜。病毒進入宿主細胞之後,利用宿主的合成機制復制出大量的後代。。
※ 酵母菌人工合成染色體(Yeast Artificial Chromosome):一種能夠克隆長達400Kb的DNA片段的載體,含有酵母細胞中必需的端粒、著絲點和復制起始序列。
(卜東波、伍樹明翻譯整理)
生物信息名詞
§§§ BLAST (Basic Local Alignment Search Tool),基本的基於局部對準的搜索工具;一種快速查找與給定序列具有連續相同片斷的序列的技術。
§§§ Entrez 美國國家生物技術信息中心所提供的在線資源檢索器。該資源將GenBank序列與其原始文獻出處鏈接在一起。
§§§ NCBI 美國國立生物技術信息中心(National Center for Biotechnology Information),1988年設立,為美國國家醫學圖書館(NLM)和國家健康協會(NIH)下屬部門之一。提供生物醫學領域的信息學服務,如世界三大核酸資料庫之一的GenBank資料庫,PubMed醫學文獻檢索資料庫等。
§§§ Conserved sequence 保守序列。演化過程中基本上不變的DNA中的鹼基序列或蛋白質中的氨基酸序列。
§§§ Domain 功能域。蛋白質中具有某種特定功能的部分,它在序列上未必是連續的。某蛋白質中所有功能域組合其起來決定著該蛋白質的全部功能。
§§§ EBI 歐洲生物信息學研究所(European Bioinformatics Institute)。 The National Center for Biotechnology Information (NCBI) at the NationalLibrary of Medicine (NLM), National Institutes of Health (NIH)
§§§ EMBL 歐洲分子生物學實驗室(uropean Molecular Biology Laboratory)。
§§§ GenBank 由美國國家生物技術信息中心提供的核酸序列資料庫。
§§§ Gene 基因。遺傳的基本的物理和功能單位。一個基因就是位於某條染色體的某個位置上的核苷酸序列,其中蘊含著某種特定功能產物(如蛋白質或RNA分子)的編碼。
§§§ DUST A program for filtering low complexity regions from nucleic acid sequences.
§§§ Gene expression 基因表達。基因中的編碼信息被轉換成行使特定功能的結構產物的過程。
§§§ Gene family 基因家族。一組密切相關的編碼相似產物的基因。
§§§ Gene mapping 基因作圖。對DNA分子(染色體或質粒)中基因的相對位置和距離進行確定的過程。
§§§ Genetic code 遺傳密碼。以三聯體密碼子的形式編碼於mRNA中的核苷酸序列,決定著所合成蛋白質中的氨基酸序列。
Genome 基因組。某一物種的一套完整染色體組中的所有遺傳物質。其大小一般以其鹼基對總數表示。
§§§ Genomics 基因組學。從事基因組的序列測定和表徵描述,以及基因活性與細胞功能關系的研究。
§§§ HGMP 英國劍橋的人類基因組繪圖計劃(Human Genome Mapping Project)。
§§§ Informatics 信息學。研究計算機和統計學技術在信息處理中的應用的學科。在基因組計劃中,信息學的內容包括快速搜索資料庫方法的開發、DNA序列信息分析方法的開發和從DNA序列數據中預測蛋白質序列和結構方法的開發。
§§§ Physical map 物理圖譜。不考慮遺傳,DNA中可識別的界標(如限制性酶切位點和基因等)的位置圖。界標之間的距離用鹼基對度量。對人類基因組而言,最低解析度的物理圖譜是染色體上的條帶圖譜;最高解析度的物理圖譜是染色體中完整的核苷酸序列。
§§§ Promoter 啟動子。DNA中被RNA聚合酶結合並從此起始轉錄的位點。
§§§ Proteome 蛋白質組。一個基因組的全部蛋白產物及其表達情況。
§§§ Regulatory region or sequence 調控區或調控序列。控制基因表達的DNA鹼基序列。
§§§ Ribosomal RNA 核糖體RNA。簡寫為rRNA。是一組存在於核糖體中的RNA分子。
§§§ Sequence tagged site 序列示蹤位點,簡寫為STS。在人類基因組中只出現一次的位置和序列已知的長約200到500bp的短DNA序列片斷。由於可以通過PCR檢測到,STS在將來源於許多不同實驗室的基因圖譜和測序數據進行定位和定向時非常有用,並且STS在人類基因組的物理圖譜中也具有界標的作用。表達的序列標簽(ESTs)就是那些得自cDNAs的STSs。
§§§ Single-gene disorder 單基因病。由單個基因的等位基因的突變所導致的遺傳病(如杜興肌營養不良和成視網膜細胞瘤等)。
§§§ UniGene 美國國家生物技術信息中心提供的公用資料庫,該資料庫將GenBank中屬於同一條基因的所有片斷拼接成完整的基因進行收錄。
§§§ 非蛋白質編碼區(「Junk」DNA)占據了人類基因組的大部分,研究表明「Junk」是許多對生命過程富有活力的不同類型的DNA的復合體,它們至少包括以下類型的DNA成份或由其表達的RNA成分:內含子(intron)、衛星(Satellite)DNA、小衛星(minisatellite)DNA、微衛星(microsatellite)DNA、非均一核RNA(hmRNA)、短散置元(short interspersed elements)、長散置元(long interspersed elements)、偽基因(pseudogenes)等。除此之外,順式調控元件,如啟動子、增強子等也屬於非編碼序列。
雙重序列對比 兩序列間的對比分析。最常見的方法為Needle-Wunsch方法。能夠利用的軟體如BLAST、FASTA等。
§§§ Autosome 常染色體。與性別決定無關的染色體,人雙倍體染色體組含有46條染色體,其中22對常染色體,一對與性別決定有關的性染色體(X和Y染色體)。
sex chromosome. 包括序列(核酸與蛋白)搜索,結構比較,結構預測,蛋白質域,模體(Motif ),測序,發育與進化分析,雙向電泳成像分析,質譜蛋白質鑒定,三維蛋白結構模建與成像,基因組圖譜比較,基因預測,非編碼區功能位點識別,基因組重疊群集裝,後基因組功能分析,結構基因組學以及葯物基因組學等等。
在BLAST2.0,2.05新版中啟用了gapped BLAST、PSI-BLAST 和PHI-BLAST。gapped BLAST是比原BLAST 更靈敏更快的局部相似聯配(俗稱局部同源)搜索法;PSI- BLAST用迭代型的剖面打分演算法,每次迭代所費時間與前者相同,它可檢索弱同源的目標;PHI-BLAST 98年剛出台,是模體(Motif )構造與搜索軟體,是更靈敏的同源搜索軟體。例如線蟲§§§ 的CED4是apoptosis 的調控蛋白,含有涉及磷酸結合的P 環模體,在各種ATP 酶和GTP 酶中可發現。在用gapped BLAST搜索NR資料庫時,CED4僅跟人凋亡調控蛋白Apaf-1顯著同源或相似(其中含有P-loop保守區)。但PHI- BLAST搜索,另有一個顯著同源(E=0.038 )目標,是植物抗病蛋白Arabidopsis thaliana T7N9.18,證實此動物與植物蛋白確實在apoptosis 中有相似的功能。另有,按PHI- BLAST搜索在MutL DNA修復蛋白中的ATP 酶域,II型拓撲異構酶,組氨酸激酶和HS90家族蛋白,發現一個新的真核蛋白族,共有HS90型ATP 酶域。再有在古核tRNA核苷酸轉移酶中發現核苷酸轉移酶域,在細菌DNA 引物酶的古核同源體中發現螺旋酶超家族II的模體VI。用以往的搜索法這些是得不到的。
深層事項:
後基因組時期的主要任務:Data mining ,即從完全測序的基因組中預測功能。
1 、序列、結構和功能 自分子生物學產生以來,均相信序列決定結構,結構決定功能。隨著基因組學的發展,對此理解已有長足的深化。同源序列(具有共同祖先)未必具有相同的功能;相同功能未必源自同源序列。相異序列可能有相似的結構;序列與結構不相似的蛋白可能會有相似的功能。現在發現存在不相似(在序列與結構水平上)酶催化相同的生化反應。當然亦存在甚至結構水平上很相似的酶催化不同的生化反應。例如人與鼠的3?- 羥甾類脫氫酶,1AHH和1RAL;前者是Rossmann折疊,而後者是TIM-桶。肯定,這些相似酶不是共同祖先趨異的結果,而是不同祖先趨同的結果。如結構決定功能還是合理的,那麼至少在功能活性位點具有相似結構特徵(即3D- 功能模體)。屬於今後研究的課題,對了解酶催化機制與功能蛋白的小分子模擬具有很大價值。 何謂功能?功能有層次的:表型的,細胞的和分子的。 目前開始高層功能預測,分子相互作用、代謝途徑和調控網路。目前,已從結構基因組學,功能基因組學和蛋白質組學多種角度研究基因組功能。
2 、結構基因組學中的生物信息學 希望大通量地測定和模建完全測序基因組的全部蛋白三維結構。生物信息學可以發揮作用,一方面規劃好測定的對象,另一方面可靠地模建結構。
3 、功能基因組學中的生物信息學 美國HGP 已編制1998-2003 的新五年計劃。提出八項目標:其中目標7 特指生物信息學和計算生物學,其實幾乎每項目標都要生物信息學,例如目標4 功能基因組學中的非編碼區功能位點預測,基因表達分析(如DNA Chip)以及蛋白質全局分析(如蛋白質組學)。
§§§ 蛋 白 質 組 學(Proteomics)
1.蛋白質組學研究的目的和任務 20世紀中期以來,隨著DNA雙螺旋結構的提出和蛋白質空間結構的X射線解析,開始了分子生物學時代,對遺傳信息載體DNA和生命功能的主要體現者蛋白質的研究,成為生命科學研究的主要內容。90年代初期,美國生物學家提出並實施了人類基因組計劃,預計用15年的時間,30億美元的資助,對人類基因組的全部DNA序列進行測定,希望在分子水平上破譯人類所有的遺傳信息,即測定大約30億鹼基對的DNA序列和識別其中所有的基因(基因組中轉錄表達的功能單位)。經過各國科學家8年多的努力,人類基因組計劃已經取得了巨大的成績,一些低等生物的DNA全序列已被闡明,人類3%左右DNA的序列也已測定,迄今已測定的表達序列標志(EST)已大體涵蓋人類的所有基因。在這樣的形勢下,科學家們認為,生命科學已經入了後基因組時代。在後基因組時代,生物學家們的研究重心已經從解釋生命的所有遺傳信息轉移到在整體水平上對生物功能的研究。這種轉向的第一個標志就是產生了一門成為功能基因組學(Functional Genomics)的新學科。它採用一些新的技術,如SAGE、DNA晶元,對成千上萬的基因表達進行分析和比較,力圖從基因組整體水平上對基因的活動規律進行闡述。但是,由於生物功能的主要體現者是蛋白質,而蛋白質有其自身特有的活動規律,僅僅從基因的角度來研究是遠遠不夠的。例如蛋白質的修飾加工、轉運定位、結構變化、蛋白質與蛋白質的相互作用、蛋白質與其它生物分子的相互作用等活動,均無法在基因組水平上獲知。正是因為基因組學(Genomics)有這樣的局限性,於90年代中期,在人類基因組計劃研究發展及功能基因組學的基礎上,國際上萌發產生了一門在整體水平上研究細胞內蛋白質的組成及其活動規律的新興學科——蛋白質組學(Proteomics),它以蛋白質組(Proteome)為研究對象。蛋白質組是指「由一個細胞或一個組織的基因組所表達的全部相應的蛋白質」。測定一個有機體的基因組所表達的全部蛋白質的設想,萌發在1975年雙向凝膠電泳發明之時。1994年Williams正式提出了這個問題,而「蛋白質組」的名詞則是由Wilkins創造的,發表在1995年7月的Electrophoresis雜志上。蛋白質組與基因組相對應,但二者又有根本不同之處:一個有機體只有一個確定的基因組,組成該有機體的所有不同細胞斗拱享用一個確定的基因組;而蛋白質組則是一個動態的概念,她不僅在同一個機體的不同組織和細胞中不同,在同一機體的不同發育階段,在不同的生理狀態下,乃至在不同的外界環境下都是不同的。正是這種復雜的基因表達模式,表現了各種復雜的生命活動,每一種生命運動形式,都是特定蛋白質群體在不同時間和空間出現,並發揮功能的不同組合的結果。基因DNA的序列並不能提供這些信息,再加上由於基因剪接,蛋白質翻譯後修飾和蛋白質剪接,基因遺傳信息的表現規律就更加復雜,不再是經典的一個基因一個蛋白的對應關系,一個基因可以表達的蛋白質數目可能遠大於一。對細菌,可能為1.2~1.3;對酵母則為3;而對人,可高達10。後基因組和蛋白質組研究,是為闡明生命活動本質所不可缺少的基因組研究的遠為復雜的後續部分,無疑將成為21世紀生命科學研究的主要任務。
2. 怎麼利用ura3篩選釀酒酵母端粒控制基因
釀酒酵母是第一個完成基因組測序的真核生物,測序工作於1996年完成。釀酒酵母的基因組包含大約1200萬鹼基對,分成16組染色體,共有6275個基因,其中可能約有5800個真正具有功能。據估計其基因約有23%與人類同源。酵母基因組資料庫包含有酵母基因組的詳細注釋(annotation),是研究真核細胞遺傳學和生理學的重要工具。另一個重要的釀酒酵母資料庫[1]由慕尼黑蛋白質序列信息中心維護。在釀酒酵母測序計劃開始之前,人們通過傳統的遺傳學方法已確定了酵母中編碼RNA或蛋白質的大約2600個基因。通過對釀酒酵母的完整基因組測序,發現在12068kb的全基因組序列中有5885個編碼專一性蛋白質的開放閱讀框。這意味著在酵母基因組中平均每隔2kb就存在一個編碼蛋白質的基因,即整個基因組有72%的核苷酸順序由開放閱讀框組成。這說明酵母基因比其它高等真核生物基因排列緊密。如在線蟲基因組中,平均每隔6kb存在一個編碼蛋白質的基因;在人類基因組中,平均每隔30kb或的鹼基才能發現一個編碼蛋白質的基因。酵母基因組的緊密性是因為基因間隔區較短與基因中內含子稀少。酵母基因組的開放閱讀框平均長度為1450bp即483個密碼子,最長的是位於Ⅻ號染色體上的一個功能未知的開放閱讀框(4910個密碼子),還有極少數的開放閱讀框長度超過1500個密碼子。在酵母基因組中,也有編碼短蛋白的基因,例如,編碼由40個氨基酸組成的細胞質膜蛋白脂質的PMP1基因。此外,酵母基因組中還包含:約140個編碼RNA的基因,排列在Ⅻ號染色體的長末端;40個編碼SnRNA的基因,散布於16條染色體;屬於43個家族的275個tRNA基因也廣泛分布於基因組中。表1提供了酵母基因在各染色體上分布的大致情況。表1酵母染色體簡況染色體編號長度(bp)基因數tRNA基因數I23×103894Ⅱ80718841013Ⅲ315×10318210Ⅳ153197479627V56920227113Ⅵ270×10312910Ⅶ109093657233Ⅷ561×10326911Ⅸ43988622110X74544237924Ⅺ66644833116Ⅻ107817153422ⅫI92443045921ⅪV78432841915XV109228356020XⅥ94806148717序列測定揭示了酵母基因組中大范圍的鹼基組成變化。多數酵母染色體由不同程度的、大范圍的GC豐富DNA序列和GC缺乏DNA序列鑲嵌組成。這種GC含量的變化與染色體的結構、基因的密度以及重組頻率有關。GC含量高的區域一般位於染色體臂的中部,這些區域的基因密度較高;GC含量低的區域一般靠近端粒和著絲粒,這些區域內基因數目較為貧乏。Simchen等證實,酵母的遺傳重組即雙鏈斷裂的相對發生率與染色體的GC豐富區相耦合,而且不同染色體的重組頻率有所差別,較小的Ⅰ、Ⅲ、Ⅳ和Ⅸ號染色體的重組頻率比整個基因組的平均重組頻率高。酵母基因組另一個明顯的特徵是含有許多DNA重復序列,其中一部分為完全相同的DNA序列,如rDNA與CUP1基因、Ty因子及其衍生的單一LTR序列等。在開放閱讀框或者基因的間隔區包含大量的三核苷酸重復,引起了人們的高度重視。因為一部分人類遺傳疾病是由三核苷酸重復數目的變化所引起的。還有的DNA序列彼此間具有較高的同源性,這些DNA序列被稱為遺傳豐余(geneticrendancy)。酵母多條染色體末端具有長度超過幾十個kb的高度同源區,它們是遺傳豐余的主要區域,這些區域至今仍然在發生著頻繁的DNA重組過程。遺傳豐余的另一種形式是單個基因重復,其中以分散類型最為典型,另外還有一種較為少見的類型是成簇分布的基因家族。成簇同源區(clusterhomologyregion,簡稱CHR)是酵母基因組測序揭示的一些位於多條染色體的同源大片段,各片段含有相互對應的多個同源基因,它們的排列順序與轉錄方向十分保守,同時還可能存在小片段的插入或缺失。這些特徵表明,成簇同源區是介於染色體大片段重復與完全分化之間的中間產物,因此是研究基因組進化的良好材料,被稱為基因重復的化石。染色體末端重復、單個基因重復與成簇同源區組成了酵母基因組遺傳豐余的大致結構。研究表明,遺傳豐余中的一組基因往往具有相同或相似的生理功能,因而它們中單個或少數幾個基因的突變並不能表現出可以辨別的表型,這對酵母基因的功能研究是很不利的。所以許多酵母遺傳學家認為,弄清遺傳豐余的真正本質和功能意義,以及發展與此有關的實驗方法,是揭示酵母基因組全部基因功能的主要困難和中心問題。
3. 為什麼端粒每復制一次就脫落一點,就算全掉了,DNA為什麼就不能復制了
端粒是DNA兩端的特殊序列,由於DNA聚合酶只能從5『-3』的方式進行DNA的復制,且復制並非從DNA的一段開始,而是從一定數量的DNA之後開始,多數情況下,DNA復制後會在5『端留下不完整的後隨鏈,所以每次復制都會使端粒變短。
每次復制的過程都縮短,長此以往,端粒最終就會消失,然後縮短的就是需表達的基因,這時基因庫就不完整了,細胞也會出現凋亡或者癌變。
所以端粒的長度在一定程度上決定著細胞的壽命。
4. 人類染色體的形態特徵
染色體在細胞分裂(cell division)之前才形成。在細胞的代謝期或間期,染色體分散成一級結構或伸展開的脫氧核糖核酸分子,組成細胞核內的染色質(chromatin)或核質(nucleoplasm or karyoplasm)。
染色體的形態以中期時最為典型。每條染色體由兩條染色單體組成,中間狹窄處稱為著絲點(centromere),又稱主縊痕(primary constriction),它將染色體分為短臂(p)和長臂(q)。
按著絲粒位置的不同,人類染色體可分為中著絲粒染色體、亞中著絲粒染色體和近端著絲粒染色體等3種類型。近端著絲粒染色體的短臂末端有一個叫做隨體(satellite)的結構,它呈圓球形,中間以細絲與短臂相連。
有的染色體長臂上還可看到另一些較小的狹窄區,稱為次縊痕(secondary constriction)。染色體臂的末端存在著一種叫做端粒(telomere)的結構,它有保持染色體完整性的功能。
(4)端粒資料庫擴展閱讀:
人類染色體可分為兩種類型:常染色體(體染色體)和性染色體(異體染色體)。某些遺傳特徵與一個人的性別有關,並通過性染色體傳播。常染色體因此包含其餘部分的遺傳信息。常染色體和性染色體的復制、有絲分裂和減數分裂過程一致。
人類細胞有23對染色體(22對常染色體和一對性染色體),即每個細胞共有46個染色單體。除此之外,人類細胞還有數百個線粒體染色體拷貝。人類基因組的測序提供了關於每條染色體的大量信息。
根據Sanger Institute在脊椎動物基因組注釋(VEGA)資料庫中的人類基因組信息編制的染色體統計數據。基因數量是估計值,因為它部分基於基因預測。總染色體長度也是估計值,是基於未測序異染色質區域的大小估計的。
5. 萬思立得衰老檢測什麼原理
通過細胞端粒的高科技衰老檢測技術,從0.1毫升血液進行分離、提取、擴增、培養、比對,可以解讀出人體現階段衰老程度、更早期預知患重大疾病風險概率(如癌症、心腦血管疾病、糖尿病、高血壓、老年痴呆),尤其是大病前後的端粒檢測和得糖尿病後的端粒檢測,可以實時監控病情進展及血管損傷狀況,更便於有針對性的預防疾病,保衛健康。
端粒在細胞中發揮了必不可少的作用,它防止染色體互相粘連。它們更重要的是在防止老化上的可能作用。細胞每分裂一次,端粒就縮短一點。經過很多年和很多代,它們縮短為一點,刺激細胞自殺,或停止分裂,進入一種半退休狀態。隨著越來越多的細胞死亡或衰老,皮膚和其他組織也就逐漸喪失了自我更新的能力。故通過端粒長度的檢測,並結合我們現有資料庫的比對,可以解讀出大量有關衰老和疾病的信息,為健康生活提供參考。
總而言之,都是玩高科技的。
6. 人類基因組圖譜的介紹
由美國國立人類基因組研究所(nhgri)和能源部(doe)領導的ihgsc不久前宣布,人類基因組測序工作已圓滿完成,其發表在2004年10月21日nature(2004,431:931)上的分析
報告對2001年2月發表的初步分析報告進行了補充。這篇最新分析報告不但為世人展現了一張精度大於99%、誤差小於10萬分之一的精確版人類基因組圖譜,而且還進一步糾正了蛋白編碼基因的數量,僅為2萬~2.5萬個,而非原先估計的3萬~3.5萬個。新基因組圖譜 准確率達99.999%
旨在破譯人類基因組常染色質遺傳密碼的人類基因組計劃(hgp)自1990年啟動至2003年結束,歷時共13年, 該計劃由ihgsc來完成。ihgsc是由法國、德國、日本、中國、英國和美國等6個國家20個研究所的科學家組成的開放性國際協作組織,全球2800餘名科學家參加了ihgsc的工作。
2001年2月,ihgsc宣布,人類基因組草圖已經完成。以今天的眼光來看,草圖顯然存在很多重要的不足,例如,僅測出了約90%的常染色質基因組序列,而且序列之間存在147821個未檢測出的空缺等等。
在2001-2003年之間,ihgsc的不懈努力終於將此草圖轉化為今天這張既高度精確又相當完整的人類基因組圖。此外,在這段時間內,還陸續發表了關於第2、6、7、9、10、13、14、19、20、21、22號染色體和y染色體的詳細評注和分析,其餘12條染色體的資料不久也將發表。
現在的基因組序列(buiid35)共包含28.5億個核苷酸,它近乎完整,涵蓋了99%以上的常染色質基因組序列;准確率為99.999%,也就是說誤差率只有1個鹼基/10萬個鹼基對,比最初制訂的目標精確了10倍。
序列的連續性亦獲得了顯著改善,常染色質基因組序列中僅存在341個空缺。現在,平均每一段連續序列含有3850萬個鹼基對,約比2001年版草圖的81500個鹼基對長475倍。這些沒有中斷的已知序列可以在很大程度上幫助科學家尋找目標基因及其鄰近的調節目標基因活性的序列,並顯著減少他們尋找疾病相關性短而少見的序列的工作量和費用。在剩餘的341個空缺中,很多與片段的重復(segmentalplications)相關,需要採用新的方法才能將其填滿。
ihgsc所完成的測序工作不僅完整而且精確,足以進行一些對敏感性要求較高的科學分析,例如基因數目的研究,疾病相關性重復片段的研究,以及進化過程中基因「生」或「死」
的研究。該基因組序列的資料已於2003年4月被載入免費公用資料庫。「完成」並非意味著現在的人類基因組圖就是完美無缺的。雖然與2001版草圖相比,空缺已經從近15萬個減少至341個,但是人類基因組序列的這些頑固空缺已很難用現有的技術來填補。填補這些空隙需要做進一步的研究,並需要採用新的技術。
美國馬薩諸塞州麻省理工學院和哈佛大學broad研究所所長lander說:「已完成的人類基因組序列在准確率、完整性和連續性方面遠遠超過了我們的預期目標。它反映出全球數百名科學家為了一個共同目標——為21世紀的生物醫學奠定扎實的基礎——而進行大協作的奉獻精神。」
僅有2萬~2.5萬個蛋白編碼基因
ihgsc最新分析所得出的最出人意料的結果就是,人類基因組只含有2萬~2.5萬個蛋白編碼基因。
nhgri所長collins說:「僅僅在10年以前,大多數科學家還認為,人類基因組大約含有10萬個蛋白編碼基因。3年前,當我們對人類基因組序列草圖進行分析時,我們估計人類約有3萬~3.5萬個蛋白編碼基因,這在當時已經使很多人感到震驚。而剛剛結束的分析結果發現人類的蛋白編碼基因數比預計的還要少得多,這使我們對人類基因組的真實情況有了更准確的了解。全世界的科學家都可以從免費公用資料庫中獲得該高度精確的人類基因組序列,這就使他們有可能對人類遺傳學及其影響人類健康和疾病的機制進行更精確的研究。」
人類基因組分析的主要目的之一就是確定人類的全部基因。基因是編碼特定蛋白質的一段dna序列,是遺傳的基本功能單位。目前的研究結果顯示,人類基因組有19599個已經獲得確定的蛋白編碼基因,另外還有2188段可能為蛋白編碼基因的dna序列。
英國wellcometrustanger研究所rogers說:「由於2001年版人類基因組草圖不夠完善,因此導致了一些早期基因模型是錯誤的。基因鑒定仍是一項艱巨的任務。除了其他生物的基因組序列、更好的計算機化模型和其他手段的改進外,人類基因組測序工作的完成必將為基因鑒定工作提供極大的幫助。」
人類基因重復片段高達5.3%
科學家們認為,已完成的人類基因組序列不但確定了更為確切的人類基因數量,而且與2001版基因組序列草圖相比,質量也有顯著的提高,並且使人們對某些現象有了征(胸腺發育不良)。美國聖路易斯市華盛頓大學基因組測序中心前主任、西雅圖市華盛頓大學基因組系主任waterston說:「以前只有基因組序列草圖的時候,要對重復片段進行研究幾乎是不可能的。通過全世界科學家堅持不懈的努力,現在我們已經可以對人類基因組中這一重要而快速進化的部分進行研究了。」
重復片段覆蓋了5.3%的人類基因組,顯著多於大鼠的基因組(約為3%)或小鼠的基因組(在1%~2%之間)。重復片段為人們開啟了一個了解人類基因組是如何進化的以及人類基因組目前正在經歷什麼樣的變化的窗口。人類基因組如此高的重復片段百分比表明,在最近4000萬年內,人類的遺傳物質經歷了快速的功能變革和結構改變。這大概就是人類具有獨特的特徵,從而有別於其非人類靈長類動物祖先的原因。
ihgsc在分析中發現,重復片段在不同的人類染色體之間的分布差異很大。y染色體就是一個最極端的例子,其重復片段占總長度的25%以上。有些重復片段往往群集於每
條染色體的中部(著絲粒)或末端(端粒)附近。科學家們推測,基因組可能將著絲粒和端粒處的重復片段用作一個進化實驗室,來生成具有新功能的基因。揭示基因的「生」與「死」
已完成的人類基因組序列准確度很高,這使科學家有可能了解在人類進化過程中基因的「生」和「死」。科學家在人類基因組中發現了1000多個新基因,這些基因是大約7500萬年前人類與嚙齒類動物向不同方向進化以後產生的。這些基因多數是最近通過基因重復產生的,與免疫、嗅覺和生殖功能有關,例如,人類基因組中最近重復的兩個基因家族分別編碼兩組蛋白質,妊娠特異性β1糖蛋白和絨毛膜促性腺激素β蛋白,這兩組蛋白質可能與人類獨特的較長的妊娠期相關。
此外,科學家們還利用已完成的人類基因組序列發現並鑒定了33個幾乎沒什麼變化的基因,但是由於它們在近期發生了1個或1個以上突變而導致了其功能喪失(或稱為「死亡」)。科學家通過將這些基因與大鼠和小鼠基因組中的對應基因(鼠類中這些對應基因的功能仍保持)進行對照比較後,確定了這些無功能基因(又稱為假基因)在人類基因組的確切位置。有趣的是,科學家們還發現,上述33個假基因中的10個似乎與編碼嗅覺感受器的蛋白相關,這就有助於解釋為什麼人類的功能性嗅覺感受器較少,從而導致了人類的嗅覺比嚙齒類動物差。axel和buck不久前就因在嗅覺分子生物學方面所做出的傑出貢獻而獲得了2004年諾貝爾生理學或醫學獎。
然後,科學家將這33個假基因和黑猩猩的基因組序列草圖進行了對照比較,以確定這些基因在大約500萬年前類人猿進化為人類前是否還是有功能的。分析結果顯示,33個假基因中的27個在人類中和在黑猩猩中均無功能,但有5個假基因雖在人類中無功能,但在黑猩猩中還是有功能的。美國休斯頓baylor醫學院人類基因組測序中心主任gibbs說:「對這些人類基因組中的假基因以及黑猩猩基因組中仍有功能的對應基因的確定,為將來的研究項目打下了堅實的基礎。」gibbs等目前正在進行另一種非人類靈長類動物——恆河猴基因組的測序工作。
7. 如何在springerlink資料庫中進行期刊瀏覽
在springerlink資料庫中可以用網站的篩選功能進行期刊瀏覽。
首先打開網站頁面。
這里我們以telomere(端粒)為例,選擇Life Science(生命科學)。
根據需要也可選擇其他類別。
進入生命科學搜索領域,輸入搜索關鍵詞telomere.也可通過設置進行高級搜索。
在搜索結果,如果文獻來源前面有一個黃色的圖標則不能查看全文;從我的搜索結果中下面有一篇可閱讀全文的PDF。
也可通過Springlink直接查找特定期刊。點擊Journals;然後輸入期刊名,以human nature為例。
點擊進入後可以看到該期刊的相關信息及最新發布的文獻,也可以在該期刊內搜索你想找的文獻。