GIỚI THIỆU VỀ TIN SINH HỌC

Đối với nhau theo một thứ tự tuyến tính bất kỳ (poly-peptide chains)... nhanh và mạnh thế nào, được nối ghép, dịch chuyển, và. thay đổi nhanh thế nào, etc.Khai thác dữ liệu trên mạng Internet: Nguyên tắc cơ bản về tìm kiếm thông tin trên Internet. Giới thiệu về CSDL sinh học lớn trên mạng Internet. Khai khác các phần mềm trực tuyến: Blast (tìm kiếm...

GIỚI THIỆU VỀ TIN SINH HỌC Giới thiệu về tin sinh học Hồ Tú Bảo Viện Công nghệ Thông tin, TTKHTN&CNQG Viện Khoa học và Công nghệ Tiên tiến Nhật bản (JAIST) 1 “The two technologies that will shape the “The two technologies that will shape the next century are biotechnology and next century are biotechnology and information technology” information technology” Bill Gates Bill Gates “The two technologies that will have “The two technologies that will have the greatest impact on each other in the the greatest impact on each other in the new millennium are biotechnology and new millennium are biotechnology and information technology” information technology” Martina McGloughlin Martina McGloughlin 2 Outline Khái niệm cơ bản của sinh học (http://www.ebi.ac.uk/microarray/biology_intro.html#Genomes) Phân tử trong sự sống Gene và gene học Tin sinh học là gì? Về một vài bài toán trong tin sinh học 3 “Sống”, Tạ Quang Bửu (1948) “…Một đêm tháng 10 năm 1910, một tế bào haploid (cùng một gamète với 24 chromosome) của cha tôi gặp một tế bào (cùng một gamète với 24 chromosome) của mẹ tôi. Hai tế bào ấy phối hợp với nhau thành một tế bào trứng với hai lần 24 chromosome. Tế bào này chẻ đôi sinh ra hai tế bào nữa, rồi hai sinh ra bốn, bốn sinh ra tám, v,v… thành một khối tế bào. Khối tế bào này là tôi. Chín tháng sau tôi ra đời với những đặc điểm này: da đen, mắt hoe, chân ngắn như ông nội tôi; mồm rộng, vai ngang, tai nhỏ như bà ngoại tôi. Ngoài ra trong thân thể có chỗ thì giống ông ngoại, có chỗ giống bà nội tôi. Còn tính lười đặc biệt của tôi thì xem gia phả đến bậc ông cố nội ngoại cũng không thấy tông tích. Có lẽ phải lên xa nữa. Ba năm sau, cũng theo một loạt biến cố như trên, em tôi ra đời. Em tôi thì mồm rộng, da trắng, mắt hoe, chân dài. Những đặc điểm của nó cũng là những đặc điểm của hai gia đình chúng tôi, nhưng phân phối lại cách khác.” 4 Basic genetics Gene học cơ sở Phần lớn của 100 tỷ tế bào (cell) trong cơ thể con người có sự sao chép của toàn bộ hệ gene (human genome), là toàn bộ thông tin di truyền cần thiết để tạo ra cơ thể sống. Hạt nhân tế bào (cell nucleus) chứa DNA gói trong các cặp nhiễm sắc thể (chromosomes). DNA chứa gene, là mã của cơ thể và điều khiển mọi khía cạnh về phát triển và kế thừa của tế bào. Protein, tạo ra từ amino acids, là các thành phần thiết yếu của mọi cơ quan (organs) và hoạt động hóa học. 5 Sinh vật và tế bào (1/2) Mọi sinh vật đều gồm các tế bào (cells). Mỗi tế bào là một hệ thống phức tạp gồm nhiều khối tạo dựng (building blocks) khác nhau bọc bởi các màng (membrane). Có khoảng 6x1013 tế bào trong cơ thể người, với khoảng 320 kiểu khác nhau, như tế bào da, cơ bắp, não (neurons), etc. Tế bào có kích thước khác nhau: hồng cầu có đường kính chừng 0.005 mm còn neuron dài chừng 1 mét. Hai kiểu sinh vật và tương ứng hai kiểu tế bào, là kết quả của những con đường tiến hóa khác nhau. Nhân chuẩn (Eukaryotes): cỏ, hoa, lúa mì, giun, ruồi, chuột, chó, mèo, người, nấm, men bia, etc. Nhân sơ (Prokaryotes): bacteria 6 Sinh vật và tế bào (2/2) Mỗi tế bào nhân chuẩn đều gồm một nucleus (nhân), được tách khỏi phần còn lại của tế bào bởi một màng ngăn. Một đặc tính cơ bản của mọi tế bào sống là khả năng phát triển (to grow) trong một môi trường thích hợp và trải qua sự phân chia tế bào (cell division). Sự phân chia tế bào và biệt lập tế bào cần được kiểm soát. Khi tế bào phát triển không được kiểm soát có thể tạo thành các u (tumours) và ung thư. 7 Molecules of life Phân tử của sự sống 1. Small molecules 2. Proteins 3. DNA Biological macromolecules 4. RNA 8 Small molecules Tiểu phân tử Có thể có các vai trò độc lập hoặc có thể là các khối tạo dựng của các đại phân tử (macromolecules). Thí dụ như phân tử nước, đường, acids béo (fatty), amino acids và đơn phân tử (nucleotides). Có 20 loại amino acids khác nhau, là các khối tạo dựng của proteins, mỗi loại được ký hiệu bởi một chữ cái Latin. 9 Proteins Protein là một đại phân tử tạo thành từ một hay nhiều dãy amono acids theo một thứ tự đặc biệt; thứ tự này được xác định bởi dãy cơ sở (bazơ) các nucleotides trong gene mã hóa cho protein. Các proteins cần thiết cho cấu trúc, chức năng và điều chỉnh tế bào, mô và tổ chức, mỗi protein có một vai trò đặc biệt. Vài thí dụ về proteins là: Protein cấu trúc (Structural proteins), có thể coi như các khối tạo dựng cơ sở của sinh vật. Enzymes, thực hiện (xúc tác) một số lớn các phản ứng sinh hóa học (biochemical reactions). Cùng với các phản ứng này và các đường chuyển hóa (pathway) chúng tạo ra sự trao đổi chất (metabolism). Protein màng (transmembrane proteins): chìa khóa của sự duy trì môi trường tế bào (cellular environment), điều hòa dung tích tế bào, etc. Hormones, antibodies, etc. 10 Protein structures Cấu trúc protein Cấu trúc bậc một (primary structure): Các dãy của 20 loại amino acids khác nhau, nối với nhau theo một thứ tự tuyến tính bất kỳ (poly-peptide chains). Độ dài của phân tử protein có thể thay đổi từ vài đến nhiều ngàn amino-acids. Cấu trúc bậc hai (secondary structure): Là sự xoắn gấp (folding) của dãy các amino acids. Có hai loại cấu trúc thường thấy trong các dãy xoắn gấp: alpha-helices (xoắn α) và beta-strands (dải β). Chúng được hợp với nhau một cách đặc trưng bởi các cấu trúc kém thông thường hơn (loops, vòng). 11 Protein structures Cấu trúc protein Cấu trúc bậc ba (tertiary structure): Do xoắn gấp, nhiều phần của dãy phân tử protein có sự tiếp xúc (contact) với nhau, tạo ra nhiều lực hút và lực đẩy giữa chúng, tạo cho phân tử có được một cấu trúc 3D tương đối bền vững và cố định. Cấu trúc bậc bốn (quaternary structure): Một protein có thể được tạo ra từ nhiều hơn một dãy amino-acids, và khi này nó được gọi là có cấu trúc bậc bốn. Thí dụ như haemoglobin được tạo ra từ bốn dãy trong đó mỗi dãy có khả năng bó lại (binding) một phân tử iron. 12 Proteins The images below shows the structure of triosephosphate isomerase visualised by RasMol software package, a 3D viewer for MSD structures Kích thước một protein có thể từ 3 đến 10 nanometers (nm), i.e., 3 đến 10 x tỷ mét (10-9 m), và tìm ra cấu trúc của chúng là bài toán khó và tốn kém (cần khoảng €50,000 - €200,000 để tìm ra một cấu trúc mới). 13 DNA (Deoxyribonucleic acid) DNA là phân tử mang thông tin chủ yếu trong một tế bào. DNA có thể là xoắn đơn (single) hay xoắn kép (double) Phân tử DNA xoắn đơn là một dãy các đơn phân tử (nucleotides), còn gọi là đa đơn phân tử (polynucleotide). Bốn đơn phân tử khác nhau chia thành hai nhóm, gọi là bazơ (bases): nhóm purines gồm adenosine (A) và guanine (G); nhóm pyrimidines gồm cytosine (C) và thymine (T). Các đơn phân tử khác nhau có thể được nối với nhau theo mọi thứ tự dưới dạng đa đơn phân tử, như A-G-T-C-C-A-A-G-C-T-T 14 DNA (Deoxyribonucleic acid) Các cặp đơn phân tử đặc biệt có thể tạo nên các liên kết yếu (weak bonds) giữa chúng: A liên kết với T, C liên kết với G. Các cặp A-T và G-C gọi là các cặp cơ sở (base-pairs, bp) Khi hai dãy đa đơn phân tử liên kết với nhau, chúng thường dính vào nhau, gọi là các DNA xoắn kép (double helix). Hai dải như vậy gọi là liên kết với nhau (complementary), và mỗi dải có thể thu được từ dải kia bằng cách thay tương hỗ A với T, C với G, và đổi hướng của phân tử theo chiều T-T-G-A-C-T-A-T-C-C-A-G-A-T-C ngược lại. A-A-C-T-G-A-T-A-G-G-T-C-T-A-G 15 DNA This structure was first figured out in 1953 in Cambridge by Watson and Crick 16 RNA (ribonucleic acid) RNA được tạo thành từ đơn phân tử như DNA. Tuy nhiên, RNA dùng U (uracil) thay vì T (pyrimidine thymine) là thành phần không có trong DNA (chỉ có dải đơn). RNA có nhiều chức năng trong tế bào, như mRNA và tRNA là các kiếu chức năng khác nhau của RNA, cần thiết trong sự tổng hợp protein. RNA có thể liên kết với một dải đơn của một phân tử DNA, bằng cách thay T bằng U, và các phân tử kiểu này có vai trò quan trọng trong các quá trình sống và công nghệ sinh học. C-G-A-T-T-G-C-A-A-C-G-A-T-G-C DNA | | | | | | | | | | || | | | G-C-U-A-A-C-G-U-U-G-C-U-A-C-G RNA 17 Genes and genomes (Gene và các hệ gene) 1. Chromosomes, genomes and sequencing (Nhiễm sắc thể, hệ gene, và sắp dãy) 2. Genes and protein synthesis (gene và tổng hợp protein) 3. Gene prediction (đoán nhận gene) 4. Genome similarity and SNPs (sự giống nhau giữa các hệ gene và SNP) 18 Chromosomes, genomes and sequencing Nhiễm sắc thể, hệ gene, và sắp dãy Nhiễm sắc thể (chromosome): Một hay một vài phân tử DNA xoắn kép dài có tổ chức. Con người có 24 cặp nhiễm sắc thể. Chromasomal và mitochondrial DNA tạo nên hệ gene (genome) của sinh vật. Mọi sinh vật đều có hệ gene, và người ta tin rằng hệ gene mã hóa hầu hết thông tin di truyền của sinh vật. Mọi tế bào của một sinh vật đều chứa các hệ gene như nhau (identical genomes), với rất ít ngoại lệ, là kết quả cuả sự tái tạo DNA (DNA replication) khi tế bào phân chia. 19 Chromosomes, genomes and sequencing Nhiễm sắc thể, hệ gene, và sắp dãy Xác định dãy bốn chữ cái của một phân tử DNA cho trước gọi là sắp dãy DNA (DNA sequencing). Bộ gene của một vi khuẩn (a bacterium) được sắp dãy toàn bộ năm 1995. Bộ gene của (yeast) gđược sắp dãy năm 1997, giun (worm) năm 1999, ruồi (fly) năm 2000, và cỏ dại (weed) năm 2001. Việc sắp dãy toàn bộ hệ gene con người được hoàn thành năm 2003, được biết như hệ gene người (human genome). Các hệ gene đều chứa gene, và phần lớn chúng mã hóa proteins. 20 Genes và sự tổng hợp protein Genes là các đoạn đặc biệt của DNA có chức năng điều khiển cấu trúc và hoạt động của tế bào; là đơn vị chức năng của sự di truyền. Để hiểu rõ hơn về gene, ta cần mô tả cơ chế tạo ra proteins dựa trên thông tin được mã hóa trong genes. Quá trình này được gọi là sự tổng hợp proteins, và gồm ba giai đoạn chính: 1. Transcription (phiên mã) 2. Splicing (ghép mã) 3. Translation (dịch mã). 21 Tổng hợp protein Một đoạn phân tử DNA được Bỏ đi vài mẩu của pre mRNA, gọi là introns, phần còn sao chép vào mRNA bổ sung lại, gọi là exons, sẽ được nối với nhau. Số lượng và (phiên mã) kích thước các introns và exons khác nhau rất đáng kể các genes cũng như giữa các chủng loại. Sự dịch mã là một quá trình phức tạp và nhiều chi tiết chưa được biết. Tạo proteins bằng cách nối các amino acids theo thứ tự đựợc mã hóa trong mRNA. Thứ tự của amino acids được xác định bởi 3 đơn phân tử kề nhau trong DNA, gọi là bộ ba hoặc mã di truyền (triplet or genetic code). Mỗi bộ ba được gọi là codon và mã cho một amino acid. 22 Bài toán đoán nhận gene Gene prediction problem Gene prediction: Cho một dãy DNA, hãy nói gene ở đâu trong dãy này? Số genes đã được Phần của hệ gene mã hóa Sinh vật đoán nhận proteins (exons) E.Coli (bacteria) 5000 90% Yeast (men) 6000 70% Worm (giun) 18,000 27% Fly (ruồi) 14,000 20% Weed 25,500 20% Human 30,000 < 5% 23 Sự tương tự của hệ gene và SNFs Genome similarity and SNPs Mọi hệ gene của người được xem là tương đương đến 99.9% và trung bình giữa các hệ genes của hai cá thể khác nhau cứ một nghìn đơn phân tử chỉ có một khác nhau. Sự biến dạng trong các phần không mã hóa của hệ gene được phân tích để để tạo ra các dạng (patterns) tin cậy để phân biệt các ca thể. Các biến dạng đặc biệt quan trọng trong hệ gene là đa đẳng đơn phân tử (single nucleotide polymorphisms (SNP), có thể xuất hiện trong các phần được mã hóa hay không mã hóa trong hệ gene. SNPs là các biến dạng dãy DNA xuất hiện khi các cơ sở đơn (A,C,G, or T) được đan xen sao cho các cá thể khác nhau có các chữ cái khác nhau tại các vị trí này. 24 Functional genomics (Gene học chức năng) Gene học chức năng (functional genomics) có thể được định nghĩa nôm na như việc dùng tri thức tiêu biểu về hệ gene để tìm hiểu về genes, về các chức năng sản xuất và sự tương tác của chúng, và quan trọng hơn là vì sao điều này làm cho các sinh vật hoạt động. Gene functions (Chức năng gene) Protein abundance in a cell (Sự dư thừa protein trong tế bào) Gene regulation and networks (Điều khiển gene và mạng gene) 25 Functional genomics Gene học chức năng Dường như có một hệ hạn chế các genes (a limited universe of genes) và proteins tương ứng của chúng. Từ quan điểm chức năng, rất nhiều trong chúng có trong phần lớn hoặc toàn bộ hệ các genes. Sự dư thừa protein (protein abundance) có thể phụ thuộc vào nhiều yếu tố như liệu gene tương ứng có được thể hiện (expressed) (i.e., được sao chép tích cực) hay không, được thể hiện nhanh và mạnh thế nào, được nối ghép, dịch chuyển, và thay đổi nhanh thế nào, etc. Thể hiện gene (gene expression) là quá trình qua đó thông tin mã hóa trong một gene được truyền vào cấu trúc đang có trong tế bào và điều khiển tế bào (hoặc proteins hoặc RNAs). Một câu hỏi quan trọng và lý thú khác trong sinh học là sự thể hiện gene được “bật” và “tắt” thế nào, tức là các genes được điều chỉnh thế nào. 26 Microarrays and gene expression databases Công nghệ microarray sử dụng nguồn tạo bởi các đề tài về hệ gene và các nỗ lực về dãy để trả lời câu hỏi các genes nào được thể hiện trong một kiểu tế bào đặc biệt của một sinh vật, ở một thời điểm đặc biệt, trong những điều kiện đặc biệt. 27 Outline Khái niệm cơ bản của sinh học Sinh tin học là gì? Về một vài bài toán trong sinh tin học Bioinformatics: the machine learning approach, Pierre Baldi, Soren Brunak, MIT Press 2001 Bioinformatics basics: applications in biological sciences and medicine, Hooman H. Rashidi and Lukas K. Buehler, CRC Press, 2002 28 Human Genome Project Dự án về hệ gene người Mục tiêu (15 năm từ 1990) Nhận biết (identify) toàn bộ chừng A New 30,000 genes trong DNA của con người. Disease Xác định (determine) các dãy của 3 tỷ Encyclopedia cặp cơ sở tạo nên DNA của con người. Lưu trữ (store) thông tin này trongcác New Genetic cơ sở dữ liệu. Fingerprint Hoàn thiện (improve) các công cụ phân Genome Health tích dữ liệu. Implication New Chuyển giao (transfer) các công nghệ Diagnostics liên quan đến các doanh nghiệp tư nhân. Đề cập (address) các vấn đề về đạo đức, luật lệ, và xã hội (ELSI) có thể nảy sinh New từ đề tài. Treatments 29 History of the Human Genome Project Lịch sử của dự án hệ gene người 1953 1972 1977 1980 1982 1984 1985 1986 1987 Watson, Berg, Maxam, Botstein, Wada MRC Sinsheimer DOE begins Gilbert announces Crick 1st Gilbert, Davis, proposes to publishes hosts genome plans to start company DNA recombinant Sanger Skolnick build first large meeting to studies with to sequence and structure DNA sequence White automated genome discuss HGP $5.3 million copyright DNA; Burke, DNA propose to sequencing Epstein-Barrat UCSanta Olson, Carle develop map human robots virus (170 Cruz; YACs; Donis-Keller genome with kb) Kary Mullis publish first map (403 RFLPs develops markers) PCR 30 History of the Human Genome Project Lịch sử của dự án hệ gene người (tiếp) 1987 (cont) 1988 1989 1990 1991 1992 1993 1995 1996 Hood NIH Hood, Proposal Venter Simon Collins is Venter Yeast produces supports the Olson, to sequence announces develops named publishes genome is first HGP; Botstein 20 Mb in strategy to BACs; US director first sequenced (S. automated Watson Cantor model sequence and French of sequence of cerevisiae) sequencer; heads the propose organism by ESTs. He teams NCHGR; free-living Dupont project and using 2005; plans to publish first revise organism: devolops allocates STS’s to Lipman, patent physical plan to H. influenzae fluorescent part of the map the Myers partial maps of complete (1.8 Mb); dideoxy- budget to human publish the cDNAs; chromosome seq of Brown nucleotides study social genome BLAST Uberbacher s; first human publishes on and ethical algorithm develops genetic maps genome DNA arrays issues GRAIL, a of mouse and by 2005 gene finding human program genome published 31 History of the Human Genome Project Lịch sử của dự án hệ gene người (tiếp) 1997 1998 1999 2000 2001 2003 Blattner, SNP project NIH Celera and Celera Completely Plunket is initiated; proposes to others publishes sequenced complete E. rice genome sequence publish human human coli project is mouse Drosphila sequence in genome. sequence; a started; genome in 3 sequence Science; the capillary Venter years; first (180 Mb); HGP sequencing creates new sequence of human consortium machine is company chromosome chromosome publishes the introduced. called Celera 22 is 21 is human and proposes announced completely sequence in to sequence sequenced; Nature HG within 3 proposal to years; C. sequence elegans puffer fish; genome Arabadopsis completed sequence is completed http://www.d-trends.com/Bioinformatics/timeline.html 32 What is bioinformatics? Tin sinh học là gì? Bio: Sinh học phân tử (Molecular Biology) Informatics: Khoa học tính toán Bioinformatics: Giải quyết các bài toán sinh học bằng việc sử dụng các phương pháp của khoa học tính toán. Synonyms: Computational biology, Computational molecular biology, Biocomputing 33 Thay đổi trong sinh học Paradigm shift in biology Một kiểu thức mới đang xuất hiện là tất cả các ‘genes’ sẽ sớm được Một kiểu thức mới đang xuất hiện là tất cả các ‘genes’ sẽ sớm được biết hết (theo nghĩa có trong các cơ sở dữ liệu điện tử), và nghĩa là biết hết (theo nghĩa có trong các cơ sở dữ liệu điện tử), và nghĩa là điểm bắt đầu của một khảo sát sinh học sẽ là lý thuyết. Mỗi nhà khoa điểm bắt đầu của một khảo sát sinh học sẽ là lý thuyết. Mỗi nhà khoa học sẽ khởi đầu bằng một ước đoán lý thuyết, rồi mới chuyển qua học sẽ khởi đầu bằng một ước đoán lý thuyết, rồi mới chuyển qua làm thí nghiệm để theo hoặc kiểm tra giả thuyết. làm thí nghiệm để theo hoặc kiểm tra giả thuyết. Để dùng dòng chảy tri thức trên các mạng toàn cầu, các nhà sinh học Để dùng dòng chảy tri thức trên các mạng toàn cầu, các nhà sinh học không những phải biết dùng máy tính, mà còn phải thay đổi cách không những phải biết dùng máy tính, mà còn phải thay đổi cách tiếp cận của mình đối với bài toán hiểu sự sống. tiếp cận của mình đối với bài toán hiểu sự sống. The new paradigm, now emerging, is that all the ‘genes’ will be known (in the sense of being resident in databases available electronically), The new paradigm, now emerging, is that all the ‘genes’ will be known (in the sense of being resident in databases available electronically), and that the starting point of a biological investigation will be theoretical. An individual scientist will begin with a theoretical conjecture, and that the starting point of a biological investigation will be theoretical. An individual scientist will begin with a theoretical conjecture, only then turning to experiment to follow or test that hypothesis. only then turning to experiment to follow or test that hypothesis. To use [the] flood of knowledge, which will pour across the computer networks of the world, biologists not only must become computer To use [the] flood of knowledge, which will pour across the computer networks of the world, biologists not only must become computer literate, but also change their approach to the problem of understanding life. literate, but also change their approach to the problem of understanding life. Walter Gilbert. 1991. Towards aaparadigm shift in biology. Nature, 349:99. Walter Gilbert. 1991. Towards paradigm shift in biology. Nature, 349:99. 34 Base Pairs in GenBank 10,267,507,282 bases in 9,092,760 records. 35 Public databases 36 Mở rộng các khái niệm của Tin sinh học Xác định và đặc trưng chức Gene học (genomics) năng của genes. Gene học chức năng Gene học cấu trúc Nghiên cứu thể hiện gene ở mọi Protein học (Proteomics): mức của protein bởi đồng nhất và Phân tích proteins của một đặt trưng proteins có trong các sinh vật ở nhiều mức (large mẫu sinh học. scale) Dùng thông tin về gene để dự Gene dược học đoán sự an toàn, độc tính và/hoặc (Pharmacogenomics): Phát hiệu quả của thuốc với người triển các thuốc mới nhằm bệnh hoặc nhóm người bệnh. đến các bệnh đặc biệt Một công nghệ mới nhằm đưa toàn Microarray (genome chip): bộ hệ gene trên một chip sao cho DNA chip, protein chip các nghiên cứu viên có một bức tranh tốt hơn về tương tác đồng thời của hàng ngàn genes 37 Problems in Bioinformatics Phân tích cấu trúc So sánh cấu trúc protein Dự đoán cấu trúc protein Mô hình hóa cấu trúc RNA 0 1,000 2,000 3,000 4,000 2.0 Phân tích đường chuyển hóa 1.5 1.0 0.5 -0.0 2.0 Đường trao đổi chất (metabolic pathway) 1.5 1.0 0.5 -0.0 Mạng điều tiết (regulatory networks) 2.0 1.5 1.0 0.5 -0.0 Phân tích dãy 0 1,000 2,000 3,000 4,000 768 TT....TGTGTGCATTTAAGGGTGATAGTGTATTTGCTCTTTAAGAGCTG 813 || || || | | ||| | |||| ||||| ||| ||| 87 TTGACAGGTACCCAACTGTGTGTGCTGATGTA.TTGCTGGCCAAGGACTG 135 . . . . . Sắp dãy (sequence alignment) 814 AGTGTTTGAGCCTCTGTTTGTGTGTAATTGAGTGTGCATGTGTGGGAGTG 863 | | | | |||||| | |||| | || | | 136 AAGGATC.............TCAGTAATTAATCATGCACCTATGTGGCGG 172 . . . . . Dự đoán chức năng và cấu trúc 864 AAATTGTGGAATGTGTATGCTCATAGCACTGAGTGAAAATAAAAGATTGT 913 ||| | ||| || || ||| | ||||||||| || |||||| | 173 AAA.TATGGGATATGCATGTCGA...CACTGAGTG..AAGGCAAGATTAT 216 Tìm gene (Gene finding) Phân tích thể hiện Phân tích thể hiện gene Phân nhóm gene 38

Tải về miễn phí