logo

Chương 5: Tạo dòng genomic DNA của eukaryote và xây dựng thư viện genomic DNA

Thư viện genomic DNA là một tập hợp các đoạn DNA cùng đại diện cho một genome nguyên vẹn (hoặc gần nguyên vẹn) của cá thể mà DNA được bắt nguồn từ đó. Các đoạn này nằm trong các vector tự sao chép cho phép chúng được duy trì và sinh sản cùng với tế bào của cơ thể vi sinh vật, như vi khuẩn Escherichia coli hoặc nấm men Saccharomyces cerevisiae.
Chương 5 Tạo dòng genomic DNA của eukaryote và xây dựng thư viện genomic DNA Thư viện genomic DNA là một tập hợp các đoạn DNA cùng đại diện cho một genome nguyên vẹn (hoặc gần nguyên vẹn) của cá thể mà DNA được bắt nguồn từ đó. Các đoạn này nằm trong các vector tự sao chép cho phép chúng được duy trì và sinh sản cùng với tế bào của cơ thể vi sinh vật, như vi khuẩn Escherichia coli hoặc nấm men Saccharomyces cerevisiae. Những thư viện như thế có thể bảo quản như là một nguồn cố định của các đoạn DNA đại diện cho một cơ thể đặc biệt. Một phòng thí nghiệm này có thể thu thập thư viện genome từ một phòng thí nghiệm khác hoặc từ một nguồn thương mại như là một cách lựa chọn để xây dựng thư viện riêng của mình. Một khi thu được, các thư viện được dùng chủ yếu hoặc để sàng lọc theo các phương pháp khác nhau nhằm phân lập một (các) trình tự nucleotide quan tâm đặc biệt, hoặc để xác định vị trí và thứ tự của các trình tự trong genome mà từ đó thư viện được xây dựng (physical mapping). Xây dựng một thư viện genomic DNA bao gồm bốn giai đoạn chính (Hình 5.1): Cắt DNA, gắn DNA vào vector, đóng gói các dòng tái tổ hợp trong vỏ protein của virus để làm bước trung gian trước khi xâm nhiễm vào tế bào vật chủ, và chuyển cấu trúc đó vào tế bào vật chủ. I. Cắt genomic DNA bằng các enzyme hạn chế Để đưa toàn bộ các gen của genome vào một thư viện, trước hết genome phải được cắt bởi enzyme hạn chế thành các đoạn DNA có kích thước thích hợp tùy thuộc vào loại vector nhận chúng. Genomic DNA thường được cắt bằng enzyme hạn chế có trình tự nhận biết 4 bp, ví dụ như MboI nhận biết trình tự 5’-GATC-3’ . Tuy nhiên, không phải dễ dàng thu được một gen nguyên vẹn nằm trên một đoạn DNA. Trong thực tế, một gen thường bị cắt thành nhiều đoạn DNA do vị trí nhận biết của enzyme nằm ngay trong gen. Hình 5.1. Xây dựng thư viện genomic DNA. Các giai đoạn trong xây dựng thư viện DNA trong vector bacteriophage l . a, b, c và d trình bày sự khác nhau (nhưng chồng lên nhau) của các đoạn DNA trong genome, được hợp nhất trong các vector riêng rẽ và đại diện như là các dòng riêng biệt trong một thư viện. Thông thường, một phản ứng cắt từng phần genomic DNA được tiến hành bằng cách dùng một lượng tối thiểu enzyme và ủ trong một thời gian ngắn sao cho mọi vị trí nhận biết không bị cắt đồng thời . Do các vị trí cắt được phân bố ngẫu nhiên nên một gen vẫn có thể được bảo toàn nguyên vẹn ngay khi nó chứa vị trí nhận biết trong gen. DNA sau đó được phân đoạn và chỉ có các đoạn có kích thước nằm trong phạm vi mong muốn được chọn lọc. Các đoạn DNA được đưa vào vector thích hợp. Tập hợp các vector chứa các đoạn genomic DNA tạo thành thư viện genomic DNA. Mỗi đoạn DNA chứa trong vector của thư viện được gọi là một dòng (clone). Tùy thuộc vào kích thước của các đoạn DNA mà chọn vector là phage (có thể chứa đoạn DNA dài từ 15-23 kb), cosmid (45 kb) hay BAC (>100 kb). Có thể sử dụng DNA tách từ các mô khác nhau để xây dựng thư viện genomic DNA. Các thư viện genomic DNA của một cơ thể chỉ chứa các đoạn DNA dài ngắn khác nhau nhưng thông tin di truyền không thay đổi. Ngược lại, thư viện cDNA được xây dựng từ các mRNA. Trong cơ thể có những gen chỉ hoạt động trong những loại tế bào nhất định, do đó giữa các mô khác nhau có thể thu được các phân tử mRNA khác nhau. Vì vậy, một cơ thể có nhiều thư viện cDNA khác nhau đặc trưng cho từng loại tổ chức chuyên hóa (xem chương 6). II. Tạo dòng các đoạn DNA để xây dựng thư viện genome Các đoạn DNA thu được từ phản ứng cắt hạn chế được gắn đồng hóa trị in vitro vào vector tạo dòng bằng cách dùng enzyme DNA ligase. Trước khi gắn, vector được cắt ra ở một vị trí đơn, thông thường là cùng với enzyme được dùng để cắt DNA nguồn, nhằm tạo các đầu kết dính bổ trợ cho các đầu của các đoạn chèn DNA. Một đôi khi, vector và DNA nguồn được cắt với tổ hợp hai enzyme khác nhau để ngăn cản mỗi loại phân tử tự gắn lại. Sự tự tái tạo lại vòng của vector cũng có thể giảm thiểu bằng cách xử lý với enzyme alkaline phosphatase để loại nhóm 5’ phosphate khỏi các đầu của vector. Một số lượng lớn các vector tạo dòng được phát triển cho việc xây dựng các thư viện DNA, chọn lựa vector nào phụ thuộc vào phạm vi kích thước của các đoạn DNA được tạo dòng, và các ứng dụng tiếp theo. 1. Các plasmid vector Các plasmid là các phân tử DNA mạch vòng đóng cộng hóa trị, siêu xoắn và có kích thước vài kilobase (chương 4). Mặc dù các plasmid xuất hiện tự nhiên, chủ yếu ở vi khuẩn, nhưng những plasmid dùng trong xây dựng các thư viện DNA thường được thiết kế có chủ định với các cấu trúc nhân tạo. Các vector tạo dòng này chứa các vị trí nhận biết đơn cho một enzyme hạn chế mà tại đó các DNA ngoại lai có thể được chèn vào (insertion). Các vị trí cho nhiều enzyme khác nhau có thể được tập hợp lại trong vùng tạo dòng (multiple cloning sites) hoặc vùng đa nối (polylinker). Các plasmid mang bổ sung một hoặc nhiều gen chỉ thị (marker gene), như các gen kháng kháng sinh, cho phép chỉ có các tế bào chứa plasmid sinh trưởng trên môi trường chọn lọc, và các gen cho enzyme như β-galactosidase cho phép các phân tử tái tổ hợp chứa đoạn chèn DNA được phân biệt với các thể không tái tổ hợp. Nhược điểm của các plasmid được dùng làm các vector tạo dòng là khả năng chứa của chúng bị giới hạn chỉ thích hợp với những đoạn DNA ngoại lai có kích thước nhỏ vài kilobase (kb) và hiệu suất biến nạp của chúng vào tế bào vật chủ tương đối thấp. 2. Các bacteriophage λ vector Các bacteriophage là các virus xâm nhiễm vào vi khuẩn. Genome của chúng có thể là DNA sợi đôi mạch vòng hoặc mạch thẳng, và được bọc bằng vỏ protein làm trung gian cho sự xâm nhập của chúng vào tế bào vật chủ. Bacteriophage λ là một trong các vector tạo dòng có nguồn gốc virus thông dụng nhất được dùng trong xây dựng thư viện. Genome của nó bao gồm một phân tử DNA sợi đôi mạch thẳng dài khoảng 50 kb, phân tử này xâm nhiễm vào E. coli và tạo vòng bằng cách ghép các đầu dính (xem chương 4). Trong chu kỳ sinh tan (lytic cycle), các phân tử dạng vòng của λ genome sẽ được sao chép và sau đó được cắt ở vị trí đặc biệt (vị trí cos) để tạo ra các λ monomer sẽ đóng gói trong các đầu protein hoàn chỉnh. Cũng có khi phage λ không đi vào chu kỳ tan, mà chuyển sang giai đoạn tiềm tan (lysogenic), trong suốt giai đoạn này nó hợp nhất ổn định trong nhiễm sắc thể của tế bào vật chủ E. coli . Các gen đòi hỏi cho chức năng sinh tan được tập hợp lại trong đoạn stuffer, và được loại bỏ khi xây dựng các vector tạo dòng có nguồn gốc λ để có thể nhận các đoạn DNA có kích thước lên đến 20 kb. Các vector λ tái tổ hợp bao gồm nhánh trái, nhánh phải và đoạn DNA ngoại lai được gắn vào giữa hai nhánh. Kết quả các thể tái tổ hợp sau đó được đóng gói trong vỏ protein bằng cách dùng hệ thống đóng gói in vitro cho phép xâm nhiễm vào tế bào vật chủ với hiệu suất cao. Đối với genome đặc trưng của động vật có vú dài 3 ´ 109 bp, xấp xỉ khoảng 7 ´ 105 thể tái tổ hợp λ mang các đoạn chèn có kích thước trung bình khoảng 20 kb sẽ đảm bảo xác suất 99% mọi đoạn DNA cần thiết hiện diện trong thư viện. 3. Các cosmid vector Cosmid là plasmid vector mang đầu cos của λ (chương 4). Vì thế, các cosmid có thể được đóng gói trong các tiểu thể λ với hiệu suất cao. Sau khi xâm nhiễm vào tế bào vật chủ, DNA tái tổ hợp mạch thẳng tạo vòng ở đầu cos và tiếp đó được nhân lên như là một plasmid lớn. Giống như plasmid, cosmid tương đối dễ thao tác, nhưng có thể nhận các đoạn chèn genomic DNA có kích thước khoảng 40-45 kb, lớn hơn khả năng của phage λ. 4. Các BAC vector Các BAC vector hiện nay được xem như công cụ hữu hiệu nhất trong việc xây dựng các thư viện genome, do chúng có các ưu điểm sau: - Có khả năng gắn các đại phân tử DNA 100-300 kb. - Ít hình thành thể khảm (chimera). - Có hiệu quả cao trong tạo dòng và thu hồi DNA. - Duy trì sự ổn định của các DNA được gắn vào vector. Nhờ những ưu điểm trên nên hệ thống BAC thường được dùng để xây dựng bản đồ vật lý. DNA có thể dễ dàng được phân lập trong các dòng BAC, các dòng phân lập được từ lai khuẩn lạc sẽ được kiểm tra bằng kỹ thuật DNA fingerprinting thông qua phản ứng cắt của enzyme hạn chế HindIII. Kỹ thuật fingerprinting cung cấp cho chúng ta thông tin về những phần trùng lặp (overlapping) và không trùng lặp của BAC. Nhờ vậy, có thể hoàn thiện bản đồ vật lý có chất lượng cao, phục vụ cho việc phân tích genome và chuyển nạp gen sau này. 5. Các YAC vector Các YAC là các nhiễm sắc thể nhân tạo của nấm men và cũng là các vector tạo dòng được sử dụng trong phân tích genome. Chúng mang các đoạn telomere (phần cuối) và centromere (phần tâm) của một nhiễm sắc thể trong nấm men. Cả hai nhân tố này cần thiết cho sự tái bản của nhiễm sắc thể trong các tế bào nấm men: nếu không có telomere, thì sau đó các đầu của nhiễm sắc thể có khả năng bị rời ra hoặc gắn vào các nhiễm sắc thể khác. Nếu không có centromere, thì sau đó các nhiễm sắc thể mới được tạo thành sẽ không được đẩy vào trong các tế bào mới của quá trình phân chia tế bào. Ngoài ra, còn phải có một gốc tái bản để sao chép DNA. Các nhân tố này được đặt trong một đoạn DNA đơn, được dùng như một vector để tạo dòng DNA ngoại lai ở trong nấm men. Ưu điểm của YAC là có thể nhận các đoạn DNA có kích thước lớn. Như vậy, trong khi tạo dòng vi khuẩn theo phương pháp truyền thống bằng cách dùng bacteriophage hoặc các plasmid thường bị giới hạn bởi kích thước của các đoạn DNA được tạo dòng (chỉ vài chục kilobase), thì các YAC có thể tạo dòng các đoạn DNA dài hàng ngàn kilobase. Điều này giúp cho việc lập bản đồ genome hoàn chỉnh dễ dàng hơn nhiều. Nhược điểm của các YAC đó là kỹ thuật thao tác còn nhiều khó khăn, và một vấn đề chung là DNA từ hai vùng khác nhau của genome gốc có thể kết thúc trong một YAC, dẫn đến xuất hiện sự liên kết sai mà kết quả là tạo ra một dòng khảm. III. Đóng gói in vitro DNA tái tổ hợp và xâm nhiễm vào tế bào vật chủ Trường hợp sử dụng vector mang gen ngoại lai là bacteriophage λ hoặc cosmid để xây dựng thư viện genome, thì thể tái tổ hợp trần (naked recombinant) của các loại vector này không thể chuyển vào trong vi khuẩn được. Do đó, người ta cần phải đóng gói in vitro DNA của chúng trong một đầu rỗng của phage λ , rồi sau đó mới cho chúng xâm nhiễm vào các tế bào vi khuẩn. Nguyên lý của sự đóng gói in vitro (in vitro packaging) là nhờ vào khả năng mang các đầu cos của phage λ ở hai đầu 5’ và 3’ của các vector tái tổ hợp để đóng gói chúng khi có mặt các đầu rỗng của phage và các protein đóng gói. Phương thức này đòi hỏi các phân tử vector tái tổ hợp phải có chiều dài ít nhất là 38 kb và không được lớn hơn 52 kb. Các đầu phage được đóng gói sẽ hoàn thiện trong các tiểu thể phage xâm nhiễm in vitro khi có mặt các sản phẩm của các gen W và FII, và các đuôi của phage. Tất cả protein cần thiết cho đóng gói có thể thu được từ các chủng E. coli BHB2688 và BHB2690. Các hỗn hợp đóng gói chỉ cần chuẩn bị một lần và có thể bảo quản ở -80oC. Tùy thuộc vào loại vector mà có thể dùng một lượng thích hợp chủng E. coli cho việc xâm nhiễm. Các chủng này được cho “đói” (starve) trước khi sử dụng, hoặc bằng cách sinh trưởng trên môi trường tối thiểu và sau đó xử lý với dung dịch CaCl2 0,1 M, hoặc bằng cách rửa trong dung dịch CaCl2 0,1 M sau khi nhân lên trong môi trường LB1. Phương thức xử lý này cảm ứng sự tổng hợp các λ receptor (protein lamB) trên bề mặt tế bào và tăng đáng kể sự hấp thụ phage vào các tế bào E. coli. Các tiểu thể phage xâm nhiễm, thu được khi có mặt các protein phage và các hợp phần của đuôi phage, sẽ được dùng để xâm nhiễm các vi khuẩn mẫn cảm (susceptible bacteria). Các dòng tái tổ hợp được chọn lọc trên cơ sở tính kháng kháng sinh của chúng và sau đó có thể được khuếch đại tiếp. Sự xâm nhiễm được thực hiện bằng cách ủ hỗn hợp các tiểu thể phage xâm nhiễm thu được sau khi đóng gói in vitro các phân tử DNA tái tổ hợp với các tế bào mẫn cảm (sensitive cell) của vi khuẩn được tiền xử lý. Tiếp theo bước này là khuếch đại thư viện sau khi đã chuẩn độ (titration) các thể tái tổ hợp. Thư viện gen sau khi được xây dựng có thể bảo quản trong một vài năm dưới dạng dịch huyền phù ở 4 C, hoặc lâu hơn trong dung dịch stock có bổ sung glycerol (khoảng 30%) ở -80oC. o IV. Phân tích genomic DNA bằng lai Southern Việc phát hiện và xác định các chuỗi nucleic acid đặc trưng là công việc thường xuyên trong nghiên cứu sinh học phân tử. Nguyên tắc của kỹ thuật này là dựa vào sự lai phân tử (molecular hybridization), dưới các điều kiện thích hợp hai chuỗi nucleic acid đơn tạo thành một phân tử lai. Phản ứng lai phụ thuộc rất nhiều vào mức độ tương đồng của hai trình tự nucleotide. Việc tạo thành phân tử sợi đôi như thế xảy ra chủ yếu thông qua liên kết hydrogen giữa các base G với C, và A với T. Thành phần và sự phân bố của các base không giống rõ rệt với các phân tử nucleic acid cho kết quả các tính chất lai khác nhau, vì thế liên kết hydrogen (hoặc lai phân tử giữa các base tương đồng) khi được ghép cặp thích hợp đã cung cấp một công cụ có giá trị để xác định các chuỗi liên quan hoặc đồng nhất với chuỗi nucleic acid quan tâm (mẫu dò). Trong số các kỹ thuật khác nhau sử dụng lai phân tử để phân tích nucleic acid, thì kỹ thuật được sử dụng phổ biến nhất là lai mẫu dò nucleic acid được đánh dấu với nucleic acid đích được cố định trên một vật đỡ rắn, thường là màng nitrocellulose hoặc nylon. Trình tự của kỹ thuật lai Southern blot bao gồm các bước sau: (1) phân tách các đoạn cắt hạn chế của genomic DNA bằng điện di agarose gel, (2) chuyển DNA từ agarose gel lên màng lai, (3) lai các mẫu dò được đánh dấu đồng vị phóng xạ 32P với các nucleic acid được cố định trên màng lai (Hình 5.2). 1. Phân tách các đoạn cắt hạn chế của genomic DNA bằng điện di agarose gel DNA mang chuỗi đích (chẳng hạn genomic DNA) được cắt bằng một hoặc một vài enzyme hạn chế sẽ cho một tập hợp các đoạn có các chiều dài khác nhau được phân đoạn theo kích thước bằng điện di trên agarose gel. Ở trường hợp genomic DNA hình ảnh điện di sẽ cho một vệt dài (smear) trên gel (Hình 5.3). Lượng DNA dùng cho phản ứng cắt hạn chế tùy thuộc vào mức độ phong phú của chuỗi đích (target) có trong mẫu. Trường hợp genomic DNA, ta cần thủy phân một lượng tương đối lớn DNA (2-10 m g). Nhưng nếu mẫu DNA được tạo dòng trong các plasmid hoặc phage thì chỉ cần một lượng DNA ít hơn nhiều (một vài picogram) là đủ. Ảnh gel nhuộm EtBr được xếp thẳng hàng với thước huỳnh quang trước khi thẩm tích là bước quan trọng để đánh giá các kích thước của các băng DNA được lai với chỉ thị kích thước chuẩn của DNA (DNA size-marker). DNA của bacteriophage l được phân cắt bằng HindIII hoặc 1-kb ladder DNA là các chỉ thị kích thước chuẩn của DNA thông dụng nhất cho Southern blot. Hình 5.2. Sơ đồ của kỹ thuật lai Southern blot. Các mẫu DNA đích và genomic DNA trong ví dụ này được cắt bằng EcoRI và được phân đoạn bằng điện di trên agarose gel. Các vị trí cắt hạn chế liên quan và trình tự bổ sung với mẫu dò (đoạn dày) cũng đã được trình bày (A và B). DNA của plasmid mang đoạn chèn DNA dùng làm mẫu dò (C) được cắt và điện di để làm đối chứng dương tính. Sau khi biến tính và trung hòa, DNA sợi đơn được chuyển lên màng lai, bằng phương thức thẩm tích mao dẫn (capillary) hoặc bằng phương thức thẩm tích nửa khô (semi-dry) nhờ dòng điện, và được cố định. Để chuẩn bị mẫu dò, đoạn chèn DNA (đoạn dày đậm trong C) được tinh sạch từ vector bằng cách cắt và thu hồi sau khi điện di trên agarose gel, đánh dấu bằng 32P và gây biến tính. Tiếp theo, màng lai đã liên kết DNA được lai với mẫu dò, tín hiệu không đặc trưng bị loại bỏ, ủ màng lai với phim X-quang. Sau khi rửa phim, các đoạn DNA bổ sung với mẫu dò được phát hiện như là các băng phóng xạ tự ghi. Trên hình này, nguyên lý cơ bản của đa hình chiều dài các đoạn cắt hạn chế đã được mô tả. Các DNA được tách chiết từ hai mẫu riêng biệt (A và B), trong đó mẫu B có thêm một vị trí EcoRI ở chuỗi đích. Sự khác nhau như thế trong genome sẽ được phát hiện bởi các kiểu lai khác nhau. Nguyên tắc này được khai thác trong nhiều ứng dụng của sinh học phân tử. Hình 5.3. Hình ảnh điện di của genomic DNA sau khi được phân cắt bằng enzyme hạn chế. SM: Chỉ thị kích thước chuẩn của DNA. PC: đối chứng dương tính (đoạn DNA được dùng để đánh dấu 32P làm mẫu dò). Các đường 1, 2, 3, 4, 5 và 6: các mẫu genomic DNA được cắt bằng enzyme hạn chế. 2. Chuyển DNA từ agarose gel lên màng lai Sau khi điện di gel và trước khi thẩm tích, DNA sẽ được khử purin (depurination) bằng dung dịch HCl loãng để cắt nhỏ DNA tạo điều kiện dễ dàng để chuyển các đoạn DNA có kích thước lớn lên màng. Nhìn chung, bước này khó kiểm soát và có thể làm mất các đoạn DNA nhỏ hơn. Vì thế, nếu có cách khắc phục việc đánh giá hình ảnh phóng xạ tự ghi thì có thể bỏ qua bước này. Tuy nhiên, khử purin vẫn cần thiết khi phân tích Southern các đoạn DNA có kích thước rất lớn. Các loại màng lai được sử dụng trong Southern là màng nitrocellulose hoặc màng nylon. Tuy nhiên màng nylon có sức chịu đựng cao hơn màng nitrocellulose vì thế có thể tái sử dụng một vài lần nên chúng được sử dụng phổ biến hơn. Hơn nữa, màng nylon có thể gắn các đoạn DNA ngắn ( Hình 5.5. Sơ đồ thẩm tích mao dẫn chuyển DNA từ agarose gel lên màng lai 3. Lai các mẫu dò được đánh dấu đồng vị phóng xạ với các nucleic acid được cố định trên màng lai Các điều kiện tiền lai và lai được thiết kế để tăng tối đa phản ứng lai đặc hiệu của mẫu dò với các chuỗi đích và giảm thiểu các liên kết không đặc hiệu với màng và DNA không phải chuỗi đích. Nói chung, các đệm lai cần có cường lực ion cao (nhân tố quan trọng đối với khả năng ổn định lai). Một vài loại tác nhân ngăn chận có thể được dùng để ức chế các liên kết không đặc hiệu, bằng cách đó đã hạn chế tín hiệu nền. Dung dịch Denhardt và sữa khô không có chất béo (nonfat dried milk) được sử dụng phổ biến để ngăn cản (blocking) liên kết giữa mẫu dò với màng lai, chất tẩy SDS cũng được dùng trong trường hợp này. Salmon sperm DNA (DNA tinh trùng cá hồi) và calf thymus DNA (DNA tuyến ức của bê) được dùng để ngăn cản các tương tác không đặc hiệu giữa các DNA không phải chuỗi đích gắn trên màng lai với mẫu dò. Trong giới hạn thực hành chỉ có những nhân tố ảnh hưởng đến sự ổn định nhiệt của các phân tử nucleic acid lai mới thể hiện vai trò quyết định trong hầu hết thí nghiệm lai trên màng. Nhiệt độ nóng chảy (Tm) của nucleic acid sợi đôi cho biết nhiệt độ mà ở đó DNA sợi đôi bị biến tính 50% dưới các điều kiện đã cho, và nó là kết quả của việc đo trực tiếp khả năng ổn định của việc lai nucleic acid. Nhiệt độ nóng chảy của DNA sợi đôi có thể được đánh giá thông qua biểu thức 1: Trong khi biểu thức 2 có thể được dùng cho thể lai RNA-DNA: Trong đó M là nồng độ phân tử của các cation hóa trị 1 (đặc trưng là Na+) (%G + C) là nồng độ phần trăm của guanine và cytosine (%f) là phần trăm của formamide n là chiều dài của thể lai (theo base). Cường lực dùng trong các thí nghiệm lai là số nghịch đảo của giá trị chuẩn C (criterion value) được đưa ra bởi biểu thức 3: Trong đó Ti là nhiệt độ thí nghiệm, khi Ti thấp thì C cao và lúc đó cường lực sẽ thấp, và ngược lại. Các chuỗi DNA đích có độ tương đồng giống y hệt hoặc gần giống với mẫu dò có thể được xác định dưới các điều kiện cường lực cao (ví dụ: 5oCmỏng trên đĩa agar chứa môi trường sinh trưởng và nuôi dưới những điều kiện thích hợp. Trong khi đó, các vector có nguồn gốc virus (bacteriophage) sẽ sinh tan tế bào bị chúng xâm nhiễm và sản xuất ra các plaque (vết tan) có dạng hình tròn chu vi khoảng 2-3 mm có màu sáng trên thảm vi khuẩn (bacterial lawn) của đĩa agar (Hình 5.7). Hình 5.7. Các vết tan của phage l trên thảm vi khuẩn E. coli. Các phage l được trộn với các tế bào E. coli trong môi trường nuôi rồi dàn mỏng (plating) lên đĩa petri chứa bottom agar (nuôi cấy top agar). Sau khi ủ qua đêm ở 37oC, các tế bào vi khuẩn mọc tạo nên thảm vi khuẩn, ở trên đó các vùng bị nhiễm phage l hình thành nên các vết trong, do hiện tương sinh tan vi khuẩn của phage, gọi là vết tan. Các vector, như mô tả ở trên, thường chứa các gen chỉ thị cho phép chọn lọc những tế bào vật chủ mang vector (thể biến nạp). Thông thường các chỉ thị này là gen kháng kháng sinh và các tế bào biến nạp sinh trưởng trên môi trường chứa kháng sinh tương ứng. Ngoài ra, các vector còn chứa các gen bổ sung để phân biệt các tế bào biến nạp chứa đoạn chèn của DNA ngoại lai với các tế bào chứa các vector tự tái tạo lại vòng. Ví dụ: vector mã hóa gen β-galactosidase xúc tác sản sinh ra các sản phẩm màu xanh từ cơ chất không màu X-gal cho kết quả sinh trưởng của các khuẩn lạc màu xanh. Đoạn chèn của DNA ngoại lai đã làm mất hoạt tính của gen cho kết quả sản xuất ra các khuẩn lạc màu trắng. Một dòng chứa các chuỗi DNA quan tâm đặc biệt có thể được xác định bởi lai khuẩn lạc. Một lượng nhỏ khuẩn lạc biến nạp hoặc vết tan được chuyển lên màng nitrocellulose hoặc nylon đã được phủ lên (overlay) trên đĩa agar trước đó. DNA được biến tính và cố định trên màng bằng cách đun nóng (baking) hoặc chiếu tia cực tím (UV-crosslinking), và sau đó được lai trong đệm chứa mẫu dò được đánh dấu đồng vị phóng xạ có trình tự bổ sung một phần của chuỗi được xác định. Ví dụ: Có thể một oligonucleotide tổng hợp nhân tạo, có nguồn gốc từ genomic DNA từng phần, cDNA hoặc chuỗi protein hoặc sản phẩm PCR. Một vài trường hợp mẫu dò có thể được thiết kế dựa trên trình tự bắt nguồn từ gen tương đồng của các loài khác và thường được lai với cường lực thấp. Các mẫu dò thừa được rửa khỏi màng để ủ với phim X-quang. Theo hướng của phim (sau khi rửa) với sự đối chiếu đĩa agar gốc, sau đó sẽ có khả năng gắn kết các khuẩn lạc thực tế với các khuẩn lạc lai dương tính tương ứng trên phim X-quang (Hình 5.8). Hình 5.8. Sàng lọc (screening) thư viện gen trong khuẩn lạc vi khuẩn hoặc vết tan của bacteriophage l Gần đây, một phương pháp sàng lọc khác đã được thiết kế. Theo hướng này các khuẩn lạc vi khuẩn hoặc nấm men được nhặt riêng rẽ và chấm ngay ngắn thành hàng lên màng hoặc trong giếng của đĩa microtiter. Mỗi dòng có thể được xác định bằng tọa độ đường kẻ riêng rẽ của nó. So với các phương pháp truyền thống, phương pháp mới này dễ dàng hơn trong việc tự động hóa, sắp xếp các thư viện và đối chiếu số liệu giữa các phòng thí nghiệm khác nhau. Nếu dòng mong muốn biểu hiện một protein đặc biệt hoặc một đoạn protein, thì sau đó bằng cách xây dựng thư viện với một vector biểu hiện chứa các tín hiệu phiên mã và dịch mã người ta có thể sàng lọc trực tiếp đối với protein được biểu hiện. Ví dụ: nếu protein tương ứng đầy đủ là thích hợp, thì kháng thể đặc hiệu có thể được tạo ra, được đánh dấu và sử dụng để phát hiện yếu tố quyết định kháng nguyên trên protein được biểu hiện từ các khuẩn lạc được dung ly. Nếu đoạn chèn được yêu cầu mã hóa một hoạt tính sinh học, thì sau đó việc sàng lọc có thể được thực hiện bằng các thử nghiệm cho hoạt tính đó, hoặc bằng cách chọn lọc trực tiếp, ví dụ: chọn lọc trên môi trường sinh trưởng không hoàn chỉnh đối với enzyme sinh tổng hợp cần thiết cho sự sinh trưởng. Tuy nhiên, các hướng dựa trên sự biểu hiện nói chung dễ ứng dụng cho thư viện cDNA hơn là thư viện genomic DNA. VI. Các phương pháp đánh dấu đoạn DNA bằng phóng xạ Mục đích của bước này là sản xuất các đoạn DNA có độ phóng xạ và hoạt tính đặc hiệu cao để làm mẫu dò dùng trong các thí nghiệm lai phân tử. Trong trường hợp này dấu phóng xạ thường được sử dụng là 32P phát xạ b năng lượng cao. Dưới đây là một số phương pháp đánh dấu phổ biến được trong kỹ thuật gen. 1. Đánh dấu ở đuôi Enzyme polynucleotide kinase xúc tác để chuyển nhóm phosphate nằm cuối ATP sang gốc 5’-OH của các phân tử nucleic acid đã được dephosphoryl hóa. Nếu như ATP được đánh dấu phóng xạ, thì nó sẽ tạo ra nucleic acid được đánh dấu phóng xạ. Tuy nhiên, hoạt tính đặc hiệu của chúng tương đối thấp, do chỉ có phần đuôi của mỗi phân tử DNA được đánh dấu (Hình 5.9). Hình 5.9. Đánh dấu ở đuôi của đoạn DNA nhờ enzyme polynucleotide kinase (PNK). (a) DNA được dephosphoryl hóa bằng enzyme phosphatase để tạo ra các nhóm 5’-OH. (b) Tiếp đó, đuôi phosphate của [ g -32P]ATP (vòng tròn đậm trên hình) được chuyển sang gốc 5’-OH nhờ PNK. Đây là phản ứng trao đổi các nhóm 5’-PO4. 2. Đánh dấu bằng dịch chuyển điểm đứt Phương pháp này dựa vào enzyme DNA polymerase I của E. coli có khả năng dịch chuyển điểm đứt của DNA (xem chương 1). Các điểm đứt có thể xuất hiện tự nhiên và cũng có thể do tác dụng của enzyme DNase I2 ở nồng độ thấp trong hỗn hợp phản ứng. Enzyme DNA polymerase I xúc tác phản ứng thay thế sợi bằng cách xen các dNTP mới vào chuỗi DNA. Nếu một trong các dNTP đã đánh dấu phóng xạ (ví dụ: [ a -32P]dCTP) , thì kết quả là phân tử DNA sẽ được đánh dấu với hoạt tính đặc hiệu cao (Hình 5.10). 3. Đánh dấu bằng kéo dài đoạn mồi Đoạn DNA cần đánh dấu được biến tính bằng nhiệt, sau đó các đoạn mồi oligonucleotide (thường là các phân tử hexadeoxyribonucleotide) được gắn vào các DNA sợi đơn. Sử dụng enzyme DNA polymerase I có thể tổng hợp nên bản sao mới của sợi khuôn mẫu. Nếu như một dNTP đã đánh dấu phóng xạ (ví dụ: [ a -32P]dCTP) được gắn vào, thì bản sao DNA mang hoạt họat tính đặc hiệu rất cao sẽ được tạo ra (Hình 5.11). Cũng có thể dùng kỹ thuật PCR để đánh dấu phóng xạ đoạn DNA trong trường hợp muốn tạo ra một số lượng lớn mẫu dò. Lúc này, enzyme DNA polymerase I sẽ được thay bằng DNA Taq polymerase. Hình 5.10. Đánh dấu DNA bằng dịch chuyển điểm đứt. (a) Dùng DNase I tạo ra một điểm đứt trên sợi đơn của chuỗi DNA sợi đôi. (b) Tiếp đó enzyme DNA polymerase I tổng hợp một bản sao mới của sợi khuôn mẫu khi phân hủy sợi có điểm đứt nhờ hoạt tính exonuclease 5’ - 3’ của nó. Nếu [ a -32P]dCTP được cung cấp thì nó sẽ gắn vào bản sao mới (các hình tròn bôi đen). Trong phản ứng đánh dấu phóng xạ, thông thường cần tách DNA đã được đánh dấu khỏi các nucleotide không được đánh dấu còn thừa trong hỗn hợp phản ứng. Hoạt tính phóng xạ của mẫu dò cần được đánh giá bằng phương pháp đếm nhấp nháy lỏng (liquid scintillation). Các số liệu sau đó được dùng để tính toán lượng mẫu dò cần thiết cho các phản ứng lai phân tử (ví dụ: Southern blot, Northern blot, screening…). Hình 5.11. Đánh dấu DNA bằng cách kéo dài đoạn mồi. (a) DNA được biến tính để tạo ra các phân tử sợi đơn. (b) Một đoạn mồi oligonucleotide được bổ sung để gắn với sợi DNA khuôn mẫu. (c) Enzyme DNA polymerase I xúc tác tổng hợp một bản sao mới của sợi khuôn mẫu bằng cách kéo dài đoạn mồi, trong quá trình đó các [ a -32P]dCTP (các vòng bôi đen) sẽ được đính vào bản sao ở các vị trí có G. VII. Ứng dụng của thư viện genomic DNA Thư viện genomic DNA có các ứng dụng trong phạm vi rộng để lập bản đồ vật lý của DNA và xác định các gen gây bệnh hoặc các chuỗi DNA quan tâm cho những phân tích xa hơn nữa. Sản xuất ra các dòng mang các đoạn chèn DNA khác nhau nhưng gối chồng lên nhau có nhiều thuận lợi và thư viện có thể được sử dụng trong quá trình chromosome walking. Phương thức này cho phép xúc tiến từ điểm khởi đầu trên nhiễm sắc thể (ví dụ: gen chỉ thị liên kết với bệnh) tới locus không xác định ở gần đó (ví dụ: gen gây ra chính bệnh đó) bằng cách tiến hành các chu kỳ lặp lại của tạo dòng, mô tả đặc điểm và lai phân tử bằng cách dùng các dòng như là mẫu dò để xác định các dòng xa hơn với thư viện mang chuỗi gần kề từ DNA gốc. Chromosome walking thường được thực hiện với thư viện của cosmid, l hoặc YAC. Chromosome walking cũng cho phép xây dựng một cấu trúc “clone contig” (một chuỗi tuần tự các dòng DNA gối chồng lên nhau cùng với sự hiện diện của vùng liền kề của genomic DNA). Cấu trúc clone contig thường tạo thành một phần cần thiết của việc phân tích các chuỗi DNA được tạo ra trong suốt quá trình xây dựng bản đồ vật lý của DNA và xác định các gen gây bệnh bằng tạo dòng vị trí (positional cloning). Cấu trúc clone contig được xây dựng bằng các vector khác nhau, bao gồm l , BAC, YAC… Xác định gen gây xơ nang đã minh họa cho việc sử dụng thư viện genomic DNA để xác định bằng cách tạo dòng vị trí. Các thư viện genomic DNA cũng hữu ích trong việc xác định các gen gây bệnh bằng cách tạo dòng chức năng (functional cloning). Theo hướng này, thông tin về chức năng của gen được khai thác để phân lập gen mong muốn từ thư viện. Một oligonucleotide có trình tự dựa trên chuỗi amino acid từng phần được dùng như là một mẫu dò để phân lập dòng cDNA bằng cách sàng lọc thư viện cDNA. Dòng cDNA này sau đó có thể được dùng trong sàng lọc thư viện genome để phân lập các dòng genomic DNA và cho phép quan sát đặc điểm của chuỗi genome hoàn chỉnh. Hướng này được dùng để xác định gen hemophilia A (nhân tố VIII). Các mẫu dò oligonucleotide dựa trên chuỗi amino acid của protein nhân tố VIII của lợn được sử dụng trước để phân lập dòng từ genome (nhân tố VIII của lợn), sau đó nó được dùng như là một mẫu dò cho thư viện DNA người để xác định gen ở người. VII. Phân tích trình tự của đoạn DNA được tạo dòng Từ cuối những năm 1970, trình tự các nucleotide trên phân tử DNA được xác định một cách đơn giản và nhanh chóng nhờ sự ra đời của hai phương pháp khác nhau: phương pháp hóa học và phương pháp enzyme. Tuy nhiên, từ những năm cuối của thế kỷ 20, trình tự nucleotide được xác định trên máy đọc tự động nhờ trợ giúp của computer ngày càng phổ biến. Ưu điểm của phương pháp này là giảm các thao tác, tiết kiệm hóa chất và trình tự đọc được dài hơn hẳn so với các phương pháp trước đó. 1. Phương pháp hóa học Maxam-Gilbert Đầu tiên phân tử DNA sợi đôi được đánh dấu 32P tại đầu 5’. Sau đó, hai sợi đơn tách rời nhau do biến tính nhiệt. Chúng được xử lý với các chất hóa học sao cho chỉ một loại nucleotide bị phá hủy. Trên hình 5.12 đó là nucleotide A. Nồng độ các chất hóa học được kiểm tra chặt chẽ sao cho chỉ một nucleotide bị phá hủy trên mỗi sợi đơn DNA. Kết quả hàng loạt các đoạn DNA có kích thước khác nhau được tạo thành. Các đoạn DNA tạo ra do bị bẻ gãy được phân ly trên polyacrylamide gel và chỉ có đoạn nào bị gắn 32 P ở đầu 5’ mới quan sát được. Kích thước của chúng tương ứng với khoảng cách từ đầu 5’ có đánh dấu đến vị trí của các nucleotide bị bẻ gãy trên phân tử DNA. Sử dụng các chất hóa học khác nhau phá hủy bốn loại nucleotide bằng bốn phản ứng riêng biệt. Sản phẩm thu được của bốn phản ứng này được phân ly trên cùng một gel. Đoạn DNA ngắn nhất có đánh dấu phóng xạ chạy nhanh nhất dưới tác dụng của điện trường. Căn cứ vào vị trí các vạch trên gel mà xác định trình tự các nucleotide (Hình 5.12). Hình 5.12. Xác định trình tự nucleotide bằng phương pháp hóa học. A: tiến hành bốn phản ứng độc lập, sử dụng bốn loại hóa chất khác nhau, mỗi hóa chất chỉ phá hủy một loại nucleotide nhất định (trong hình vẽ đó là A). B: Sản phẩm của bốn phản ứng được chạy điện di đồng thời trên polyacrylamide gel. Trình từ nucleotide đọc từ dưới lên theo chiều 5’ - 3’. 2. Phương pháp enzyme Sanger Đây là phương pháp tạo đầu tận cùng của chuỗi (chain terminator method). Nguyên lý của phản ứng này là sử dụng dideoxynucleotide không có nhóm OH ở vị trí 3’ trong phản ứng tổng hợp DNA. Do đó, khi DNA polymerase gắn chúng vào sợi DNA thì quá trình tổng hợp bị ngừng lại. Vì vậy, phương pháp này còn gọi là phương pháp dideoxy (dideoxy method). Đầu tiên sợi đôi DNA (sợi khuôn cần đọc trình tự) bị biến tính tách thành hai sợi đơn và được lai với primer. Primer là một sợi đơn gồm vài chục nucleotide có thể liên kết với một trong hai sợi đơn DNA theo nguyên tắc tạo cặp bổ sung. Sau đó, bốn phản ứng riêng rẽ được tiến hành đồng thời. Mỗi phản ứng là hỗn hợp của DNA khuôn mẫu, primer, DNA polymerase, một loại dideoxynucleotide và bốn loại deoxynucleotide theo tỷ lệ 1:100. Các sợi đơn DNA được tổng hợp có độ dài khác nhau do dideoxynucleotide gắn ngẫu nhiên làm dừng phản ứng. Sản phẩm của bốn phản ứng cùng được phân ly trên polyacrylamide gel cho phép phân biệt hai sợi đơn DNA hơn kém nhau một nucleotide. Các vạch DNA quan sát được nhờ có gắn phóng xạ 32P vào mồi hoặc vào một trong bốn loại loại nucleotide bình thường (Hình 5.13). 3. Xác định trình tự nucleotide trên máy tự động Trong những năm gần đây, một số phương pháp xác định trình tự mới đã xuất hiện. Bên cạnh kỹ thuật thông thường sử dụng các gel để phân ly các phân tử DNA có độ dài khác nhau, các kỹ thuật mới liên quan đến phát hiện huỳnh quang của các nucleotide được đánh dấu, phân tích trình tự DNA bằng khối phổ, điện di mao quản hoặc lai với các đoạn oligonucleotide được tổng hợp nhân tạo. Những tiến bộ nhanh chóng trong lĩnh vực kính hiển vi điện tử cho phép quan sát chi tiết cấu trúc bề mặt của phân tử nucleic acid và phân biệt từng nucleotide. Ngoài ra, kỹ thuật lai sử dụng tấm chip gắn cố định các oligonucleotide cho phép phân biệt được hơn 50.000 phân tử DNA khác nhau. Trong tương lai gần, kỹ thuật lai này có thể gắn hàng nghìn oligo trên một tấm chip nhỏ và trình tự nucleotide được phân tích tự động bằng các chương trình của computer. Điều đó cho phép xác định trình tự một cách nhanh chóng. Hình 5.13. Xác định trình tự nucleotide bằng phương pháp enzyme (Sanger). Dideoxyribonucleotide triphosphate (ddNTP) gắn vào sợi DNA đang tổng hợp sẽ làm ngừng phản ứng. Nhờ đó thu được các đoạn DNA hơn kém nhau chỉ một nucleotide. Các đoạn này được quan sát trên polyacrylamide gel khi primer được đánh dấu phóng xạ 32P hoặc đánh dấu huỳnh quang. Phương pháp tạo đầu tận cùng của chuỗi được cải tiến cho phép xác định trình tự trên máy đọc tự động (automatic sequencer), sử dụng các bộ Kit khác nhau, trong đó đầu tận cùng được đánh dấu bằng các chất phát huỳnh quang màu (dye terminator). Phản ứng gắn các nucleotide đánh dấu vào sợi DNA tổng hợp trên khuôn mẫu được tiến hành trong máy PCR. Vì vậy, kỹ thuật này còn được gọi là phản ứng chuỗi đọc trình tự. Sau đó, sản phẩm PCR được điện di trên polyacrylamide gel có độ phân giải cao, cho phép phân biệt được các sợi đơn DNA hơn kém nhau một nucleotide. Quá trình chạy điện di được thực hiện trên máy tự động và kết quả được phân tích bằng các chương trình computer chuyên dụng (Hình 5.14). Trên các máy đọc tự động hiện đại, thông thường bốn loại nucleotide được đánh dấu bằng các chất phát huỳnh quang khác nhau. Đầu đọc laser trong máy sẽ kích hoạt các chất này khiến chúng hấp thụ và phát ra các màu, mỗi màu ứng với một loại nucleotide và được hiển thị bằng một đỉnh. Thông thường, phản ứng gắn nucleotide vào sợi DNA tổng hợp trên sợi khuôn mẫu được thực hiện bằng PCR. Hai loại nucleotide dGTP và dTTP được thay thế bằng dITP và dUTP nhằm hạn chế sự trùng lặp các đỉnh. Sản phẩm PCR thường được tinh sạch, loại bỏ các nucleotide và primer thừa trước khi đưa vào máy đọc tự động. Trình tự đọc được trên máy tự động thường dài khoảng 600-1.000 bp. Ưu điểm của phương pháp này là kết quả đọc được đưa trực tiếp vào chương trình computer, giảm bớt sai sót do đọc bằng mắt gây ra. Hơn nữa, phản ứng PCR không đòi hỏi lượng DNA khuôn mẫu (dạng sợi đôi) nhiều nhưng các sợi đơn DNA cần đọc lại được khuếch đại lên rất nhiều lần. Hình 5.14. Máy phân tích trình tự nucleotide tự động và hình ảnh điện di các băng DNA phát huỳnh quang quan sát được trên computer Trình tự hệ gen cũng như các loại DNA được xác định ngày càng nhiều ở các sinh vật khác nhau. Do đó, việc lưu trữ số liệu, phân tích, so sánh và sắp xếp chúng đã thúc đẩy hình thành một hướng nghiên cứu mới đó là tin sinh học (bioinformatics). Mối liên quan mật thiết giữa trình tự nucleotide và protein đã khiến lĩnh vực mới này phát triển rất nhanh chóng. Ba ngân hàng dữ liệu chính hiện nay lưu trữ hầu hết các thông tin về DNA là EMBL (thuộc European Informatics Institute), GenBank (thuộc US National Centre for Biotechnology Information) và DDBJ (thuộc DNA Database Bank of Japan). Một ngân hàng dữ liệu khác lưu trữ thông tin về protein là Swiss Protein Database (Thụy Sĩ). Hình 5.15. Minh họa trình tự nucleotide một đoạn DNA đã được phân tích trình tự Tài liệu tham khảo/đọc thêm 1. Võ Thị Thương Lan. 2002. Sinh học phân tử. NXB Đại học Quốc gia Hà Nội, Hà Nội. 2. Ausubel FM, Brent R, Kingston RE, Moore DD, Seidman JG, Smith JA and Struhl K. 2002. Short Protocol in Molecular Biology. Vol 1 and 2. 5th ed. John Wiley & Sons, Inc. USA. 3. Brown TA. 2001. Gene Cloning-An Introduction. 4th ed. Blackwell Science, Oxford, UK. 4. Glick BR and Pasternak JJ. 2003. Molecular Biotechnology: Principles and Applications of Recombinant DNA. 3rd ed. ASM Press, USA. 5. Maniatis T, Fritsch EF and Sambrook J. 1989. Molecular Cloning-A Laboratory Manual. Cold Spring Habor Laboratory Press, USA. 6. Ohman DE. 1989. Experiments in Gene Manipulation. Prentice Hall, Englewood Cliffs, New Jersey, USA. 7. Primrose SB, Twyman R and Old RW. 2001. Principles of Gene Manipulation. 6th ed. Blackwell Science, Oxford, UK. 8. Rapley R and Walker JM. 1998. Molecular Biomethods Handbook. Humana Press Inc. New Jersey, USA. 9. Surzycki S. 2000. Basic Techniques in Molecular Biology. Springer-Verlag, Berlin, Heidelberg, Germany. 1 LB: lysogeny broth, một môi trường giàu dinh dưỡng được dùng chủ yếu cho sự sinh trưởng của vi khuẩn. Môi trường LB còn được gọi là Luria broth hoặc Luria-Bertani broth. 2 DNase I (tụy của bò): enzyme xúc tác phản ứng thủy phân liên kết nằm ngay sau một pyrimidine trên chuỗi DNA. Trong trưởng hợp DNA sợi đôi, chỗ cắt có thể xảy ra trên một hay trên cả hay sợi (xem chương 1).
DMCA.com Protection Status Copyright by webtailieu.net