Một số vấn đề về di truyền học - Bổ sung kiến thức chương trình 12
Kiến thức bổ sung và cập nhật kiến thức mới về Di truyền học. Hữu ích cho giáo viên và học sinh, xin giới thiệu cùng các bạn đồng nghiệp và các bạn học sinh.
I. GEN
I. 1. Về khái niệm
Các thông tin di truyền sinh vật cần cho quá trình sinh trưởng, phát triển và sinh sản nằm trong phân tử ADN của nó. Những thông tin này nằm trong trình tự nucleotit của ADN và được tổ chức thành các gen. Mỗi gen thường chứa thông tin để tổng hợp một chuỗi polypeptit hoặc một phân tử ARN có chức năng riêng biệt. Xét về cấu trúc, mỗi gen là một đoạn ADN riêng biệt mang trình tự bazơ thường mã hoá cho trình tự axit amin của một chuỗi polypeptit. Các gen rất khác nhau về kích thước, có thể từ dưới 100 cặp đến vài triệu cặp bazơ. ở sinh vật bậc cao, các gen hợp thành các phân tử ADN rất dài nằm trong các cấu trúc được gọi là nhiễm sắc thể. ở người có khoảng 30.000 - 40.000 gen phân bố trên 23 cặp NST, trong đó có 22 cặp NST thường (autosome) và 1 cặp NST giới tính (X và Y). Như vậy, ở người có 24 loại NST khác nhau. Trên nhiễm sắc thể, các gen thường nằm phân tán và cách biệt nhau bởi các đoạn trình tự không mã hóa. Các đoạn trình tự này được gọi là các đoạn ADN liên gen. ADN liên gen rất dài, như ở người các gen chỉ chiếm dưới 30% toàn bộ hệ gen. Xét ở mỗi gen, chỉ một mạch của chuỗi xoắn kép là mang thông tin và được gọi là mạch khuôn dùng để tạo ra phân tử ARN mang trình tự bổ trợ để điều khiển quá trình tổng hợp chuỗi polypeptit. Mạch kia được gọi là mạch không làm khuôn. Cả hai mạch trên phân tử ADN đều có thể được dùng làm mạch để mã hoá cho các gen khác nhau. Ngoài ra, người ta còn dùng một số thuật ngữ khác để chỉ mạch khuôn và mạch không làm khuôn, như mạch đối nghĩa / mạch mang nghĩa, mạch không mã hoá / mạch mã hoá. Cần chú ý là, mạch đối nghĩa và mạch không mã hóa chính là mạch khuôn để tổng hợp phân tử ARN.
Khả năng lưu giữ thông tin di truyền của ADN là rất lớn. Với một phân tử ADN có n bazơ sẽ có 4n khả năng tổ hợp trình tự bazơ khác nhau. Trong thực tế, chỉ một số lượng hạn chế các trình tự mang thông tin có ích (thông tin mã hóa các phân tử ARN hoặc protein có chức năng sinh học).
I. 2. Về tổ chức của gen
Hầu hết các gen phân bố ngẫu nhiên trên nhiễm sắc thể, tuy nhiên có một số gen được tổ chức thành nhóm, hoặc cụm. Có hai kiểu cụm gen, đó là các operon và các họ gen.
Operon là các cụm gen ở vi khuẩn. Chúng chứa các gen được điều hoà hoạt động đồng thời và mã hoá cho các protein thường có chức năng liên quan với nhau. Ví dụ như operon lac ở E. coli chứa ba gen mã hoá cho các enzym mà vi khuẩn cần để thủy phân lactose. Khi có lactose làm nguồn năng lượng (và vắng mặt glucose) thì vi khuẩn cần ba enzym do operon lac mã hoá. Sự dùng chung một trình tự khởi đầu phiên mã (promoter) của các gen trong operon (hình 1) cho phép các gen đó được điều khiển biểu hiện đồng thời và sinh vật có thể sử dụng nguồn năng lượng một cách hiệu quả.Ở các sinh vật bậc cao không có các operon, các cụm gen được gọi là các họ gen. Không giống như các operon, các gen trong một họ gen rất giống nhau, nhưng không được điều khiển biểu hiện đồng thời. Sự cụm lại của các gen trong họ gen có lẽ phản ánh nhu cầu cần có nhiều bản sao của những gen nhất định và xu hướng lặp đoạn của nhiều gen trong quá trình tiến hóa. Một số họ gen tồn tại thành nhiều cụm riêng biệt trên nhiều nhiễm sắc thể khác nhau. Hiện tượng này có lẽ là do sự tái cấu trúc ADN trong quá trình tiến hoá đã phá vỡ các cụm gen. Các họ gen có thể có cấu trúc đơn giản hoặc phức tạp. ở các họ gen đơn giản, các bản sao của gen giống hệt nhau. Ví dụ như họ gen mã hóa ARN ribosom 5S (rARN 5S). ở mỗi tế bào người, có khoảng 2000 cụm gen của gen này, phản ánh tế bào cần số lượng lớn sản phẩm của gen này (hình 2a). Trong khi đó, các họ gen phức tạp chứa các gen tương tự nhưng không giống hệt nhau. Ví dụ như họ gen globin ở người mã hóa cho cho các chuỗi polypeptit tương ứng với các loại globin a, b, g, e, và z (hình 2b) chỉ khác nhau vài axit amin. Các chuỗi polypeptit globin tương tác với nhau thành một phức hệ, và kết hợp với các phân tử hem để tạo ra hemoglobin (một loại protein vận chuyển oxy trong máu).
I.3. Trình tự khởi đầu phiên mã (promoter)
Sự biểu hiện của gen được điều khiển rất chặt chẽ. Không phải tất cả các gen có trong ADN của tế bào đều được biểu hiện đồng thời. Những gen khác nhau được hoạt hoá biểu hiện vào những thời điểm và ở những tế bào khác nhau. Tất cả các gen được biểu hiện trong một tế bào sẽ xác định đặc tính và chức năng của tế bào đó. Ví dụ, các gen biểu hiện trong tế bào cơ khác với các gen được biểu hiện trong tế bào máu. Sự biểu hiện của gen được điều khiển bắt đầu từ một đoạn trình tự ADN đứng trước (nằm ngược dòng về phía đầu 5’) so với đoạn trình tự mã hóa được gọi là trình tự khởi đầu phiên mã (promoter, còn gọi là trình tự khởi động). Đoạn trình tự khởi động chứa trình tự đặc hiệu được ARN polymerase và các protein đặc biệt gọi là các yếu tố phiên mã nhận biết để gắn vào trong quá trình phiên mã của gen. Mức độ biểu hiện của gen trong tế bào được xác định bằng mức độ gắn kết (ái lực) của ARN polymerase và các yếu tố phiên mã với promoter.
I. 4. xon và ntron
Ở các sinh vật bậc cao (sinh vật nhân chuẩn), thông tin di truyền mã hoá trên các NST thường bị phân cắt thành nhiều đoạn trình tự ADN cách biệt được gọi là các exon. Các exon bị ngăn cách bởi những trình tự không mang thông tin có ích được gọi là các intron. Số lượng các intron trong một gen biến động lớn, có thẻ từ 0 đến trên 50 phân đoạn. Độ dài của các intron và exon cũng rất biến động, nhưng các intron thường dài hơn và chiếm phần lớn trình tự của gen. Trước khi thông tin trong gen được sử dụng để tổng hợp phân tử protein tương ứng, thì các intron phải được cắt bỏ khỏi phân tử ARN nhờ quá trình được gọi là quá trình cắt bỏ (quá trình hoàn thiện phân tử mARN). Trong quá trình đó, các exon được giữ lại và nối lại với nhau thành một trình tự mã hoá liên tục.
Việc xác định các intron trong trình tự một gen có thể thực hiện được nhờ các intron điển hình có trình tự bắt đầu là 5’-GU và kết thúc là AG- 3’. Tuy vậy, thực tế ngoài những dấu hiệu này, việc cắt bỏ các intron còn cần các trình tự khác ở vùng nối giữa intron và exon (xem thêm mục I.1).
I. 6. Gen giả (pseudogene)
Có một số gen giống với các gen khác nhưng trình tự bazơ của chúng có những sai sót làm cho chúng không có khả năng chứa những thông tin sinh học hữu ích. Những gen đó được gọi là những gen giả và những sai sót hoặc đột biến trong trình tự ADN của chúng xuất hiện trong quá trình tiến hoá làm thông tin bị lẫn lộn đến mức không còn điều khiển quá trình sinh tổng hợp protein bình thường được nữa. Những gen giả là dấu vết của quá trình tiến hoá. Trải qua tiến hoá, những sự biến đổi ban đầu các bazơ gây mất thông tin được lặp đi lặp lại đến mức thậm chí trình tự bazơ của các gen giả khác hẳn với trình tự gen gốc ban đầu. Ví dụ như các gen globin giả trong các cụm gen globin.
II. Mã di truyền
II. 1. Khung đọc
Ngoài việc quy định điểm bắt đầu quá trình tổng hợp protein, bộ ba mã khởi đầu (AUG) còn xác định khung đọc của trình tự ARN. Có thể có ba bộ ba cho bất kỳ một trình tự bazơ nào, phụ thuộc vào bazơ nào được chọn làm bazơ bắt đầu của codon. Thực tế trong quá trình tổng hợp protein, thường chỉ có một khung đọc được sử dụng. Còn hai khung đọc kia thường chứa một số bộ ba kết thúc ngăn cản chúng được sử dụng để tổng hợp trực tiếp nên phân tử protein.
Mỗi trình tự ADN có thể đọc theo ba khung đọc khác nhau, phụ thuộc vào bazơ nào được chọn làm bazơ khởi đầu. Trên mỗi phân đoạn ADN mạch kép về lý thuyết có thể có tối đa sáu khung đọc mở (ORF) khác nhau.
Đoạn trình tự nằm giữa một bộ ba khởi đầu và một bộ ba kết thúc tương ứng cùng khung đọc được gọi là khung đọc mở (ORF = open reading frame). Đặc điểm này được dùng để xác định các trình tự ADN mã hoá protein trong các dự án giải mã hệ gen.
II.2. Tính vạn năng của mã di truyền
Ban đầu, người ta tin rằng mã di truyền là vạn năng. Nghĩa là ở mọi sinh vật, các codon giống nhau đều quy định những axit amin như nhau. Tuy vậy, thực tế cho thấy có một số trường hợp ngoại lệ. Ví dụ, ở hệ gen ty thể có sự khác biệt về bộ ba khởi đầu và bộ ba kết thúc. Cụ thể, UAG bình thường là bộ ba kết thúc, thì ở ty thể nó lại mã hoá cho tryptophan; AGA và AGG bình thường quy định arginin, ở ty thể lại có vai trò là các bộ ba kết thúc; AUA bình thường mã hóa cho isoleucin thì ở ty thể lại xác định methionin. Người ta cho rằng những thay đổi này có thể tồn tại được là nhờ ty thể là một hệ thống kín. Ngoài hệ gen ty thể, một số trường hợp ngoại lệ khác cũng được tìm thấy ở một số sinh vật đơn bào. Ví dụ ở một số động vật nguyên sinh, các bộ ba UAA và UAG bình thường là các bộ ba kết thúc thì lại mã hoá cho axit glutamic.
III. Sự hoàn thiện mARN ở eukaryote
III.1. Cắt bỏ các intron
Quá trình này xảy ra trong nhân nhằm cắt bỏ các trình tự intron không mã hóa khỏi phân tử tiền mARN để hình thành nên phân tử mARN hoàn chỉnh chỉ chứa các trình tự mã hoá liên tục tương ứng với các exon. Sau đó, phân tử mARN hoàn chỉnh được chuyển ra tế bào chất để làm khuôn tổng hợp protein.
Quá trình cắt bỏ intron phụ thuộc vào trình tự tín hiệu ở các đoạn nối giữa các intron và exon. Các intron điển hình được giới hạn bởi đầu 5’-GT và 3’-AG. Đoạn trình tự tín hiệu đầy đủ ở đầu 5’ gặp ở phần lớn các gen là: 5’-AGGTAAGT-3’ và ở đầu 3’ là 5’- YYYYYYNCAG-3’ (Y= pyrimidin, N = nucleotit bất kỳ).
Việc cắt bỏ các intron được thực hiện bởi một phức hệ gọi là spliceosom, gồm phân tử tiền -mARN liên kết với các hạt ribonucleoprotein nhân kích thước nhỏ snRNP (small nuclear ribonucleoprotein particle, được đọc tắt là snớp). snRNP được tạo thành tự sự liên kết giữa snARN và protein. Có 5 loại snARN phổ biến được kí hiệu là U1, U2, U4, U5 và U6. Mỗi loại liên kết với một số phân tử protein để hình thành nên snRNP. Trừ U4 và U6 thường tìm thấy trong cùng một snRNP, còn các loại khác tìm thấy trong các snRNP riêng biệt.
Quá trình cắt intron trải qua một số bước như sau (hình 5 và 6):
1) U1 snRNP gắn vào vị trí cắt đầu 5’ của intron. Việc gắn này dựa trên nguyên tắc bổ trợ của U1 snARN có trong snRNP với trình tự ở đoạn nối với exon ở gần đầu 5’ của intron.
2) U2 snRNP gắn vào một trình tự gọi là điểm phân nhánh nằm ngược dòng so với đoạn nối với exon về phía đầu 3’ của intron. Điểm phân nhánh là vị trí đặc thù của các intron, tại đó chứa một adenyl là vị trí gắn vào của đầu 5’ tự do của intron trong quá trình cắt bỏ intron.
3) Phức hệ U4 / U6 snRNP tương tác với U5 snRNP rồi gắn vào các phức hệ U1 và U2 snRNP làm hai đầu 5’ và 3’ của intron tiến lại gần nhau, tạo thành cấu trúc thòng lọng.
4) U4 snRNP tách ra khỏi phức hệ, lúc này spliceosome chuyển thành dạng có hoạt tính cắt (exonuclease).
5) snRNP cắt intron ở đầu 5’ tạo ra một đầu 5’ tự do. Đầu này sẽ liên kết với nucleotit A tại điểm phân nhánh vào vị trí nhóm 2’- OH (liên kết phosphodieste 5’-2’). Nhóm 3’- OH của adênyl này vẫn liên kết bình thường với nucleotit khác trong chuỗi.
6) Intron được cắt ở phía đầu 5’ (intron vẫn ở dạng thòng lọng) và các exon liền kề ở hai đầu 5’ và 3’ của intron liên kết với nhau. Lúc này phức hệ snRNP rời khỏi phân tử ARN. Và quá trình cắt intron như vậy được lặp đi lặp lại.
Quá trình cắt intron như trên được tìm thấy ở các gen được phiên mã nhờ ARN polymerase . Ngoài cơ chế trên đây, một số loại phân tử ARN có thể tự cắt bỏ intron. Quá trình cắt bỏ intron này không phụ thuộc vào protein và được gọi là các intron nhóm . Cơ chế tự cắt của các intron nhóm được tìm thấy ở các gen rARN, một số gen mã hóa protein trong ti thể và một số gen mã hóa mARN và tARN ở thực khuẩn thể.
Một ví dụ về quá trình tự cắt của intron nhóm (ở Tetrachynema) được mô tả như sau:
1) Phân tử tiền -mARN được cắt ở vị trí nối với exon ở phía đầu 5’ và một nucleoit G gắn vào vị chí cắt này.
2) Intron được cắt ở vị trí nối tại đầu 3’.
3) Hai exon liền kề được nối lại với nhau.
4) Phần intron được cắt ra đóng vòng tạo thành một phân tử ADN dạng vòng. Sản phẩm tạo ra là intron ở dạng mạch vòng còn phân tử ADN chứa các exon ở dạng mạch thẳng.
Quá trình tự cắt của intron nhóm do chính ARN tự xúc tác, và các ARN có hoạt tính như vậy được gọi là ribozym. Tuy vậy, hoạt tính tự xúc tác của ARN không nên coi là hoạt tính enzym. Bởi, không giống như enzym protein, các phân tử ARN không trở về dạng ban đầu sau khi phản ứng kết thúc.
Việc tìm ra ARN có hoạt tính xúc tác gần giống với protein đã làm thay đổi quan điểm về nguồn gốc sự sống. Trước đây, người ta cho rằng protein là yếu tố thiết yếu để quá trình sao chép các nucleotit có thể xảy ra. Nhưng lý thuyết mới gần đây cho rằng các axit nucleic đầu tiên có khả năng tự sao chép thông qua hoạt tính kiểu ribozym.
III.2. Lắp mũ
Đầu 5’ của phân tử mARN ở sinh vật nhân chuẩn được sửa đổi bằng cách gắn thêm một nucleotit bị cải biến là 7-methylguanosin (7-mG); quá trình đó được gọi là sự lắp mũ. Mũ 7-mG được gắn nhờ enzym guanyltransferase nối GTP với nucleotit đầu tiên của mARN bằng liên kết triphotphat 5’® 5’ khác thường. Sau đó enzym methyl transferase sẽ gắn thêm nhóm -CH3 vào nitơ số 7 của vòng guanin; đồng thời thường gắn thêm cả vào nhóm 2’- OH của đường ribose của hai nucleotit kế tiếp. Việc tạo mũ giúp bảo vệ đầu 5’ của mARN không bị phân hủy bởi exonuclease trong tế bào chất, đồng thời làm tín hiệu cho ribosom nhận biết điểm bắt đầu của phân tử mARN.
III.3. Gắn đuôi poly (A)
Đầu 3’ của phân tử tiền -mARN của hầu hết các sinh vật nhân chuẩn được sửa đổi bằng cách thêm vào một đoạn trình tự poly A (còn được gọi là đuôi polyA) có thể dài tới 250 bazơ adenin. Sự sửa đổi này được gọi là đa adenin hóa và cần có một trình tự tín hiệu trên phân tử tiền -mARN. Đó là trình tự 5’-AAUAAA-3’ nằm gần đầu 3’ của phân tử tiền -mARN. Khoảng 11 - 20 bazơ tiếp theo có trình tự là YA (Y= pyrimidin), rồi tiếp đến là đoạn trình tự giàu GU nằm xuôi dòng. Có nhiều protein đặc hiệu có khả năng nhận biết và gắn vào đoạn trình tự tín hiệu tạo thành một phức hệ cắt mARN ở vị trí khoảng 20 nucleotit phía sau của trình tự 5’-AAUAAA-3’. Sau đó, enzym poly(A) polymerase sẽ bổ sung thêm các adenin vào đầu 3’ của mARN. Mục đích tạo đuôi A còn chưa rõ, nhưng có thể nó có vai trò bảo vệ cho mARN không bị phân hủy ở đầu 3’ bởi exonuclease. Tuy nhiên, một số mARN, như mARN mã hoá các protein histon, không có đuôi polyA (nhưng thường có thời gian tồn tại ngắn)..
III.4. Tính bền vững của mARN
Không giống như rARN và tARN có tính bền vững khá cao trong tế bào, các mARN có vòng đời tương đối ngắn. Điều đó có thể do tế bào cần điều tiết mức độ tổng hợp các loại protein trong tế bào tùy theo yêu cầu thông qua sự thay đổi mức độ phiên mã. Sự thay đổi lượng mARN đang dịch mã phản ánh sự thay đổi mức độ phiên mã. ở các tế bào vi khuẩn, mARN có thời gian bán phân hủy khoảng vài phút. Trong khi, ở các tế bào nhân chuẩn, mARN có thời gian bán phân hủy có thể lên đến hơn 6 giờ. Mặc dù một số mARN, như các mARN mã hoá globin cấu tạo nên hemoglobin, có thể tồn tại rất lâu trong tế bào.
III.5. Các phân tử mARN được hoàn thiện theo các cách khác nhau
Một trình tự ADN phiên mã chỉ cho ra một phân tử tiền -mARN, nhưng phân tử tiền -mARN có thể được hoàn thiện bằng các cách khác nhau để tạo ra nhiều loại phân tử mARN hoàn chỉnh khác nhau trước khi được sử dụng làm khuôn tổng hợp protein. Đó là các cơ chế cắt bỏ tiền -mARN khác nhau, trong đó tế bào sử dụng những điểm cắt khác biệt để loại bỏ hay giữ lại các exon trong quá trình cắt bỏ. Ngoài ra, việc tồn tại các tín hiệu poly (A) khác nhau trên phân tử tiền -mARN cũng có thể dẫn đến việc sinh ra các phân tử mARN có trình tự dài ngắn khác nhau ở đầu 3’. Ví dụ, việc sử dụng điểm poly (A) nằm phía trước điểm kết thúc đoạn trình tự mã hoá có thể loại bỏ một số exon nằm sau nó và sinh ra mARN mã hóa cho một loại protein ngắn hơn.
Một phân tử tiền -mARN có thể được cắt bỏ các intron theo những cách khác nhau cùng lúc hoặc ở những giai đoạn phát triển khác nhau của một tế bào, hoặc khác nhau giữa các tế bào khác nhau. Các protein được sinh ra theo các cơ chế này thường có quan hệ với nhau, song chúng thường biểu hiện chức năng hoặc có đặc điểm riêng. Ví dụ, quá trình hoàn thiện phân tử tiền -mARN của globulin miễn dịch dẫn đến việc tổng hợp các protein có thể chứa hoặc không chứa các trình tự axit amin kỵ nước cho phép nó liên kết được vào màng tế bào. Điều này giúp tạo ra nhiều dạng globulin miễn dịch có thể liên kết với màng và các dạng để tiết ra khỏi tế bào.
Các phân tử tiền -mARN cũng còn có thể trải qua quá trình sửa đổi trình tự ARN. Trong quá trình đó, trình tự của phân tử tiền -mARN bị biến đổi bằng cách thêm vào, bớt đi hay thay thế các bazơ. Sự sửa đổi trình tự ARN được xác định đầu tiên ở một số nguyên sinh động vật ký sinh. ở những loài này, người ta thấy các bản phiên mã của nhiều gen ty thể bị sửa đổi bằng cách được bổ sung thêm các gốc uracil. Quá trình này cũng gặp ở động vật có xương sống, nhưng mức độ sửa đổi ít hơn nhiều. ở người, phân tử tiền -mARN của gen apolipoprotein B bị sửa đổi ở tế bào ruột non bằng cách thay thế bazơ C bằng U để tạo nên một bộ ba kết thúc, dẫn đến việc tổng hợp một phân tử protein ngắn hơn. Trong khi đó ở tế bào gan, nơi trình tự ARN không bị sửa đổi, protein đó có độ dài đầy đủ.
IV. Về bệnh di truyền
IV.1. Các dạng bệnh di truyền
Có một nhóm đa dạng các bệnh lý và rối loạn gây ra do các đột biến gen và sự thay đổi bất thường của nhiễm sắc thể. Các rối loạn có bản chất di truyền và có thể chia làm 3 nhóm chính:
Các sai hỏng đơn gen
Các sai hỏng đơn gen còn được gọi là các rối loạn di truyền Mendel (Mendelian disorders), các rối loạn đơn gen (monogenic disorders), hay các rối loạn đơn locut (single locus disorders). Đây là một nhóm các dạng bệnh lý gây ra do sự có mặt của một gen đột biến trong cơ thể bị bệnh. Đột biến gen làm thay đổi thông tin mã hóa của gen đó và, hoặc dẫn đến việc tạo ra phân tử protein bị sai hỏng về chức năng, hoặc thậm chí ức chế hoàn toàn sự tổng hợp protein mà gen đó mã hóa. Sự thiếu hụt protein do đột biến gen gây nên sự biểu hiện của các trạng thái bệnh lý. Đột biến gen có thể được di truyền giữa các thế hệ (từ bố, mẹ sang con, cháu) hoặc xuất hiện một cách tự phát (de novo) trong tế bào sinh dục (tinh trùng hoặc trứng) trong cơ thể bố hoặc mẹ, và sau thụ tinh, đứa trẻ hình thành mang đột biến trong mọi tế bào.
Các rối loạn nhiễm sắc thể
Có các dạng bệnh lý gây ra do sự mất đi hoặc thêm vào một hoặc một số nhiễm sắc thể, hay do sự thay đổi cấu trúc của nhiễm sắc thể. Phần lớn các rối loạn bất thường về nhiễm sắc thể xuất hiện ngay trong các tế bào sinh dục của cơ thể bố hoặc mẹ, nhưng cũng có những trường hợp gây ra do di truyền từ thế hệ trước. Các dạng bất thường về số lượng nhiễm sắc thể (biến dị số lượng nhiễm sắc thể) có thể biểu hiện bằng sự tăng lên số lượng bộ nhiễm sắc thể đơn bội (hiện tượng đa bội thể), hoặc do sự thêm và, hoặc mất đi của từng nhiễm sắc thể riêng lẻ (hiện tượng lệch bội). Các dạng bất thường về cấu trúc nhiễm sắc thể có thể gây ra do sự đứt gẫy nhiễm sắc thể liên quan đến các hiện tượng mất đoạn, lặp đoạn hoặc đảo đoạn nhiễm sắc thể.
Các rối loạn đa nhân tố
Đây là một nhóm gồm nhiều bệnh phổ biến, ví dụ như đái tháo đường, các bệnh mạch vành và phần lớn các dị tất bẩm sinh. Các bệnh này gây ra do ảnh hưởng của nhiều gen theo các cơ chế bệnh lý phức tạp cho đến nay chưa được hiểu biết đầy đủ, nhưng được biết có liên quan đến sự tương tác của nhiều gen với nhau, hoặc giữa các gen với các yếu tố môi trường.
Trong khoảng 20 năm qua, nhờ sự phát triển của công nghệ ADN tái tổ hợp, đã có nhiều phát hiện mới mang tính bước ngoặt liên quan đến các bệnh lý do rối loạn đơn gen gây ra. Thông tin được nêu trong phần dưới đây liên quan đến một số rối loạn bệnh lý như vậy.
IV.2. Hình thức di truyền
Các rối loạn di truyền đơn gen được truyền từ thế hệ bố, mẹ sang thế hệ con, cháu. Có ba hình thức di truyền phổ biến: di truyền trội trên nhiễm sắc thể thường, di truyền lặn trên nhiễm sắc thể thường và di truyền liên kết nhiễm sắc thể X (Bảng 1).
Trong trường hợp bệnh di truyền do alen trội nằm trên nhiễm sắc thể thường quy định, việc truyền một alen gây bệnh từ bố hoặc mẹ sang con là đủ để cá thể con biểu hiện bệnh. Các cá thể bị bệnh có một alen bình thường và một alen đột biến gây bệnh được gọi là các thể dị hợp tử. Các cá thể này có nguy cơ truyền cho 50 % số con alen đột biến và biểu hiện bệnh (hình 7a).
Trong trường hợp bệnh di truyền do alen lặn nằm trên nhiễm sắc thể thường quy định, cá thể biểu hiện bệnh phải mang đủ một cặp alen đột biến gây bệnh, một bắt nguồn từ bố, một từ mẹ. Cá thể biểu hiện bệnh trong trường hợp này gọi là cá thể đồng hợp từ về alen đột biến. Các cá thể dị hợp tử với một alen gây bệnh không biểu hiện bệnh nhưng có khả năng truyền alen gây bệnh sang 50% số cá thể con. Đối cả bố và mẹ là các cá thể dị hợp tử mang alen lặn gây bệnh trên nhiễm sắc thể thường, một phần tư số con biểu hiện bệnh, một phần tư bình thường và một nửa số cá thể con là thể mang alen gây bệnh nhưng không biểu hiện bệnh (hình 7b).
Trong trường hợp bệnh di truyền liên kết với nhiễm sắc thể X, gen đột biến gây bệnh chỉ xuất hiện trên nhiễm sắc thể X. Do con đực chỉ có một nhiễm sắc thể X duy nhất, việc truyền alen đột biến sang cá thể con giới đực là đủ để cá thể này biểu hiện bệnh. Các cá thể đực biểu hiện bệnh gọi là các cá thể dị giao tử. Các con cái có hai nhiễm sắc thể X vì vậy thường không biểu hiện bệnh do phần lớn các gen đột biến gây bệnh nằm trên nhiễm sắc thể X là các alen lặn. Đối với các con cái là cá thể mang gen gây bệnh nhưng không biểu hiện bệnh, 50% con đực thế hệ con có nguy cơ bị bệnh và 50% con cái là thể mang gen gây bệnh nhưng không biểu hiện bệnh (hình 7c).
Bảng 1. Một số bệnh lý di truyền đơn gen
Để có sự cân bằng giữa con đực và con cái về lượng sản phẩm do gen nằm trên nhiễm sắc thể X mã hóa, trong tự nhiên có hiện tượng một trong hai nhiễm sắc thể X trong tế bào con cái bị bất hoạt. Quá trình này được gọi là hiện tượng Lyon hóa (giả thiết Lyon) và thường diễn ra trong quá trình phát triển của phôi. Trong mỗi tế bào, nhiễm sắc thể X bị bất hoạt được "chọn "một cách ngẫu nhiên. Tuy vậy, một số con cái là thể mang gen gây bệnh nằm trên nhiễm sắc thể X có thể biểu hiện bệnh ở mức độ nhẹ do sự bất hoạt của nhiễm sắc thể X bình thường.
IV.3. Sai hỏng đơn gen
Có nhiều bệnh di truyền do gen đơn quy định xuất hiện ở người (Bảng 7). Các bệnh này có các đặc điểm biểu hiện đa dạng khác nhau và hậu quả đối với các cá thể bị bệnh cũng khác nhau tùy thuộc vào mức độ quan trọng của gen bị đột biến và bản chất của loại đột biến xuất hiện. Một số bệnh, như bệnh máu khó đông, gây nên các triệu chứng bệnh có thể điều trị được, nhưng các bệnh khác chẳng hạn như hội chứng múa giật Huntington, đến nay chưa có biện pháp điều trị triệt để và người bệnh thường chết khi còn trẻ.
Các bệnh di truyền do đơn gen quy định thường xuất hiện với tần số tương đối thấp nằm trong khoảng giữa 0, 01 đến 5, 0 trường hợp trong 1000 em bé sơ sinh. Tần số các rối loạn di truyền này thường khác nhau trong các chủng tộc người khác nhau. Chẳng hạn, tần số bệnh nhân bị xơ nang là cao nhất ở các nước Bắc Âu, bệnh thiếu máu hồng cầu hình liềm xảy ra với tần số cao nhất ở Châu Phi và bệnh b-thalassemia phổ biến hơn cả trong các quần thể Châu á. Đối với các bệnh di truyền đơn gen phổ biến nhất ở người đến nay đã xác định và tách dòng được gen gây bệnh đồng thời xác định được các đột biến gây bệnh.
IV.4. Các đột biến trong sai hỏng đơn gen
Có thể chia các loại đột biến tạo ra các alen gây bệnh thành hai loại chính: các đột biến điểm liên quan đến sự thay đổi của một bazơ nitơ duy nhất và các đột biến lớn liên quan đến sự thay đổi trình tự ADN với kích thước lớn hơn. Đối với mỗi loại bệnh, có thể có vài dạng đột biến khác nhau. Ngoài ra, các cá thể bị bệnh cũng có thể cùng lúc mang các gen đột biến khác nhau. Ví dụ, có khoảng 20% trường hợp bị bệnh máu khó động dạng A do kết quả của đột biến lớn gây ra. Các trường hợp còn lại là do các dạng đột biến điểm mà đến nay các nhà nghiên cứu đã tìm ra và mô tả 250 kiểu đột biến khác nhau.
Các đột biến điểm
Các đột biến điểm gây nên các bệnh di truyền có thể chia thành một số kiểu sau:
(1) Các đột biến sai nghĩa (misense mutations). Đây là những thay đổi của các nucleotit trên phân tử ADN gây nên sự thay đổi bộ ba mã hóa cho một axit amin dẫn đến sự thay thế bởi một loại axit amin khác trên phân tử protein. Các đột biến sai nghĩa gây nên những hậu quả khác nhau đối với phân tử protein được mã hóa. Do hiện tượng thoái hóa của mã di truyền, những thay đổi liên quan đến vị trí bazơ thứ ba trong bộ ba mã hóa thường không có ảnh hưởng đến phân tử protein. Ngoài ra, nhiều sự thay đổi thành phần bazơ nitơ dẫn đến sự thay thế của axit amin có đặc tính tương tự có thể không làm thay đổi chức năng và hoạt tính của phân tử protein. Chẳng hạn như đột biến ở bộ ba mã hóa CTT thành ATT làm thay thế axit amin kị nước là leucin bằng isoleucin cũng là một axit amin kị nước khác. Tuy vậy, có nhiều ví dụ cho thấy các đột biến sai nghĩa làm thay đổi rõ rệt chức năng của phân tử protein được mã hóa và vì vậy gây nên các bệnh di truyền. Trong số này có thể kể đến đột biến thay thế A bằng T trong gen mã hóa b-globin, một trong các chuỗi polypeptit hình thành nên phân tử hemoglobin. Đột biến này làm thay đổi bộ ba số sáu của gen thay đổi từ GAG mã hóa cho axit glutamic thành GTG mã hóa cho valin. Đột biến này gây nên bệnh thiếu máu hồng cầu hình liềm do các tế bào hồng cầu bị biến dạng thành hình liềm do thay đổi sự kết dính của các phân tử hemoglobin. Các tế bào hồng cầu hình liềm có tuổi thọ ngắn gây nên hiện tượng thiếu máu và nằm trong các mao mạch làm giảm khả năng cung cấp máu tới các cơ quan (chứng thiếu máu cục bộ).
(2) Các đột biến vô nghĩa. Đây là những thay đổi của các nucleotit trên phân tử ADN làm chuyển một mã bộ ba mã hóa axit amin thành một mã bộ ba kết thúc vì vậy quá trình phiên mã sẽ kết thúc sớm hơn bình thường và dẫn đến sự hình thành phân tử protein có kích thước ngắn hơn. Các đột biến vô nghĩa thường gây hậu quả nghiêm trọng đối với phân tử protein được mã hóa, đặc biệt khi nó xuất hiện gần đầu 5ơ của gen. Nhiều bệnh di truyền khác nhau đã được xác định có liên quan đến các đột biến vô nghĩa. Ví dụ như đột biến C thành T ở bộ ba số 39 trong gen mã hóa b-globin làm thay đổi mã bộ ba bình thường CAG quy định glutamin thành TAG là một bộ ba mã kết thúc. Đột biến này gây nên sự kết thúc phiên mã sớm của phân tử mARN mã hóa cho b-globin dẫn đến sự thiếu hụt một chuỗi polypeptit b và gây nên dạng bệnh lý gọi là b-thalassemia với triệu chứng bệnh thiếu máu do phân tử hemoglobin bình thường không được tạo thành.
(3)Các đột biến dịch khung : Những đột biến này xảy ra do sự thêm vào hay mất đi của một hay một số bazơ nitơ làm thay đổi khung đọc và một tập hợp các bộ ba mã hóa mới được hình thành kể từ điểm đột biến xảy ra. Đột biến dịch khung cũng thường gây nên hậu quả nghiêm trọng đối với phân tử protein được mã hóa, đặc biệt khi đột biến xuất hiện gần đầu 5ơ của gen. Nhiều bệnh lý được mô tả liên quan đến đột biến dịch khung. Chẳng hạn đột biến dịch khung đã được tìm thấy là nguyên nhân gây nên bệnh máu khó đông ở nhiều bệnh nhân mắc căn bệnh này. Trong đó bao gồm các trường hợp do mất đi 4 bazơ nitơ gây nên sự thay đổi khung đọc từ bộ ba mã hóa thứ 50 và một đột biến thêm 10 bazơ làm thay đổi khung đọc từ bộ ba mã hóa thứ 38. Cả hai kiểu đột biến này đều gây triệu chứng bệnh nghiêm trọng.
(4) Đột biến vị trí cắt intron. Đây là những đột biến làm thay đổi trình tự tín hiệu ở gần đầu 3’ hoặc 5’ của các đoạn intron dẫn đến việc cắt intron sai trong quá trình hoàn thiện phân tử mARN ở sinh vật nhân chuẩn. Các đột biến kiểu này cũng có thể xảy ra bên trong intron tạo nên điểm cắt intron mới và vì vậy cũng dẫn đến sự cắt sai trình tự intron. Một loạt các đột biến vị trí cắt intron được tìm thấy liên quan đến đột biến gen b-globin làm thiếu hoàn toàn các chuỗi b-globin trong các cơ thể đồng hợp tử và gây bệnh b-thalassemia.
(5) Đột biến trình tự gen điều hòa. Các đột biến này xảy ra tương đối hiếm và ảnh hưởng đến việc điều hòa hoạt động của gen, thường hoặc làm giảm hoặc làm tăng mức độ biểu hiện của gen. Một đột biến như vậy đã được xác định trong trình tự chỉ huy của gen mã hóa protein đông máu (là protein yếu tố
X) cũng là một nguyên nhân gây nên bệnh máu khó đông. Các cá thể mang đột biến này không tạo được protein yếu tố
X và bị chảy máu một cách bất thường. Thông thường, triệu chứng bệnh thường mất đi sau tuổi dậy thì nhờ hócmôn steroid kích thích sự biểu hiện của gen này.
Các đột biến lớn
Có nhiều bệnh lý gây ra do các đột biến liên quan đến một trình tự dài các nucleotit trên phân tử ADN. Phần lớn các đột biến này có ảnh hưởng nghiêm trọng đến chức năng của gen và gây bệnh nặng.
(1) Các đột biến mất đoạn. Sự mất đi của gen có thể biểu hiển với mức độ kích thước khác nhau, từ một vài bazơ nitơ đến toàn bộ gen, thậm trí nhiều gen cùng lúc. Sự mất đi hoàn toàn của các gen mã hóa b-globin gây nên bệnh b-thalassemia (bệnh mất khả năng sản xuất hemoglobin bình thường). Ví dụ như, sự mất một phần gen mã hóa dystrophin gây nên bệnh mòn cơ, bệnh loạn dưỡng cơ; hay sự mất đi một bộ ba mã hóa duy nhất trong gen tổng hợp protein điều hòa độ dẫn xuyên màng trong bệnh xơ nang CFTR (cystic fibrosis transmembrane conductance regulator) là nguyên nhân gây bệnh gặp phải ở 70% số bệnh nhân bị bệnh xơ nang.
(2) Các đột biến thêm đoạn. Nhiều đột biến thêm đoạn đã được ghi nhận. Ví dụ như một trường hợp một bệnh nhân bị máu khó đông dạng A hiếm gặp có nguyên nhân gây bệnh là do sự thêm vào gen mã hóa yếu tố V một trình tự lặp lại gọi là yếu tố LN.
(3)Các đột biến thay thế đoạn gen : Cũng có nhiều đột biến thay thế đoạn gen gây nên bệnh di truyền đã được ghi nhận. Ví dụ như một đột biến gây bệnh máu khó đông dạng A xảy ra do sự tái tổ hợp giữa các trình tự nằm trong vùng intron thứ 22 của gen mã hóa yếu tố V và các trình tự lặp lại kép dọc theo nhiễm sắc thể X. Do một lỗi xảy ra trong quá trình tái tổ hợp, gen mã hóa yếu tố V bị cắt thành 2 mảnh tách biệt nhau bởi hàng triệu cặp bazơ nitơ, làm mất hoàn toàn chức năng của gen này.
(4) Các đột biến lặp lại bộ ba nucleotit. Một dạng đột biến gen hiếm gặp liên quan đến các trình tự lặp lại từng bộ ba nucleotit kém bền vững. Trong quá trình giảm phân xảy ra hiện tượng số lượng bản sao các trình tự lặp lại từng bộ ba nucleotit tăng lên trong các tế bào sinh dục dẫn đến sự biểu hiện của bệnh trong các thế hệ sau. Cơ chế dẫn đến hiện tượng lặp lại nhiều lần của các trình tự nucleotit và nguyên lý gây bệnh cho đến nay chưa được biệt rõ. Sự tăng lên số lượng các trình tự lặp lại tìm thấy liên quan đến một số bệnh di truyền bao gồm bệnh múa giật Hungtington.
IV.5. Về một số bệnh di truyền
1) Trao đổi chéo trong nguyên phân có thể tạo ra thể khảm về di truyền và một số bệnh ung thư ở người
Trao đổi chéo là một đặc tính quan trọng của quá trình giảm phân. Phức hệ trao đổi chéo “xác định” vị trí tái tổ hợp đồng thời giữ cho các NST tương đồng gắn kết với nhau, cho phép chúng thành từng cặp tiến về mặt phẳng xích đạo tại kỳ giữa của giảm phân, rồi sau đó phân ly về hai cực đối diện của tế bào. Ngoài ra, TĐC trong giảm phân là một cơ chế góp phần làm tăng tính đa dạng của các dạng của các loại giao tử. Vì vậy, không có gì là ngạc nhiên khi các cơ thể sinh vật nhân chuẩn biểu hiện một sự đa dạng lớn về các loại enzym tham gia khởi đầu đặc hiệu sự TĐC trong giảm phân. TĐC cũng có thể xuất hiện trong nguyên phân. Tuy vậy, không giống sự kiện diễn ra trong giảm phân, TĐC trong nguyên phân thường xảy ra do lỗi xuất hiện trong quá trình tái bản NST hoặc do bị chiếu xạ dẫn đến sự đứt gãy của các phân tử ADN, chứ không phải là một chương trình được điều hòa bình thường của tế bào như trong giảm phân. Vì vậy, TĐC trong nguyên phân là một sự kiện hiếm khi xảy ra, chỉ xuất hiện với tần số thấp hơn 10-6 lần phân bào nguyên nhiễm. Tuy vậy, việc nuôi cấy các tế bào nấm men và quá trình phát triển của một cơ thể đa bào phức tạp có số lần phân chia tế bào đủ lớn để các nhà di truyền học có thể hàng ngày phát hiện và theo dõi được hiện tượng TĐC trong nguyên phân vốn xảy ra với tần số thấp này. Khác với trong giảm phân, TĐC xảy ra trong nguyên phân xảy ra ngẫu nhiên ở một số ít các tế bào soma, tạo nên những tế bào soma mang “hệ gen” khác nhau. Do vậy, những cá thể mang những tế bào soma chứa các NST bị TĐC được gọi là các thể khảm.
Ở người, một số TĐC xảy ra trong nguyên phân có thể gây nên sự hình thành khối u (ví dụ: một số bệnh u mắt). ở một số quần thể người, số trẻ sơ sinh có bảm chất di truyền có nguy cơ bị ung thư có tần số vào khoảng 1/20.000 trẻ sơ sinh. Gen gây khối u võng mạc (RB) nằm trên NST số 13, trong khi alen kiểu dại bình thường (RB+) mã hóa cho một loại protein điều hòa sự phát triển và biệt hóa của võng mạc. Các tế bào trong mắt cần ít nhất một bản sao của alen kiểu dại để duy trì sự điều hòa hoạt động phân chia của tế bào. Một đột biến trong alen RB+ có thể dẫn đến làm hỏng chức năng của alen kiểu dại và được ký hiệu là RB-. Nếu một tế bào mất đi cả hai bản sao của RB+, thì nó mất đi khả năng điều hòa hoạt động phân chia tế bào bình thường và gây nên sự hình thành khối u. Ví lý do này, alen kiểu dại RB+ có được xem là một gen ức chế sự hình thành khối u.
Những cá thể có bản chất di truyền có nguy cơ ung thư võng mạc được sinh ra mang một alen RB+ duy nhất. NST số 13 thứ hai của họ hoặc chỉ mang alen RB- hoặc hoàn toàn không có gen RB. Nếu một tác nhân đột biến (ví dụ: chiếu xạ) hay một lỗi xảy ra trong quá trình nguyên phân làm mất đi alen RB+ . Ở một tế bào trong một hoặc hai mắt thì khối u võng mạc sẽ bắt đầu phát triển từ vị trí tế bào sai hỏng. Một nghiên cứu ở các bệnh nhân bị bệnh u võng mạc cho thấy sự xuất hiện của các tế bào mắt với kiểu gen đồng hợp tử RB-/RB-, trong khi tế bào bạch cầu của người bệnh là dạng dị hợp tử RB+/RB-. Như minh họa ở hình A, một TĐC trong nguyên phân giữa gen RB và tâm động của nhiễm sắc thể mang gen là cơ chế gây nên sự hình thành tế bào mang kiểu gen RB-/RB-. Khi tế bào này hình thành, nó được phân chia một cách không được kiểm soát và dẫn đến sự hình thành khối u.
Chỉ có 40% trường hợp bị bệnh ung thư võng mạc là có cơ chế gây bệnh như trên, còn 60% còn lại khi sinh ra có kiểu gen bình thường là RB+/RB+. Ở những người này, hai đột biến phải cùng xảy ra ở cả hai bản sao của gen RB mới gây nên ung thư. Đột biến đầu tiến có thể dẫn đến alen RB+ bị chuyển thành RB-, còn sau đó các tế bào con xảy ra TĐC trong quá trình nguyên phân và dẫn đến sự phát triển ung thư do alen đột biến bị “đồng hợp tử” hóa.
Đáng chú ý là TĐC trong nguyên phân gây nên sự hình thành một số bệnh ung thư võng mạc đã giúp giải thích sự biểu hiện mức độ bệnh lý khác nhau. Những trẻ sơ sinh có kiểu gen RB+/RB- có thể không bị bệnh. Hoặc khi mắc bệnh, sự phát triển của khối u có thể xảy ra ở cả hai mắt, nhưng cũng có thể chỉ xảy ra ở một mắt. Tất cả những hiện tượng đó phụ thuộc vào việc tế bào nào trong cơ thể xảy ra hiện tượng TĐC trong nguyên phân.
2) Đột biến gen mã hóa các protein cảm thụ ánh sáng và thị lực
Những nghiên cứu đầu tiên mô tả sự bất thường trong khả năng cảm thụ ánh sáng ở người được bắt đầu từ khoảng 200 năm trước. Thời đó, người ta phát hiện ra nhiều đột biến có thể gây ảnh hưởng đến thị lực ở người. Bằng việc phân tích các kiểu hình liên quan đến mỗi loại đột biến và sau đó kiểm tra sự biến đổi của ADN. Ngày nay, chúng ta đã có những hiểu biết chi tiết hơn về cơ chế di truyền phân tử của tính trạng cảm nhận ánh sáng, màu sắc và các loại protein mà những gen này mã hóa.
Có một số dạng bệnh rối loạn cảm nhận màu sắc khác nhau ở người đã giúp việc phân tích và làm sáng tỏ cơ chế cảm nhận màu sắc ở người. Đầu tiên, các nhà nghiên cứu nhận biết và mô tả sự khác biệt trong cách những người có rối loạn về cảm nhận màu sắc nhìn thấy sự vật từ sự khác biệt nhỏ khi nhìn thấy mức độ màu đỏ, tới việc không phân biệt được màu đỏ và màu xanh lục, đến việc không nhìn thấy bất cứ màu nào. Thứ hai, sự phát triển khoa học tâm - sinh lý học cung cấp các phép thử để xác định và so sánh chính xác các kiểu hình. Chẳng hạn, một phép phân tích dựa trên sự kiện là mọi người có thể cảm nhận mỗi một màu như sự hòa trộn của ba dải bước sóng cơ bản tương ứng với màu đỏ, xanh dương (xanh lam) và xanh lục và có thể điều chỉnh tỉ lệ cường độ sáng của ba màu này để thu được một dải bước sóng tương ứng với một màu thứ tư, chẳng hạn màu vàng. Một người với thị lực bình thường, sẽ chọn một tỉ lệ màu thích hợp của màu đỏ và màu xanh lục để tạo nên màu vàng đặc thù, nhưng nếu một người không có khả năng phân biệt màu đỏ với màu xanh lục thì mọi sự kết hợp giữa hai màu này sẽ chỉ cho ra một màu giống nhau. Cuối cùng, do những biến dị di truyền liên quan đến thị giác hiếm khi gây ảnh hưởng đến hoạt động sinh sản hay tuổi thọ trong các xã hội người hiện đại, những đột biến này có thể tạo ra nhiều alen mới làm thay đổi khả năng cảm nhận màu sắc và những alen đột biến này được duy trì lâu dài trong quần thể.
a) Cơ sở phân tử và tế bào của sự cảm nhận màu sắc ở mắt
Các tế bào cảm nhận ánh sáng và màu sắc
Chúng ta cảm nhận được hình ảnh qua các nơron thần kinh ở võng mạc phần phía sau nhãn cầu (hình 8a). Những nơron này có hai loại: tế bào hình nón và tế bào hình que. Các tế bào hình que chiếm 95% số lượng các tế bào cảm nhận ánh sáng và được kích thích bởi các ánh sáng yếu trong các bước sóng ánh sáng. ở cường độ sáng lớn hơn, các tế bào hình que bị bão hòa và không còn chức năng gửi các tín hiệu thêm nữa đến não bộ. Lúc này, các tế bào hình nón sẽ tiếp quản chức năng này, xử lý các bước sóng ánh sáng của cường độ sáng mạnh và giúp chúng ta có thể phân biệt được các màu sắc. Các tế bào hình nón có ba loại. Loại thứ nhất chuyên hóa để cảm nhận ánh sáng đỏ, loại thứ hai cảm nhận ánh sáng xanh lục và loại thứ ba cảm nhận ánh sáng xanh dương. Đối với mỗi tế bào thụ quan ánh sáng như vậy, hoạt động cảm nhận ánh sáng bao gồm sự hấp thụ các photon từ ánh sáng ở một dải bước sóng nhất định, chuyển các thông tin về số lượng và năng lượng của các photon thành các tín hiệu điện, và chuyển các tín hiệu đó qua tế bào thần kinh thị giác tới bộ não.
Bốn gen mã hóa bốn chuỗi polypeptit cảm nhận màu sắc
Các protein cảm nhận photon và khởi đầu quá trình truyền tín hiệu trong các tế bào hình nón là rhodopsin. Protein này là một chuỗi polypeptit duy nhất gồm 348 axit amin xếp thành một chuỗi zigzag xuyên màng tế bào (hình 8.b.1). Một axit amin lysine nằm trong chuỗi liên kết với một phân tử carotenoid sắc tố trên võng mạc có khả năng hấp thụ photon. Các axit amin ở gần vùng liên kết võng mạc cấu trúc nên vị trí hoạt động của rhodopsin. Bằng việc thay đổi vị trí võng mạc qua một cơ chế đặc biệt, các rhodopsin xác định sự đáp ứng lại ánh sáng của các tế bào võng mạc. Mỗi một tế bào hình que thường chứa khoảng 100 triệu phân tử rhodopsin trên lớp màng đặc thù của nó. Gen mã hóa tổng hợp rhodopsin ở người nằm trên NST số 3.
Protein có vai trò cảm nhận và khởi đầu quá trình truyền tín hiệu trong các tế bào hình nón đối với photon màu xanh dương có liên quan đến rhodopsin. Protein này cũng là một chuỗi polypeptit duy nhất gồm 348 axit amin và bao quanh một phân tử sắc tố của võng mạc. Gần 50% trên phân tử protein cảm nhận ánh sáng xanh dương là giống hệt trình tự của rhodopsin; phần còn lại có sự khác biệt giữa hai protein này và là phần đặc thù cho sự cảm nhận ánh sáng màu xanh dương (hình 8.b.2). Gen mã hóa protein cảm nhận ánh sáng xanh dương nằm trên NST số 7.
Cũng có quan hệ với protein rhodopsin là các protein cảm nhận ánh sáng màu đỏ và xanh lục nằm trong các tế bào hình nón màu đỏ và xanh lục. Hai protein này cũng chỉ gồm một chuỗi polypeptit duy nhất, gồm 364 axit amin, cũng liên kết với võng mạc và nằm xuyên qua màng tế bào (các hình 8.b.3 và 4). Cũng giống như protein cảm nhận màu xanh dương, các protein cảm nhận màu đỏ và xanh lục có khoảng gần 50% trình tự axit amin giống với rhodopsin; các protein này chỉ khác biệt nhau trung bình 4 / 100 axit amin. Mặc dù chỉ khác biệt nhau nhỏ như vậy, những protein này đủ để để biệt hóa hai loại tế bào hình nón mẫn cảm với các photon ánh sáng thuộc bước sóng khác nhau, là các tế bào hình nón màu đỏ và xanh lục. Cả hai gen mã hóa cho các protein màu đỏ và xanh lục đều nằm trên NST X thành một chuỗi kế tiếp nhau. Phần lớn mỗi NST X trong tế bào ở người mang một gen duy nhất mã hóa protein cảm nhận ánh sáng đỏ, còn có từ một đến ba bản sao gen mã hóa protein cảm nhận ánh sáng xanh lục.
Họ gen rhodopsin hình thành do hiện tượng lặp đoạn và phân ly
Sự giống nhau về cấu trúc và chức năng giữa bốn loại protein rhodopsin cho thấy các gen mã hóa các chuỗi polypeptit này xuất hiện do hiện tượng lặp đoạn của một gen thụ thể cảm nhận ánh sáng tiền thân, rồi sau đó phân ly do sự tích lũy của nhiều đột biến. Các đột biến thúc đẩy khả năng cảm nhận màu sắc đã được ưu tiên chọn lọc qua quá trình tiến hóa hàng triệu năm. Các protein cảm nhận ánh sáng đỏ và xanh lục giống nhau hơn cả, và chỉ khác nhau khoảng 15 axit amin. Điều này cho thấy hai gen này chỉ phân ly trong thời gian gần đây. Sự khác biệt của hai protein này so với protein cảm nhận màu xanh dương và rhodopsin cho thấy các protein này phân ly sớm hơn trong quá trình tiến hóa từ gen mã hóa thụ thể cảm nhận ánh sáng tiền thân (hình 8.d).
b) Các đột biến ở họ gen rhodopsin gây ảnh hưởng đến thị lực và khả năng cảm nhận màu sắc
Nhiều đột biến thay thế axit amin ở gen rhodopsin gây nên bệnh mù một phần hay mù hoàn toàn
Người ta đã phát hiện được ít nhất 29 loại đột biến axit amin duy nhất trong gen mã hóa rhodopsin gây nên một nhóm bệnh di truyền trội nằm trên NST thường được gọi chung là các bệnh loạn sắc tố võng mạc (retinitis pigmentosa) với những triệu chứng đầu tiên là sự mất chức năng của các tế bào hình que, rồi dẫn đến sự thoái hóa dần dần của các tế bào võng mạc ngoại vi. Những đột biến này thường gây nên sự hình thành protein rhodopsin không được gấp nếp theo đúng cấu trúc không gian thông thường, hoặc trở nên kém bền vững. Do protein rhodopsin bình thường là thành phần cấu trúc quan trọng của màng tế bào hình que, những protein đột biến mất chức năng này được duy trì trong tế bào những không được gắn vào màng tế bào như bình thường. Các tế bào hình que không có đủ rhodopsin ở trên màng thường bị chết sau đó. Tùy thuộc vào số tế bào hình que bị chết, mà người bệnh có thể bị mù hoàn toàn hay mù một phần.
Các đột biến khác ở gen mã hóa rhodopsin gây nên một dạng bệnh lý ít nghiêm trọng hơn là bệnh mù ban đêm. Các đột biến có mức độ đa hình cao này làm thay đổi trình tự của các axit amin trong phân tử protein theo hướng làm tăng ngưỡng ánh sáng kích thích cần thiết để khởi đầu chuỗi truyền tín hiệu cảm nhận ánh sáng. Với những thay đổi này, khi cường độ ánh sáng yếu, mắt không cảm nhận được màu sắc.
Các đột biến trong gen mã hóa các sắc tố của tế bào hình nón làm thay đổi thị lực theo một số cách có thể phỏng đoán được
Các rối loạn thị lực gây ra bởi các đột biến liên quan đến các gen sắc tố thuộc tế bào hình nón ít nghiêm trọng hơn so với các rối loạn thị lực gây ra bởi các đột biến tương tự xảy ra với các gen rhodopsin trong các tế bào hình que. Nguyên nhân chủ yếu có lẽ bởi vì các tế bào hình que chiếm đến 95% số nơron thần kinh cảm nhận màu sắc ở người, trong khi các tế bào hình nón chỉ chiếm 5%. Một số đột biến liên quan đến gen mã hóa protein cảm nhận màu xanh dương nằm trên NST số 7 gây nên hội chứng rối loạn thị lực sắc tố xanh (tritanopia). Các đột biến ở gen mã hóa protein cảm nhận sắc tố đỏ trên NST X có thể làm mất chức năng cảm nhận màu đỏ của các tế bào hình nón và gây bệnh mù màu đỏ. Với một số đột biến nhỏ khác liên quan đến gen quy định protein cảm nhận màu đỏ có thể gây nên bệnh mù màu đỏ một phần hoặc hoàn toàn tùy vào vị trị đột biến.
Trao đổi chéo không cân bằng giữa các gen mã hóa protein xanh lục và đỏ gây nên phần lớn các biến dị về tính trạng cảm nhận màu sắc
Một người có thị lực bình thường thông thường có một gen mã hóa protein cảm nhận màu đỏ. Một số trong những người bình thường này có một gen xanh lục nằm gần kề, còn một số người khác có số gen xanh lục dao động từ hai đến năm bản sao. Các gen đỏ và xanh lục giống nhau đến 96% về trình tự ADN. Các gen màu xanh lục khác nhau giống nhau đến 99,9%. Do sự giống nhau và nằm gần nhau của những gen này nên hiện tượng trao đổi chéo không tương đồng dễ xảy ra với những gen này. Hàng loạt các dạng TĐC khác nhau ở vùng gen này có thể tạo ra các kiểu hình đột biến thiếu vắng hoàn toàn gen màu đỏ, hoặc gen màu xanh lục, có sự tổ hợp khác nhau của các gen màu xanh lục, mang gen lai xanh lục - đỏ. Do khả năng cảm nhận màu đỏ và xanh lục phụ thuộc vào tỉ lệ ánh sáng đỏ và xanh lục được phản chiếu từ hình ảnh, những người thiếu các gen đỏ và xanh lục sẽ cảm nhận màu đỏ và xanh lục là một màu giống nhau.
Một số đột biến có thể làm mất hoàn toàn khả năng nhìn màu đỏ và xanh lục
Đến nay, các nhà di truyền học đã tìm thấy bảy loại đột biến mất đoạn gây bệnh mù màu đỏ và xanh lục liên kết với NST giới tính X. Bệnh lý này được gọi là hội chứng tế bào hình nón đơn sắc xanh dương (blue cone monochromacy), bởi những người này chỉ cảm nhận được màu liên quan đến màu xanh dương. Nghiên cứu phân tử cho thấy cả bảy đột biến mất đoạn này đều liên quan đến một đoạn trình tự gồm 600 bp nằm ngoài vùng mã hóa của các gen đỏ và xanh lục. Điều này cho thấy khả năng trình tự này là một đoạn trình tự (gen) điều hòa dài cần thiết cho sự biểu hiện của chuỗi các gen đỏ và xanh lục.
Tóm lại, chúng ta nhìn được và cảm nhận được các màu sắc đa dạng, phong phú của vạn vật một phần là nhờ bốn gen trực tiếp tạo ra bốn loại phân tử protein trong các tế bào hình que và hình nón ở võng mạc mắt. Các đột biến làm thay đổi những chuỗi polypeptit này hoặc số lượng của chúng đều có thể làm thay đổi hoặc làm hỏng thị lực hoặc khả năng cảm nhận màu sắc của mắt.
V. Phân tích gen và sản phẩm của gen
V.1. Các kỹ thuật phân tích axit nucleic
V.1.1. Điện di phân tích ADN và ARN
Có nhiều phương pháp khác nhau có thể được sử dụng để phân tích ADN và ARN, nhưng cho đến nay điện di trên gel là phương pháp được sử dụng phổ biến hơn cả nhờ ưu điểm nhanh và tương đối đơn giản. Nguyên tắc của phương pháp là do: dưới tác động của điện trường, các phân tử ADN (thường tích điện âm) khác nhau về kích thước, điện tích, mức độ cuộn xoắn và dạng phân tử (mạch thẳng hay mạch vòng) sẽ di chuyển qua hệ mạng của gel từ cực âm (cathode) sang cực dương (anode) với tốc độ di chuyển khác nhau. Vì vậy, chúng dần dần tách nhau ra trên trường điện di, qua đó người ta có thể thu thập và phân tích được từng phân đoạn ADN hoặc gen riêng rẽ. Trên điện trường các phân đoạn ADN có kích thước càng nhỏ càng có tốc độ di chuyển trên điện trường nhanh hơn. Sau khi điện di kết thúc, các phân tử ADN có thể quan sát thấy nhờ sử dụng các thuốc nhuộm phát huỳnh quang, chẳng hạn như ethidium (chất này gắn kết với ADN bằng cách cài vào khe ở giữa các nucleotit). Mỗi một băng điện di thường phản ánh một tập hợp các phân tử ADN có cùng kích thước.
Có hai loại vật liệu làm gel được sử dụng phổ biến trong điện di, đó là agarose và polyacrylamid. Trong đó, gel polyacrylamid có khả năng phân tách cao, nhưng khoảng kích thước ADN có thể phân tích hẹp. Vì vậy, điện di trên gel polyacrylamid có thể phân tách được các phân đoạn ADN khác nhau thậm trí chỉ một cặp nucleotit (1 bp) duy nhất, nhưng thường chỉ để phân tích các đoạn ADN kích thước vài trăm bp. Còn gel agarose có khả năng phân tách thấp hơn đối với các phân đoạn ADN kích thước nhỏ, nhưng rất hiệu quả khi phân tách các phân đoạn ADN kích thước lớn tới hàng chục hoặc hàng trăm kb (1 kb = 1000 bp).
Các phân đoạn ADN kích thước lớn không thể “lọt” qua các lỗ có kích thước nhỏ trên các bản gel, kể cả gel agarose. Thay vào đó, chúng sẽ “trườn” qua mạng lưới của gel bằng việc đầu này của phân tử đi trước, còn đầu kia theo sau. Kết quả là các phân đoạn ADN kích thước lớn (từ 30 đến 50 kb) có tốc độ di chuyển trên điện trường gần như tương đương và khó phân tách được bằng phương pháp điện di thông thường. Đối với các phân đoạn ADN kích thước lớn như vậy, người ta có thể phân tách bằng việc sử dụng phương pháp điện di xung trường (pulsed-field gel electrophoresis). Trong phương pháp này, người ta sử dụng 2 cặp điện cực nằm chéo góc trên bản điện di . Việc “bật” và “tắt” luân phiên 2 cặp điện cực sẽ làm cho các phân đoạn ADN lớn thay đổi chiều. Các phân đoạn ADN có kích thước càng lớn càng chậm hơn trong quá trình thay đổi chiều di chuyển. Nhờ vậy, các phân đoạn có kích thước khác nhau sẽ phân tách ra khỏi nhau trong quá trình di chuyển. Kỹ thuật điện di xung trường trong thực tế có thể sử dụng để xác định được kích thước đầy đủ của nhiễm sắc thể vi khuẩn, hoặc nhiễm sắc thể các loài sinh vật nhân chuẩn bậc thấp, như nấm men. Những loài này có kích thước hệ gen khoảng vài Mb.
Điện di không những có thể phân tách các phân đoạn ADN khác nhau về kích thước mà cả về hình dạng và cấu hình không gian của chúng. Các phân tử ADN ở dạng mạch vòng giãn xoắn hoặc bị “đứt gãy” ở một số nucleotit di chuyển chậm hơn trên trường điện di so với các phân tử ADN ở dạng mạch thẳng có cùng khối lượng. Tương tự như vậy, các phân tử ADN ở dạng siêu xoắn, kích thước và thể tích thu nhỏ thường di chuyển nhanh hơn trên trường điện di so với các phân tử ADN dạng mạch vòng giãn xoắn hoặc có mức độ cuộn xoắn thấp hơn có cùng khối lượng.
Kỹ thuật điện di cũng được sử dụng để phân tách các phân tử ARN. Các phân đoạn ADN sợi kép mạch thẳng có cấu trúc bậc hai đồng nhất nên tốc độ di chuyển trên trường điện di tương quan tỉ lệ thuận với khối lượng phân tử của chúng. Cũng giống như ADN, các phân tử ARN cũng thường tích điện âm, nhưng ngoài cấu trúc cơ bản ở dạng mạch đơn, các cấu trúc bậc 2 và 3 của phân tử ARN có ảnh hưởng đến tốc độ di chuyển của chúng trên trường điện di. Để hạn chế điều này, thông thường người ta phải xử lý ARN với một số hóa chất ngăn cản sự hình thành các liên kết cục bộ trong phân tử ARN, chẳng hạn như glyoxal. Hợp chất này liên kết với nhóm -NH2 trong các bazơ nitơ và ngăn cản sự kết cặp của các nucleotit. Các phân tử ARN được xử lý glyoxal không hình thành được các cấu trúc bậc 2 và 3 vì vậy có tốc độ di chuyển trên trường điện di dường như đơn thuần phụ thuộc vào khối lượng phân tử của chúng.
V.1.2. Sử dụng enzym giới hạn trong phân tích ADN
Hầu hết các phân tử ADN trong tự nhiên đều lớn hơn nhiều so với kích thước có thể thao tác và phân tích một cách thuận lợi trong phòng thí nghiệm. Trong các tế bào, phần lớn các nhiễm sắc thể thường là một phân tử ADN dài chứa hàng trăm thậm trí hàng nghìn gen khác nhau. Vì vậy, để có thể phân lập và phân tích từng gen, người ta phải cắt các phân tử ADN kích thước lớn thành các phân đoạn nhỏ. Công việc này được thực hiện bởi một nhóm các enzym đặc biệt gọi là enzym giới hạn.
Tất cả các enzym giới hạn đều có hai đặc tính: 1) nhận biết một trình tự đặc hiệu trên phân tử ADN (gọi là trình tự giới hạn); và 2) cắt bên trong phân tử ADN tại vị trí đặc hiệu (hoặc ngay tại vị trí giới hạn như đối với nhóm enzym giới hạn loại ; hoặc cách vị trí giới hạn một số nucleotit nhất định như đối với các nhóm enzym giới hạn thuộc các nhóm và ). Trong các nhóm enzym giới hạn, nhóm thường được dùng trong các nghiên cứu di truyền phân tử và kỹ nghệ gen là nhóm nhờ vị trí và trình tự cắt của chúng được xác định rõ. Vì vậy chúng ta chỉ đề cập đến việc ứng dụng của nhóm enzym giới hạn này. Các trình tự giới hạn của enzym nhóm thường gồm 4 - 8 bp, thông thường có tính đối xứng và vị trí cắt thường nằm trong trình tự giới hạn này. Ví dụ như enzym giới hạn coR được tìm thấy ở vi khuẩn E. coli có trình tự giới hạn là 5’-GAATTC- 3’ với vị trí cắt ở giữa G và A. Tên enzym gồm 3 ký tự đầu chỉ tên loài vi khuẩn mà từ đó enzym được tìm thấy (Eco = Escherichia coli), các ký tự sau chỉ tên của chủng vi khuẩn và số thứ tự của enzym được tìm thấy ở loài vi khuẩn đó (EcoRI
là enzym giới hạn đầu tiên được tìm thấy ở E. coli).
Một enzym giới hạn có trình tự giới hạn gồm 6 bp giống EcoRI thông thường được trông đợi sẽ có trung bình một vị trí cắt trong một đoạn trình tự có kích thước khoảng 4 kb (bởi theo nguyên tắc xác suất tại một vị trí nhất định xác suất để có một loại nucleotit nhất định là 1/4, vì vậy xác suất để có một trình tự nhất định gồm 6 bp sẽ là 1/46 = 1/4096). Giả sử có một phân tử ADN mạch thẳng có 6 vị trí cắt của enzym EcoRI. Việc cắt phân tử ADN này bằng EcoRI sẽ cho ra 7 phân đoạn ADN khác nhau. Do đó, khi điện di trên gel sản phẩm cắt, 7 phân đoạn ADN sẽ phân tách nhau ra do chúng khác nhau về khối lượng (vì chúng khác nhau về thành phần và trình tự các nucleotit). Như vậy, một phân đoạn ADN sẽ tương ứng với một vùng của phân tử ADN ban đầu.
Việc sử dụng một enzym giới hạn khác, chẳng hạn HindIII cũng có trình tự giới hạn gồm 6 bp, nhưng có trình tự giới hạn thay đổi (5’-AAGCTT- 3’) sẽ cho ra các sản phẩm cắt khác với khi sử dụng EcoRI (với cùng phân tử ADN ban đầu). Như vậy, việc sử dụng đồng thời nhiều enzym giới hạn sẽ tạo ra một kiểu hình phổ điện di các phân đoạn cắt giới hạn đặc thù đối với từng gen phân tích.
Đối với một số enzym giới hạn khác, chẳng hạn như Sau3A1 (tìm thấy ở vi khuẩn Staphylococcus aureus) có trình tự giới hạn ngắn hơn (5’-GATC-3’), nên tần số cắt của chúng thường cao hơn các enzym có trình tự giới hạn dài. Theo xác suất, Sau3A1 có trung bình 1 vị trí cắt trong một đoạn trình tự khoảng 250 bp (1/44 = 1/256). Ngược lại, enzym NotI có trình tự giới hạn dài (5’-GCGGCCGC-3’) trung bình cứ một đoạn trình tự dài khoảng 65 kb, mới có 1 vị trí cắt (1/48 = 1/65536).
Các enzym giới hạn không chỉ khác nhau về trình tự giới hạn và độ dài đoạn trình tự giới hạn đặc trưng của chúng, mà chúng còn khác nhau về cách “cắt” phân tử ADN. Chẳng hạn như enzym HpaI tạo ra các phân tử ADN dạng đầu bằng (đầu tù), còn các enzym ERcoRI, HindIII và PsIt cắt phân tử ADN tạo ra các phân đoạn có đầu dính. Sở dĩ gọi là “đầu dính” bởi phần các trình tự ở hai đầu sau khi được enzym cắt ra bổ trợ với nhau theo nguyên tắc Chargaff và vì vậy chúng có xu hướng “dính” trở lại với nhau, hoặc với các phân tử ADN được cắt bởi cùng một loại enzym giới hạn. Tính chất này được ứng dụng rộng rãi trong công nghệ ADN tái tổ hợp và các kỹ thuật tách dòng phân tử.
V.1.3. Các phương pháp lai phân tử và mẫu dò
Các phân tử ADN sợi kép có một tính chất đặc biệt là khả năng biến tính (phân tách thành hai mạch đơn) và hồi tính (hai mạch đơn có trình tự bổ trợ có xu hướng liên kết trở lại khi vắng mặt các tác nhân gây biến tính). Khả năng liên kết bổ trợ giữa các bazơ nitơ cũng cho phép hai mạch ADN có nguồn gốc khác nhau nhưng có trình tự bổ trợ liên kết với nhau trong điều kiện phù hợp (về nhiệt độ, độ pH, ion hóa P) để tạo nên một phân tử ADN mới. Hiện tượng liên kết như vậy cũng có thể xảy ra giữa hai mạch ADN với nhau, hoặc giữa hai mạch ARN hoặc giữa ADN và ARN. Phân tử axit nucleic sợi kép mới hình thành được gọi là phân tử lai và quá trình kết cặp giữa các bazơ thuộc hai mạch đơn axit nucleic có nguồn gốc khác nhau theo nguyên tắc bổ trợ như vậy được gọi là quá trình lai phân tử.
Nhiều kỹ thuật trong nghiên cứu di truyền phân tử được dựa trên nguyên tắc lai phân tử. Chẳng hạn, bằng nguyên tắc này người ta có thể dùng một trình tự ADN biết trước để xác định một trình tự bổ trợ tương ứng có trong hệ gen của mẫu phân tích. Phân đoạn ADN có trình tự biết trước dùng trong phản ứng lai như vậy được gọi là mẫu dò. Các mẫu dò có thể có nguồn gốc từ các phân đoạn ADN trong tự nhiên hoặc được tổng hợp theo nguyên tắc hóa học, và để nhận biết được chúng, các mẫu dò thường được đánh dấu với các chất phóng xạ hoặc phát huỳnh quang (ở đây, gọi tắt là chất phát quang).
Có hai phương pháp đánh dấu mẫu dò ADN. Phương pháp thứ nhất dùng nguyên tắc tổng hợp hóa học phân tử ADN mới với tiền chất là các phân tử đánh dấu. Phương pháp thứ hai là gắn một phân tử đánh dấu vào đuôi của một trình tự ADN có sẵn. Chẳng hạn, bằng việc sử dụng enzym polynucleotide kinase, người ta có thể bổ sung nhóm phosphat g của ATP vào nhóm 5’- OH của một phân tử ADN định đánh dấu. Nếu nhóm phosphat này được đánh dấu bằng đồng vị phóng xạ 32P thì phân tử ADN sẽ được dánh dấu phóng xạ.
Phương pháp đánh dấu ADN thứ hai (sử dụng các tiền chất đánh dấu) thường được thực hiện dựa trên phản ứng PCR, hoặc đôi khi chỉ cần sử dụng các đoạn mồi ngắn rồi cho enzym ADN polymerase thực hiện phản ứng kéo dài chuỗi. Các tiền chất đánh dấu được sử dụng thường là 1 trong 4 loại nucleotit được cải biến thành dạng được đánh dấu bằng cách gắn với các nhóm chất phát quang hoặc nguyên tử phóng xạ. Với phương pháp này, khoảng 25% nucleotit trong phân tử ADN được đánh dấu và điều đó đủ đáp ứng hầu hết các nhu cầu nghiên cứu khác nhau.
Các phân tử ADN đánh dấu với các tiền chất phát quang được phát hiện bằng cách chiếu xạ mẫu ADN với ánh sáng UV có bước sóng phù hợp và đo ở bước sóng phát xạ tương ứng. Các phân tử ADN được đánh dấu phóng xạ thường được phát hiện bằng cách chụp mẫu ADN với phim tia X, hoặc đo bằng máy khuếch đại tín hiệu hạt b từ các nguyên tố phóng xạ 32P và 35S (đây là hai nguyên tố phóng xạ được sử dụng phổ biến để dánh dấu ADN).
Trong các nghiên cứu di truyền học phân tử hiện nay, có nhiều cách để xác định các phân đoạn ADN và ARN đặc hiệu dựa trên các phương pháp lai. ở đây, chúng ta chỉ đề cập đến hai phương pháp được dùng phổ biến:
Xác định các phân đoạn ADN và ARN bằng điện di và mẫu dò
Phương pháp sử dụng mẫu dò kết hợp với điện di là một phương pháp cơ bản có thể giúp xác định mức độ phổ biến hoặc kích thước của một đoạn trình tự ADN hoăc ARN được quan tâm nghiên cứu. Chẳng hạn như bằng kỹ thuật này, người ta có thể xác định và so sánh được mức biểu hiện của một gen ở các loại tế bào và mô khác nhau thông qua định lượng bản phiên mã mARN tương ứng của gen đó tại các tế bào và mô tương ứng; hay như để xác định kích thước của một đoạn ADN cắt giới hạn mang trình tự gen được quan tâm nghiên cứu.
Giả sử chúng ta cắt hệ gen của nấm men bằng enzym giới hạn EcoR và cần xác định được kích thước của phân đoạn ADN cắt giới hạn mang trình gen A. Sản phẩm ADN tổng số sau khi được cắt bằng EcoR
sẽ tạo ra một số lượng lớn các phân đoạn có kích thước xấp xỉ 4 kb (vì 46 = 4096 bp). Vì vậy, nếu đem sản phẩm cắt giới hạn nhuộm với tBr, thì sản phẩm điện di sẽ là một dải các phân đoạn liên tục có kích thước xấp xỉ 4 kb, và không thể xác định được chính xác phân đoạn nào mang gen A. Trong trường hợp đó, kỹ thuật thẩm tách Southern (còn gọi là lai Southern) có thể được dùng để xác định phân đoạn mang gen đó. Lúc này, người ta sẽ đem sản phẩm cắt giới hạn ngâm vào một dung dịch có tính kiềm để làm biến tính các phân đoạn ADN sợi kép. Các phân đoạn này sau đó được chuyển sang một màng tích điện dương gọi là màng "thẩm tách" theo hình thức "đóng dấu". Nghĩa là các phân đoạn ADN định vị trên màng thẩm tách sẽ tương ứng với các phân đoạn định vị trên gel điện di. Các phân đoạn ADN gắn trên màng thẩm tách sau đó được ủ với mẫu dò là phân đoạn ADN chứa một đoạn trình tự đặc trưng bổ trợ với trình tự của gen A. Quá trình ủ được tiến hành trong điều kiện về nhiệt độ và nồng độ muối tương ứng với sự biến tính và hồi tính của axit nucleic. Trong điều kiện như đó, các mẫu dò sẽ chỉ lai đặc hiệu với phân đoạn ADN mang gen A. Do các phân đoạn gen có kích thước thường lớn hơn nhiều so với mẫu dò, nên khả năng hồi tính khó xảy ra hơn khả năng lai với mẫu dò. Sau đó, nhờ phương pháp phóng xạ tự chụp (mẫu dò được đánh dấu phóng xạ), các phân đoạn ADN bắt cặp với các mẫu dò có thể được xác định và phân lập rõ ràng. Các phân đoạn này chính là các phân đoạn mang trình tự gen A cần phân tích.
Một phương pháp tương tự như vậy cũng có thể được áp dụng trực tiếp để phân tích các sản phẩm phiên mã của gen là mARN, và được gọi là phương pháp thẩm tách Northern (lai Northern). Tuy vậy, vì so với ADN các phân tử mARN thường có kích thước ngắn hơn (khoảng 5 kb), nên trong thẩm tách Northern, các phân tử mARN không cần cắt bằng enzym giới hạn (nếu có cắt thì số vị trí cắt giới hạn của một enzym trên phân tử mARN thường thấp). Các phân tử mARN sau khi phân tách bằng điện di được chuyển lên màng tích điện dương và lai với các mẫu dò ADN có trình tự bổ trợ tương ứng thường được đánh dấu phóng xạ (trong trường hợp này, sản phẩm lai là do sự kết cặp của các bazơ nitơ thuộc hai mạch ARN và ADN có trình tự bổ trợ).
Trong thực tiễn nghiên cứu, phương pháp thẩm tách Northern thường được sử dụng để định lượng một loại phân tử mARN nhất định nào đó có trong một mẫu phân tích, hơn là để xác định kích thước của nó. Lượng mARN được xác định được xem như thông số cơ bản phản ánh mức độ biểu hiện của gen mã hóa tương ứng. Chẳng hạn như, bằng phương pháp thẩm tách Northern, các nhà nghiên cứu có thể đánh giá được ảnh hưởng của một tác nhân phiên mã nào đó đến sự biểu hiện của một gen nhất định khi tiến hành so sánh lượng mARN do gen đó mã hóa có trong các tế bào được xử lý và không được xử lý với tác nhân phiên mã. Tương tự như vậy, kỹ thuật này cho phép xác định và so sánh mức độ biểu hiện của các gen khác nhau ở các loại tế bào, mô và cơ quan khác nhau của cùng một cơ thể trong cùng một giai đoạn hoặc ở các giai đoạn khác nhau của quá trình phát triển cơ thể.
Trong kỹ thuật thẩm tách Northern, mẫu dò thường được đưa vào phản ứng lai với một lượng dư vừa đủ để đảm bảo lượng phân tử lai tạo thành tương ứng với lượng mARN có mặt trong các mẫu nghiên cứu. Hay nói cách khác, qua lượng sản phẩm lai, có thể định lượng được lượng mARN.
Nguyên lý của các phương pháp lai Northern và Southern cũng chính là cơ sở của các kỹ thuật phân tích gen bằng vi dãy phản ứng (microarray) được phát triển và ngày các được sử dụng rộng rãi trong các nghiên cứu di truyền học phân tử gần đây. Trong các phương pháp microarray, các mẫu dò thường là các đoạn cADN được tạo ra từ việc phiên mã ngược các phân tử mARN tương ứng được tách chiết từ các mô hoặc tế bào. Các mẫu dò này sau đó được tiến hành lai với một dãy các phân tử ADN, trong đó mỗi dãy thường liên quan đến một hoặc một số gen khác nhau trong cơ thể sinh vật nghiên cứu. Cường độ biểu hiệu của sản phẩm lai (nhờ sự có mặt của các phân tử đánh dấu) ở các dãy khác nhau sẽ góp phần phản ánh mức độ biểu hiện khác nhau của các gen phân tích.
V.1.4. Tách dòng phân tử và xây dựng thư viện hệ gen
Khái niệm về tách dòng phân tử và thư viện hệ gen
Tách dòng phân tử (molecular cloning) là khái niệm chỉ một nhóm các phương pháp được sử dụng để: i) phân lập một một trình tự gen (ADN) đặc hiệu từ hỗn hợp các phân tử ADN ban đầu được tách chiết từ các mẫu sinh học vốn có cấu trúc phức tạp, kích thước lớn; và ii) khuếch đại (sao chép) trình tự lên một số lượng lớn đủ để có thể tiến hành phân tích về cấu trúc và chức năng của gen tương ứng.
Khả năng tinh sạch các đoạn gen (ADN) đặc hiệu có số lượng đủ lớn là cần thiết để có thể “thao tác” các đoạn gen đó vì các mục tiêu nghiên cứu khác nhau. Chẳng hạn, từ các phân đoạn ADN được tách dòng, người ta có thể tạo ra các phân tử ADN tái tổ hợp mang các phân đoạn ADN mang nguồn gốc khác nhau. Các phân tử ADN tái tổ hợp mới có thể làm thay đổi mức độ biểu hiện bình thường của một gen (chẳng hạn bằng việc dung hợp giữa một trình tự mã hóa của một loài này với trình tự promoter của một loài khác) hoặc thậm chí mã hóa tổng hợp một loại protein “dung hợp” mới (protein lai) mang các trình tự axit amin từ các protein có nguồn gốc khác nhau. Hiện nay, các kỹ thuật tách dòng phân tử (bao gồm cả PCR) đã trở thành các công cụ thiết yếu trong nghiên cứu về sự điều hòa và biểu hiện của các gen và hệ gen ở các loài sinh vật khác nhau.
Quá trình tách dòng ADN và tạo nên các phân tử ADN tái tổ hợp điển hình thường liên quan đến việc sử dụng các véctơ là trình tự mang thông tin điều khiển hoạt động nhân lên (khuếch đại) và/hoặc biểu hiện trong tế bào của phân tử ADN tái tổ hợp mang đoạn ADN cài (đoạn trình tự được phân lập) bao gồm trình tự gen được quan tâm nghiên cứu. Các “công cụ” chính để tạo nên các phân tử ADN tái tổ hợp là các enzym giới hạn giúp cắt các phân tử ADN tại các vị trí xác định và các enzym nối cho phép ghép nối các phân đoạn ADN có nguồn gốc khác nhau với nhau. Bằng việc tạo nên các phân tử ADN tái tổ hợp có thể tự nhận lên trong tế bào chủ, một đoạn ADN cài xác định nào đó
Kiến thức bổ sung và cập nhật kiến thức mới về Di truyền học. Hữu ích cho giáo viên và học sinh, xin giới thiệu cùng các bạn đồng nghiệp và các bạn học sinh.
I. GEN
I. 1. Về khái niệm
Các thông tin di truyền sinh vật cần cho quá trình sinh trưởng, phát triển và sinh sản nằm trong phân tử ADN của nó. Những thông tin này nằm trong trình tự nucleotit của ADN và được tổ chức thành các gen. Mỗi gen thường chứa thông tin để tổng hợp một chuỗi polypeptit hoặc một phân tử ARN có chức năng riêng biệt. Xét về cấu trúc, mỗi gen là một đoạn ADN riêng biệt mang trình tự bazơ thường mã hoá cho trình tự axit amin của một chuỗi polypeptit. Các gen rất khác nhau về kích thước, có thể từ dưới 100 cặp đến vài triệu cặp bazơ. ở sinh vật bậc cao, các gen hợp thành các phân tử ADN rất dài nằm trong các cấu trúc được gọi là nhiễm sắc thể. ở người có khoảng 30.000 - 40.000 gen phân bố trên 23 cặp NST, trong đó có 22 cặp NST thường (autosome) và 1 cặp NST giới tính (X và Y). Như vậy, ở người có 24 loại NST khác nhau. Trên nhiễm sắc thể, các gen thường nằm phân tán và cách biệt nhau bởi các đoạn trình tự không mã hóa. Các đoạn trình tự này được gọi là các đoạn ADN liên gen. ADN liên gen rất dài, như ở người các gen chỉ chiếm dưới 30% toàn bộ hệ gen. Xét ở mỗi gen, chỉ một mạch của chuỗi xoắn kép là mang thông tin và được gọi là mạch khuôn dùng để tạo ra phân tử ARN mang trình tự bổ trợ để điều khiển quá trình tổng hợp chuỗi polypeptit. Mạch kia được gọi là mạch không làm khuôn. Cả hai mạch trên phân tử ADN đều có thể được dùng làm mạch để mã hoá cho các gen khác nhau. Ngoài ra, người ta còn dùng một số thuật ngữ khác để chỉ mạch khuôn và mạch không làm khuôn, như mạch đối nghĩa / mạch mang nghĩa, mạch không mã hoá / mạch mã hoá. Cần chú ý là, mạch đối nghĩa và mạch không mã hóa chính là mạch khuôn để tổng hợp phân tử ARN.
Khả năng lưu giữ thông tin di truyền của ADN là rất lớn. Với một phân tử ADN có n bazơ sẽ có 4n khả năng tổ hợp trình tự bazơ khác nhau. Trong thực tế, chỉ một số lượng hạn chế các trình tự mang thông tin có ích (thông tin mã hóa các phân tử ARN hoặc protein có chức năng sinh học).
I. 2. Về tổ chức của gen
Hầu hết các gen phân bố ngẫu nhiên trên nhiễm sắc thể, tuy nhiên có một số gen được tổ chức thành nhóm, hoặc cụm. Có hai kiểu cụm gen, đó là các operon và các họ gen.
Operon là các cụm gen ở vi khuẩn. Chúng chứa các gen được điều hoà hoạt động đồng thời và mã hoá cho các protein thường có chức năng liên quan với nhau. Ví dụ như operon lac ở E. coli chứa ba gen mã hoá cho các enzym mà vi khuẩn cần để thủy phân lactose. Khi có lactose làm nguồn năng lượng (và vắng mặt glucose) thì vi khuẩn cần ba enzym do operon lac mã hoá. Sự dùng chung một trình tự khởi đầu phiên mã (promoter) của các gen trong operon (hình 1) cho phép các gen đó được điều khiển biểu hiện đồng thời và sinh vật có thể sử dụng nguồn năng lượng một cách hiệu quả.Ở các sinh vật bậc cao không có các operon, các cụm gen được gọi là các họ gen. Không giống như các operon, các gen trong một họ gen rất giống nhau, nhưng không được điều khiển biểu hiện đồng thời. Sự cụm lại của các gen trong họ gen có lẽ phản ánh nhu cầu cần có nhiều bản sao của những gen nhất định và xu hướng lặp đoạn của nhiều gen trong quá trình tiến hóa. Một số họ gen tồn tại thành nhiều cụm riêng biệt trên nhiều nhiễm sắc thể khác nhau. Hiện tượng này có lẽ là do sự tái cấu trúc ADN trong quá trình tiến hoá đã phá vỡ các cụm gen. Các họ gen có thể có cấu trúc đơn giản hoặc phức tạp. ở các họ gen đơn giản, các bản sao của gen giống hệt nhau. Ví dụ như họ gen mã hóa ARN ribosom 5S (rARN 5S). ở mỗi tế bào người, có khoảng 2000 cụm gen của gen này, phản ánh tế bào cần số lượng lớn sản phẩm của gen này (hình 2a). Trong khi đó, các họ gen phức tạp chứa các gen tương tự nhưng không giống hệt nhau. Ví dụ như họ gen globin ở người mã hóa cho cho các chuỗi polypeptit tương ứng với các loại globin a, b, g, e, và z (hình 2b) chỉ khác nhau vài axit amin. Các chuỗi polypeptit globin tương tác với nhau thành một phức hệ, và kết hợp với các phân tử hem để tạo ra hemoglobin (một loại protein vận chuyển oxy trong máu).
I.3. Trình tự khởi đầu phiên mã (promoter)
Sự biểu hiện của gen được điều khiển rất chặt chẽ. Không phải tất cả các gen có trong ADN của tế bào đều được biểu hiện đồng thời. Những gen khác nhau được hoạt hoá biểu hiện vào những thời điểm và ở những tế bào khác nhau. Tất cả các gen được biểu hiện trong một tế bào sẽ xác định đặc tính và chức năng của tế bào đó. Ví dụ, các gen biểu hiện trong tế bào cơ khác với các gen được biểu hiện trong tế bào máu. Sự biểu hiện của gen được điều khiển bắt đầu từ một đoạn trình tự ADN đứng trước (nằm ngược dòng về phía đầu 5’) so với đoạn trình tự mã hóa được gọi là trình tự khởi đầu phiên mã (promoter, còn gọi là trình tự khởi động). Đoạn trình tự khởi động chứa trình tự đặc hiệu được ARN polymerase và các protein đặc biệt gọi là các yếu tố phiên mã nhận biết để gắn vào trong quá trình phiên mã của gen. Mức độ biểu hiện của gen trong tế bào được xác định bằng mức độ gắn kết (ái lực) của ARN polymerase và các yếu tố phiên mã với promoter.
I. 4. xon và ntron
Ở các sinh vật bậc cao (sinh vật nhân chuẩn), thông tin di truyền mã hoá trên các NST thường bị phân cắt thành nhiều đoạn trình tự ADN cách biệt được gọi là các exon. Các exon bị ngăn cách bởi những trình tự không mang thông tin có ích được gọi là các intron. Số lượng các intron trong một gen biến động lớn, có thẻ từ 0 đến trên 50 phân đoạn. Độ dài của các intron và exon cũng rất biến động, nhưng các intron thường dài hơn và chiếm phần lớn trình tự của gen. Trước khi thông tin trong gen được sử dụng để tổng hợp phân tử protein tương ứng, thì các intron phải được cắt bỏ khỏi phân tử ARN nhờ quá trình được gọi là quá trình cắt bỏ (quá trình hoàn thiện phân tử mARN). Trong quá trình đó, các exon được giữ lại và nối lại với nhau thành một trình tự mã hoá liên tục.
Việc xác định các intron trong trình tự một gen có thể thực hiện được nhờ các intron điển hình có trình tự bắt đầu là 5’-GU và kết thúc là AG- 3’. Tuy vậy, thực tế ngoài những dấu hiệu này, việc cắt bỏ các intron còn cần các trình tự khác ở vùng nối giữa intron và exon (xem thêm mục I.1).
I. 6. Gen giả (pseudogene)
Có một số gen giống với các gen khác nhưng trình tự bazơ của chúng có những sai sót làm cho chúng không có khả năng chứa những thông tin sinh học hữu ích. Những gen đó được gọi là những gen giả và những sai sót hoặc đột biến trong trình tự ADN của chúng xuất hiện trong quá trình tiến hoá làm thông tin bị lẫn lộn đến mức không còn điều khiển quá trình sinh tổng hợp protein bình thường được nữa. Những gen giả là dấu vết của quá trình tiến hoá. Trải qua tiến hoá, những sự biến đổi ban đầu các bazơ gây mất thông tin được lặp đi lặp lại đến mức thậm chí trình tự bazơ của các gen giả khác hẳn với trình tự gen gốc ban đầu. Ví dụ như các gen globin giả trong các cụm gen globin.
II. Mã di truyền
II. 1. Khung đọc
Ngoài việc quy định điểm bắt đầu quá trình tổng hợp protein, bộ ba mã khởi đầu (AUG) còn xác định khung đọc của trình tự ARN. Có thể có ba bộ ba cho bất kỳ một trình tự bazơ nào, phụ thuộc vào bazơ nào được chọn làm bazơ bắt đầu của codon. Thực tế trong quá trình tổng hợp protein, thường chỉ có một khung đọc được sử dụng. Còn hai khung đọc kia thường chứa một số bộ ba kết thúc ngăn cản chúng được sử dụng để tổng hợp trực tiếp nên phân tử protein.
Mỗi trình tự ADN có thể đọc theo ba khung đọc khác nhau, phụ thuộc vào bazơ nào được chọn làm bazơ khởi đầu. Trên mỗi phân đoạn ADN mạch kép về lý thuyết có thể có tối đa sáu khung đọc mở (ORF) khác nhau.
Đoạn trình tự nằm giữa một bộ ba khởi đầu và một bộ ba kết thúc tương ứng cùng khung đọc được gọi là khung đọc mở (ORF = open reading frame). Đặc điểm này được dùng để xác định các trình tự ADN mã hoá protein trong các dự án giải mã hệ gen.
II.2. Tính vạn năng của mã di truyền
Ban đầu, người ta tin rằng mã di truyền là vạn năng. Nghĩa là ở mọi sinh vật, các codon giống nhau đều quy định những axit amin như nhau. Tuy vậy, thực tế cho thấy có một số trường hợp ngoại lệ. Ví dụ, ở hệ gen ty thể có sự khác biệt về bộ ba khởi đầu và bộ ba kết thúc. Cụ thể, UAG bình thường là bộ ba kết thúc, thì ở ty thể nó lại mã hoá cho tryptophan; AGA và AGG bình thường quy định arginin, ở ty thể lại có vai trò là các bộ ba kết thúc; AUA bình thường mã hóa cho isoleucin thì ở ty thể lại xác định methionin. Người ta cho rằng những thay đổi này có thể tồn tại được là nhờ ty thể là một hệ thống kín. Ngoài hệ gen ty thể, một số trường hợp ngoại lệ khác cũng được tìm thấy ở một số sinh vật đơn bào. Ví dụ ở một số động vật nguyên sinh, các bộ ba UAA và UAG bình thường là các bộ ba kết thúc thì lại mã hoá cho axit glutamic.
III. Sự hoàn thiện mARN ở eukaryote
III.1. Cắt bỏ các intron
Quá trình này xảy ra trong nhân nhằm cắt bỏ các trình tự intron không mã hóa khỏi phân tử tiền mARN để hình thành nên phân tử mARN hoàn chỉnh chỉ chứa các trình tự mã hoá liên tục tương ứng với các exon. Sau đó, phân tử mARN hoàn chỉnh được chuyển ra tế bào chất để làm khuôn tổng hợp protein.
Quá trình cắt bỏ intron phụ thuộc vào trình tự tín hiệu ở các đoạn nối giữa các intron và exon. Các intron điển hình được giới hạn bởi đầu 5’-GT và 3’-AG. Đoạn trình tự tín hiệu đầy đủ ở đầu 5’ gặp ở phần lớn các gen là: 5’-AGGTAAGT-3’ và ở đầu 3’ là 5’- YYYYYYNCAG-3’ (Y= pyrimidin, N = nucleotit bất kỳ).
Việc cắt bỏ các intron được thực hiện bởi một phức hệ gọi là spliceosom, gồm phân tử tiền -mARN liên kết với các hạt ribonucleoprotein nhân kích thước nhỏ snRNP (small nuclear ribonucleoprotein particle, được đọc tắt là snớp). snRNP được tạo thành tự sự liên kết giữa snARN và protein. Có 5 loại snARN phổ biến được kí hiệu là U1, U2, U4, U5 và U6. Mỗi loại liên kết với một số phân tử protein để hình thành nên snRNP. Trừ U4 và U6 thường tìm thấy trong cùng một snRNP, còn các loại khác tìm thấy trong các snRNP riêng biệt.
Quá trình cắt intron trải qua một số bước như sau (hình 5 và 6):
1) U1 snRNP gắn vào vị trí cắt đầu 5’ của intron. Việc gắn này dựa trên nguyên tắc bổ trợ của U1 snARN có trong snRNP với trình tự ở đoạn nối với exon ở gần đầu 5’ của intron.
2) U2 snRNP gắn vào một trình tự gọi là điểm phân nhánh nằm ngược dòng so với đoạn nối với exon về phía đầu 3’ của intron. Điểm phân nhánh là vị trí đặc thù của các intron, tại đó chứa một adenyl là vị trí gắn vào của đầu 5’ tự do của intron trong quá trình cắt bỏ intron.
3) Phức hệ U4 / U6 snRNP tương tác với U5 snRNP rồi gắn vào các phức hệ U1 và U2 snRNP làm hai đầu 5’ và 3’ của intron tiến lại gần nhau, tạo thành cấu trúc thòng lọng.
4) U4 snRNP tách ra khỏi phức hệ, lúc này spliceosome chuyển thành dạng có hoạt tính cắt (exonuclease).
5) snRNP cắt intron ở đầu 5’ tạo ra một đầu 5’ tự do. Đầu này sẽ liên kết với nucleotit A tại điểm phân nhánh vào vị trí nhóm 2’- OH (liên kết phosphodieste 5’-2’). Nhóm 3’- OH của adênyl này vẫn liên kết bình thường với nucleotit khác trong chuỗi.
6) Intron được cắt ở phía đầu 5’ (intron vẫn ở dạng thòng lọng) và các exon liền kề ở hai đầu 5’ và 3’ của intron liên kết với nhau. Lúc này phức hệ snRNP rời khỏi phân tử ARN. Và quá trình cắt intron như vậy được lặp đi lặp lại.
Quá trình cắt intron như trên được tìm thấy ở các gen được phiên mã nhờ ARN polymerase . Ngoài cơ chế trên đây, một số loại phân tử ARN có thể tự cắt bỏ intron. Quá trình cắt bỏ intron này không phụ thuộc vào protein và được gọi là các intron nhóm . Cơ chế tự cắt của các intron nhóm được tìm thấy ở các gen rARN, một số gen mã hóa protein trong ti thể và một số gen mã hóa mARN và tARN ở thực khuẩn thể.
Một ví dụ về quá trình tự cắt của intron nhóm (ở Tetrachynema) được mô tả như sau:
1) Phân tử tiền -mARN được cắt ở vị trí nối với exon ở phía đầu 5’ và một nucleoit G gắn vào vị chí cắt này.
2) Intron được cắt ở vị trí nối tại đầu 3’.
3) Hai exon liền kề được nối lại với nhau.
4) Phần intron được cắt ra đóng vòng tạo thành một phân tử ADN dạng vòng. Sản phẩm tạo ra là intron ở dạng mạch vòng còn phân tử ADN chứa các exon ở dạng mạch thẳng.
Quá trình tự cắt của intron nhóm do chính ARN tự xúc tác, và các ARN có hoạt tính như vậy được gọi là ribozym. Tuy vậy, hoạt tính tự xúc tác của ARN không nên coi là hoạt tính enzym. Bởi, không giống như enzym protein, các phân tử ARN không trở về dạng ban đầu sau khi phản ứng kết thúc.
Việc tìm ra ARN có hoạt tính xúc tác gần giống với protein đã làm thay đổi quan điểm về nguồn gốc sự sống. Trước đây, người ta cho rằng protein là yếu tố thiết yếu để quá trình sao chép các nucleotit có thể xảy ra. Nhưng lý thuyết mới gần đây cho rằng các axit nucleic đầu tiên có khả năng tự sao chép thông qua hoạt tính kiểu ribozym.
III.2. Lắp mũ
Đầu 5’ của phân tử mARN ở sinh vật nhân chuẩn được sửa đổi bằng cách gắn thêm một nucleotit bị cải biến là 7-methylguanosin (7-mG); quá trình đó được gọi là sự lắp mũ. Mũ 7-mG được gắn nhờ enzym guanyltransferase nối GTP với nucleotit đầu tiên của mARN bằng liên kết triphotphat 5’® 5’ khác thường. Sau đó enzym methyl transferase sẽ gắn thêm nhóm -CH3 vào nitơ số 7 của vòng guanin; đồng thời thường gắn thêm cả vào nhóm 2’- OH của đường ribose của hai nucleotit kế tiếp. Việc tạo mũ giúp bảo vệ đầu 5’ của mARN không bị phân hủy bởi exonuclease trong tế bào chất, đồng thời làm tín hiệu cho ribosom nhận biết điểm bắt đầu của phân tử mARN.
III.3. Gắn đuôi poly (A)
Đầu 3’ của phân tử tiền -mARN của hầu hết các sinh vật nhân chuẩn được sửa đổi bằng cách thêm vào một đoạn trình tự poly A (còn được gọi là đuôi polyA) có thể dài tới 250 bazơ adenin. Sự sửa đổi này được gọi là đa adenin hóa và cần có một trình tự tín hiệu trên phân tử tiền -mARN. Đó là trình tự 5’-AAUAAA-3’ nằm gần đầu 3’ của phân tử tiền -mARN. Khoảng 11 - 20 bazơ tiếp theo có trình tự là YA (Y= pyrimidin), rồi tiếp đến là đoạn trình tự giàu GU nằm xuôi dòng. Có nhiều protein đặc hiệu có khả năng nhận biết và gắn vào đoạn trình tự tín hiệu tạo thành một phức hệ cắt mARN ở vị trí khoảng 20 nucleotit phía sau của trình tự 5’-AAUAAA-3’. Sau đó, enzym poly(A) polymerase sẽ bổ sung thêm các adenin vào đầu 3’ của mARN. Mục đích tạo đuôi A còn chưa rõ, nhưng có thể nó có vai trò bảo vệ cho mARN không bị phân hủy ở đầu 3’ bởi exonuclease. Tuy nhiên, một số mARN, như mARN mã hoá các protein histon, không có đuôi polyA (nhưng thường có thời gian tồn tại ngắn)..
III.4. Tính bền vững của mARN
Không giống như rARN và tARN có tính bền vững khá cao trong tế bào, các mARN có vòng đời tương đối ngắn. Điều đó có thể do tế bào cần điều tiết mức độ tổng hợp các loại protein trong tế bào tùy theo yêu cầu thông qua sự thay đổi mức độ phiên mã. Sự thay đổi lượng mARN đang dịch mã phản ánh sự thay đổi mức độ phiên mã. ở các tế bào vi khuẩn, mARN có thời gian bán phân hủy khoảng vài phút. Trong khi, ở các tế bào nhân chuẩn, mARN có thời gian bán phân hủy có thể lên đến hơn 6 giờ. Mặc dù một số mARN, như các mARN mã hoá globin cấu tạo nên hemoglobin, có thể tồn tại rất lâu trong tế bào.
III.5. Các phân tử mARN được hoàn thiện theo các cách khác nhau
Một trình tự ADN phiên mã chỉ cho ra một phân tử tiền -mARN, nhưng phân tử tiền -mARN có thể được hoàn thiện bằng các cách khác nhau để tạo ra nhiều loại phân tử mARN hoàn chỉnh khác nhau trước khi được sử dụng làm khuôn tổng hợp protein. Đó là các cơ chế cắt bỏ tiền -mARN khác nhau, trong đó tế bào sử dụng những điểm cắt khác biệt để loại bỏ hay giữ lại các exon trong quá trình cắt bỏ. Ngoài ra, việc tồn tại các tín hiệu poly (A) khác nhau trên phân tử tiền -mARN cũng có thể dẫn đến việc sinh ra các phân tử mARN có trình tự dài ngắn khác nhau ở đầu 3’. Ví dụ, việc sử dụng điểm poly (A) nằm phía trước điểm kết thúc đoạn trình tự mã hoá có thể loại bỏ một số exon nằm sau nó và sinh ra mARN mã hóa cho một loại protein ngắn hơn.
Một phân tử tiền -mARN có thể được cắt bỏ các intron theo những cách khác nhau cùng lúc hoặc ở những giai đoạn phát triển khác nhau của một tế bào, hoặc khác nhau giữa các tế bào khác nhau. Các protein được sinh ra theo các cơ chế này thường có quan hệ với nhau, song chúng thường biểu hiện chức năng hoặc có đặc điểm riêng. Ví dụ, quá trình hoàn thiện phân tử tiền -mARN của globulin miễn dịch dẫn đến việc tổng hợp các protein có thể chứa hoặc không chứa các trình tự axit amin kỵ nước cho phép nó liên kết được vào màng tế bào. Điều này giúp tạo ra nhiều dạng globulin miễn dịch có thể liên kết với màng và các dạng để tiết ra khỏi tế bào.
Các phân tử tiền -mARN cũng còn có thể trải qua quá trình sửa đổi trình tự ARN. Trong quá trình đó, trình tự của phân tử tiền -mARN bị biến đổi bằng cách thêm vào, bớt đi hay thay thế các bazơ. Sự sửa đổi trình tự ARN được xác định đầu tiên ở một số nguyên sinh động vật ký sinh. ở những loài này, người ta thấy các bản phiên mã của nhiều gen ty thể bị sửa đổi bằng cách được bổ sung thêm các gốc uracil. Quá trình này cũng gặp ở động vật có xương sống, nhưng mức độ sửa đổi ít hơn nhiều. ở người, phân tử tiền -mARN của gen apolipoprotein B bị sửa đổi ở tế bào ruột non bằng cách thay thế bazơ C bằng U để tạo nên một bộ ba kết thúc, dẫn đến việc tổng hợp một phân tử protein ngắn hơn. Trong khi đó ở tế bào gan, nơi trình tự ARN không bị sửa đổi, protein đó có độ dài đầy đủ.
IV. Về bệnh di truyền
IV.1. Các dạng bệnh di truyền
Có một nhóm đa dạng các bệnh lý và rối loạn gây ra do các đột biến gen và sự thay đổi bất thường của nhiễm sắc thể. Các rối loạn có bản chất di truyền và có thể chia làm 3 nhóm chính:
Các sai hỏng đơn gen
Các sai hỏng đơn gen còn được gọi là các rối loạn di truyền Mendel (Mendelian disorders), các rối loạn đơn gen (monogenic disorders), hay các rối loạn đơn locut (single locus disorders). Đây là một nhóm các dạng bệnh lý gây ra do sự có mặt của một gen đột biến trong cơ thể bị bệnh. Đột biến gen làm thay đổi thông tin mã hóa của gen đó và, hoặc dẫn đến việc tạo ra phân tử protein bị sai hỏng về chức năng, hoặc thậm chí ức chế hoàn toàn sự tổng hợp protein mà gen đó mã hóa. Sự thiếu hụt protein do đột biến gen gây nên sự biểu hiện của các trạng thái bệnh lý. Đột biến gen có thể được di truyền giữa các thế hệ (từ bố, mẹ sang con, cháu) hoặc xuất hiện một cách tự phát (de novo) trong tế bào sinh dục (tinh trùng hoặc trứng) trong cơ thể bố hoặc mẹ, và sau thụ tinh, đứa trẻ hình thành mang đột biến trong mọi tế bào.
Các rối loạn nhiễm sắc thể
Có các dạng bệnh lý gây ra do sự mất đi hoặc thêm vào một hoặc một số nhiễm sắc thể, hay do sự thay đổi cấu trúc của nhiễm sắc thể. Phần lớn các rối loạn bất thường về nhiễm sắc thể xuất hiện ngay trong các tế bào sinh dục của cơ thể bố hoặc mẹ, nhưng cũng có những trường hợp gây ra do di truyền từ thế hệ trước. Các dạng bất thường về số lượng nhiễm sắc thể (biến dị số lượng nhiễm sắc thể) có thể biểu hiện bằng sự tăng lên số lượng bộ nhiễm sắc thể đơn bội (hiện tượng đa bội thể), hoặc do sự thêm và, hoặc mất đi của từng nhiễm sắc thể riêng lẻ (hiện tượng lệch bội). Các dạng bất thường về cấu trúc nhiễm sắc thể có thể gây ra do sự đứt gẫy nhiễm sắc thể liên quan đến các hiện tượng mất đoạn, lặp đoạn hoặc đảo đoạn nhiễm sắc thể.
Các rối loạn đa nhân tố
Đây là một nhóm gồm nhiều bệnh phổ biến, ví dụ như đái tháo đường, các bệnh mạch vành và phần lớn các dị tất bẩm sinh. Các bệnh này gây ra do ảnh hưởng của nhiều gen theo các cơ chế bệnh lý phức tạp cho đến nay chưa được hiểu biết đầy đủ, nhưng được biết có liên quan đến sự tương tác của nhiều gen với nhau, hoặc giữa các gen với các yếu tố môi trường.
Trong khoảng 20 năm qua, nhờ sự phát triển của công nghệ ADN tái tổ hợp, đã có nhiều phát hiện mới mang tính bước ngoặt liên quan đến các bệnh lý do rối loạn đơn gen gây ra. Thông tin được nêu trong phần dưới đây liên quan đến một số rối loạn bệnh lý như vậy.
IV.2. Hình thức di truyền
Các rối loạn di truyền đơn gen được truyền từ thế hệ bố, mẹ sang thế hệ con, cháu. Có ba hình thức di truyền phổ biến: di truyền trội trên nhiễm sắc thể thường, di truyền lặn trên nhiễm sắc thể thường và di truyền liên kết nhiễm sắc thể X (Bảng 1).
Trong trường hợp bệnh di truyền do alen trội nằm trên nhiễm sắc thể thường quy định, việc truyền một alen gây bệnh từ bố hoặc mẹ sang con là đủ để cá thể con biểu hiện bệnh. Các cá thể bị bệnh có một alen bình thường và một alen đột biến gây bệnh được gọi là các thể dị hợp tử. Các cá thể này có nguy cơ truyền cho 50 % số con alen đột biến và biểu hiện bệnh (hình 7a).
Trong trường hợp bệnh di truyền do alen lặn nằm trên nhiễm sắc thể thường quy định, cá thể biểu hiện bệnh phải mang đủ một cặp alen đột biến gây bệnh, một bắt nguồn từ bố, một từ mẹ. Cá thể biểu hiện bệnh trong trường hợp này gọi là cá thể đồng hợp từ về alen đột biến. Các cá thể dị hợp tử với một alen gây bệnh không biểu hiện bệnh nhưng có khả năng truyền alen gây bệnh sang 50% số cá thể con. Đối cả bố và mẹ là các cá thể dị hợp tử mang alen lặn gây bệnh trên nhiễm sắc thể thường, một phần tư số con biểu hiện bệnh, một phần tư bình thường và một nửa số cá thể con là thể mang alen gây bệnh nhưng không biểu hiện bệnh (hình 7b).
Trong trường hợp bệnh di truyền liên kết với nhiễm sắc thể X, gen đột biến gây bệnh chỉ xuất hiện trên nhiễm sắc thể X. Do con đực chỉ có một nhiễm sắc thể X duy nhất, việc truyền alen đột biến sang cá thể con giới đực là đủ để cá thể này biểu hiện bệnh. Các cá thể đực biểu hiện bệnh gọi là các cá thể dị giao tử. Các con cái có hai nhiễm sắc thể X vì vậy thường không biểu hiện bệnh do phần lớn các gen đột biến gây bệnh nằm trên nhiễm sắc thể X là các alen lặn. Đối với các con cái là cá thể mang gen gây bệnh nhưng không biểu hiện bệnh, 50% con đực thế hệ con có nguy cơ bị bệnh và 50% con cái là thể mang gen gây bệnh nhưng không biểu hiện bệnh (hình 7c).
Bảng 1. Một số bệnh lý di truyền đơn gen
Để có sự cân bằng giữa con đực và con cái về lượng sản phẩm do gen nằm trên nhiễm sắc thể X mã hóa, trong tự nhiên có hiện tượng một trong hai nhiễm sắc thể X trong tế bào con cái bị bất hoạt. Quá trình này được gọi là hiện tượng Lyon hóa (giả thiết Lyon) và thường diễn ra trong quá trình phát triển của phôi. Trong mỗi tế bào, nhiễm sắc thể X bị bất hoạt được "chọn "một cách ngẫu nhiên. Tuy vậy, một số con cái là thể mang gen gây bệnh nằm trên nhiễm sắc thể X có thể biểu hiện bệnh ở mức độ nhẹ do sự bất hoạt của nhiễm sắc thể X bình thường.
IV.3. Sai hỏng đơn gen
Có nhiều bệnh di truyền do gen đơn quy định xuất hiện ở người (Bảng 7). Các bệnh này có các đặc điểm biểu hiện đa dạng khác nhau và hậu quả đối với các cá thể bị bệnh cũng khác nhau tùy thuộc vào mức độ quan trọng của gen bị đột biến và bản chất của loại đột biến xuất hiện. Một số bệnh, như bệnh máu khó đông, gây nên các triệu chứng bệnh có thể điều trị được, nhưng các bệnh khác chẳng hạn như hội chứng múa giật Huntington, đến nay chưa có biện pháp điều trị triệt để và người bệnh thường chết khi còn trẻ.
Các bệnh di truyền do đơn gen quy định thường xuất hiện với tần số tương đối thấp nằm trong khoảng giữa 0, 01 đến 5, 0 trường hợp trong 1000 em bé sơ sinh. Tần số các rối loạn di truyền này thường khác nhau trong các chủng tộc người khác nhau. Chẳng hạn, tần số bệnh nhân bị xơ nang là cao nhất ở các nước Bắc Âu, bệnh thiếu máu hồng cầu hình liềm xảy ra với tần số cao nhất ở Châu Phi và bệnh b-thalassemia phổ biến hơn cả trong các quần thể Châu á. Đối với các bệnh di truyền đơn gen phổ biến nhất ở người đến nay đã xác định và tách dòng được gen gây bệnh đồng thời xác định được các đột biến gây bệnh.
IV.4. Các đột biến trong sai hỏng đơn gen
Có thể chia các loại đột biến tạo ra các alen gây bệnh thành hai loại chính: các đột biến điểm liên quan đến sự thay đổi của một bazơ nitơ duy nhất và các đột biến lớn liên quan đến sự thay đổi trình tự ADN với kích thước lớn hơn. Đối với mỗi loại bệnh, có thể có vài dạng đột biến khác nhau. Ngoài ra, các cá thể bị bệnh cũng có thể cùng lúc mang các gen đột biến khác nhau. Ví dụ, có khoảng 20% trường hợp bị bệnh máu khó động dạng A do kết quả của đột biến lớn gây ra. Các trường hợp còn lại là do các dạng đột biến điểm mà đến nay các nhà nghiên cứu đã tìm ra và mô tả 250 kiểu đột biến khác nhau.
Các đột biến điểm
Các đột biến điểm gây nên các bệnh di truyền có thể chia thành một số kiểu sau:
(1) Các đột biến sai nghĩa (misense mutations). Đây là những thay đổi của các nucleotit trên phân tử ADN gây nên sự thay đổi bộ ba mã hóa cho một axit amin dẫn đến sự thay thế bởi một loại axit amin khác trên phân tử protein. Các đột biến sai nghĩa gây nên những hậu quả khác nhau đối với phân tử protein được mã hóa. Do hiện tượng thoái hóa của mã di truyền, những thay đổi liên quan đến vị trí bazơ thứ ba trong bộ ba mã hóa thường không có ảnh hưởng đến phân tử protein. Ngoài ra, nhiều sự thay đổi thành phần bazơ nitơ dẫn đến sự thay thế của axit amin có đặc tính tương tự có thể không làm thay đổi chức năng và hoạt tính của phân tử protein. Chẳng hạn như đột biến ở bộ ba mã hóa CTT thành ATT làm thay thế axit amin kị nước là leucin bằng isoleucin cũng là một axit amin kị nước khác. Tuy vậy, có nhiều ví dụ cho thấy các đột biến sai nghĩa làm thay đổi rõ rệt chức năng của phân tử protein được mã hóa và vì vậy gây nên các bệnh di truyền. Trong số này có thể kể đến đột biến thay thế A bằng T trong gen mã hóa b-globin, một trong các chuỗi polypeptit hình thành nên phân tử hemoglobin. Đột biến này làm thay đổi bộ ba số sáu của gen thay đổi từ GAG mã hóa cho axit glutamic thành GTG mã hóa cho valin. Đột biến này gây nên bệnh thiếu máu hồng cầu hình liềm do các tế bào hồng cầu bị biến dạng thành hình liềm do thay đổi sự kết dính của các phân tử hemoglobin. Các tế bào hồng cầu hình liềm có tuổi thọ ngắn gây nên hiện tượng thiếu máu và nằm trong các mao mạch làm giảm khả năng cung cấp máu tới các cơ quan (chứng thiếu máu cục bộ).
(2) Các đột biến vô nghĩa. Đây là những thay đổi của các nucleotit trên phân tử ADN làm chuyển một mã bộ ba mã hóa axit amin thành một mã bộ ba kết thúc vì vậy quá trình phiên mã sẽ kết thúc sớm hơn bình thường và dẫn đến sự hình thành phân tử protein có kích thước ngắn hơn. Các đột biến vô nghĩa thường gây hậu quả nghiêm trọng đối với phân tử protein được mã hóa, đặc biệt khi nó xuất hiện gần đầu 5ơ của gen. Nhiều bệnh di truyền khác nhau đã được xác định có liên quan đến các đột biến vô nghĩa. Ví dụ như đột biến C thành T ở bộ ba số 39 trong gen mã hóa b-globin làm thay đổi mã bộ ba bình thường CAG quy định glutamin thành TAG là một bộ ba mã kết thúc. Đột biến này gây nên sự kết thúc phiên mã sớm của phân tử mARN mã hóa cho b-globin dẫn đến sự thiếu hụt một chuỗi polypeptit b và gây nên dạng bệnh lý gọi là b-thalassemia với triệu chứng bệnh thiếu máu do phân tử hemoglobin bình thường không được tạo thành.
(3)Các đột biến dịch khung : Những đột biến này xảy ra do sự thêm vào hay mất đi của một hay một số bazơ nitơ làm thay đổi khung đọc và một tập hợp các bộ ba mã hóa mới được hình thành kể từ điểm đột biến xảy ra. Đột biến dịch khung cũng thường gây nên hậu quả nghiêm trọng đối với phân tử protein được mã hóa, đặc biệt khi đột biến xuất hiện gần đầu 5ơ của gen. Nhiều bệnh lý được mô tả liên quan đến đột biến dịch khung. Chẳng hạn đột biến dịch khung đã được tìm thấy là nguyên nhân gây nên bệnh máu khó đông ở nhiều bệnh nhân mắc căn bệnh này. Trong đó bao gồm các trường hợp do mất đi 4 bazơ nitơ gây nên sự thay đổi khung đọc từ bộ ba mã hóa thứ 50 và một đột biến thêm 10 bazơ làm thay đổi khung đọc từ bộ ba mã hóa thứ 38. Cả hai kiểu đột biến này đều gây triệu chứng bệnh nghiêm trọng.
(4) Đột biến vị trí cắt intron. Đây là những đột biến làm thay đổi trình tự tín hiệu ở gần đầu 3’ hoặc 5’ của các đoạn intron dẫn đến việc cắt intron sai trong quá trình hoàn thiện phân tử mARN ở sinh vật nhân chuẩn. Các đột biến kiểu này cũng có thể xảy ra bên trong intron tạo nên điểm cắt intron mới và vì vậy cũng dẫn đến sự cắt sai trình tự intron. Một loạt các đột biến vị trí cắt intron được tìm thấy liên quan đến đột biến gen b-globin làm thiếu hoàn toàn các chuỗi b-globin trong các cơ thể đồng hợp tử và gây bệnh b-thalassemia.
(5) Đột biến trình tự gen điều hòa. Các đột biến này xảy ra tương đối hiếm và ảnh hưởng đến việc điều hòa hoạt động của gen, thường hoặc làm giảm hoặc làm tăng mức độ biểu hiện của gen. Một đột biến như vậy đã được xác định trong trình tự chỉ huy của gen mã hóa protein đông máu (là protein yếu tố
X) cũng là một nguyên nhân gây nên bệnh máu khó đông. Các cá thể mang đột biến này không tạo được protein yếu tố
X và bị chảy máu một cách bất thường. Thông thường, triệu chứng bệnh thường mất đi sau tuổi dậy thì nhờ hócmôn steroid kích thích sự biểu hiện của gen này.
Các đột biến lớn
Có nhiều bệnh lý gây ra do các đột biến liên quan đến một trình tự dài các nucleotit trên phân tử ADN. Phần lớn các đột biến này có ảnh hưởng nghiêm trọng đến chức năng của gen và gây bệnh nặng.
(1) Các đột biến mất đoạn. Sự mất đi của gen có thể biểu hiển với mức độ kích thước khác nhau, từ một vài bazơ nitơ đến toàn bộ gen, thậm trí nhiều gen cùng lúc. Sự mất đi hoàn toàn của các gen mã hóa b-globin gây nên bệnh b-thalassemia (bệnh mất khả năng sản xuất hemoglobin bình thường). Ví dụ như, sự mất một phần gen mã hóa dystrophin gây nên bệnh mòn cơ, bệnh loạn dưỡng cơ; hay sự mất đi một bộ ba mã hóa duy nhất trong gen tổng hợp protein điều hòa độ dẫn xuyên màng trong bệnh xơ nang CFTR (cystic fibrosis transmembrane conductance regulator) là nguyên nhân gây bệnh gặp phải ở 70% số bệnh nhân bị bệnh xơ nang.
(2) Các đột biến thêm đoạn. Nhiều đột biến thêm đoạn đã được ghi nhận. Ví dụ như một trường hợp một bệnh nhân bị máu khó đông dạng A hiếm gặp có nguyên nhân gây bệnh là do sự thêm vào gen mã hóa yếu tố V một trình tự lặp lại gọi là yếu tố LN.
(3)Các đột biến thay thế đoạn gen : Cũng có nhiều đột biến thay thế đoạn gen gây nên bệnh di truyền đã được ghi nhận. Ví dụ như một đột biến gây bệnh máu khó đông dạng A xảy ra do sự tái tổ hợp giữa các trình tự nằm trong vùng intron thứ 22 của gen mã hóa yếu tố V và các trình tự lặp lại kép dọc theo nhiễm sắc thể X. Do một lỗi xảy ra trong quá trình tái tổ hợp, gen mã hóa yếu tố V bị cắt thành 2 mảnh tách biệt nhau bởi hàng triệu cặp bazơ nitơ, làm mất hoàn toàn chức năng của gen này.
(4) Các đột biến lặp lại bộ ba nucleotit. Một dạng đột biến gen hiếm gặp liên quan đến các trình tự lặp lại từng bộ ba nucleotit kém bền vững. Trong quá trình giảm phân xảy ra hiện tượng số lượng bản sao các trình tự lặp lại từng bộ ba nucleotit tăng lên trong các tế bào sinh dục dẫn đến sự biểu hiện của bệnh trong các thế hệ sau. Cơ chế dẫn đến hiện tượng lặp lại nhiều lần của các trình tự nucleotit và nguyên lý gây bệnh cho đến nay chưa được biệt rõ. Sự tăng lên số lượng các trình tự lặp lại tìm thấy liên quan đến một số bệnh di truyền bao gồm bệnh múa giật Hungtington.
IV.5. Về một số bệnh di truyền
1) Trao đổi chéo trong nguyên phân có thể tạo ra thể khảm về di truyền và một số bệnh ung thư ở người
Trao đổi chéo là một đặc tính quan trọng của quá trình giảm phân. Phức hệ trao đổi chéo “xác định” vị trí tái tổ hợp đồng thời giữ cho các NST tương đồng gắn kết với nhau, cho phép chúng thành từng cặp tiến về mặt phẳng xích đạo tại kỳ giữa của giảm phân, rồi sau đó phân ly về hai cực đối diện của tế bào. Ngoài ra, TĐC trong giảm phân là một cơ chế góp phần làm tăng tính đa dạng của các dạng của các loại giao tử. Vì vậy, không có gì là ngạc nhiên khi các cơ thể sinh vật nhân chuẩn biểu hiện một sự đa dạng lớn về các loại enzym tham gia khởi đầu đặc hiệu sự TĐC trong giảm phân. TĐC cũng có thể xuất hiện trong nguyên phân. Tuy vậy, không giống sự kiện diễn ra trong giảm phân, TĐC trong nguyên phân thường xảy ra do lỗi xuất hiện trong quá trình tái bản NST hoặc do bị chiếu xạ dẫn đến sự đứt gãy của các phân tử ADN, chứ không phải là một chương trình được điều hòa bình thường của tế bào như trong giảm phân. Vì vậy, TĐC trong nguyên phân là một sự kiện hiếm khi xảy ra, chỉ xuất hiện với tần số thấp hơn 10-6 lần phân bào nguyên nhiễm. Tuy vậy, việc nuôi cấy các tế bào nấm men và quá trình phát triển của một cơ thể đa bào phức tạp có số lần phân chia tế bào đủ lớn để các nhà di truyền học có thể hàng ngày phát hiện và theo dõi được hiện tượng TĐC trong nguyên phân vốn xảy ra với tần số thấp này. Khác với trong giảm phân, TĐC xảy ra trong nguyên phân xảy ra ngẫu nhiên ở một số ít các tế bào soma, tạo nên những tế bào soma mang “hệ gen” khác nhau. Do vậy, những cá thể mang những tế bào soma chứa các NST bị TĐC được gọi là các thể khảm.
Ở người, một số TĐC xảy ra trong nguyên phân có thể gây nên sự hình thành khối u (ví dụ: một số bệnh u mắt). ở một số quần thể người, số trẻ sơ sinh có bảm chất di truyền có nguy cơ bị ung thư có tần số vào khoảng 1/20.000 trẻ sơ sinh. Gen gây khối u võng mạc (RB) nằm trên NST số 13, trong khi alen kiểu dại bình thường (RB+) mã hóa cho một loại protein điều hòa sự phát triển và biệt hóa của võng mạc. Các tế bào trong mắt cần ít nhất một bản sao của alen kiểu dại để duy trì sự điều hòa hoạt động phân chia của tế bào. Một đột biến trong alen RB+ có thể dẫn đến làm hỏng chức năng của alen kiểu dại và được ký hiệu là RB-. Nếu một tế bào mất đi cả hai bản sao của RB+, thì nó mất đi khả năng điều hòa hoạt động phân chia tế bào bình thường và gây nên sự hình thành khối u. Ví lý do này, alen kiểu dại RB+ có được xem là một gen ức chế sự hình thành khối u.
Những cá thể có bản chất di truyền có nguy cơ ung thư võng mạc được sinh ra mang một alen RB+ duy nhất. NST số 13 thứ hai của họ hoặc chỉ mang alen RB- hoặc hoàn toàn không có gen RB. Nếu một tác nhân đột biến (ví dụ: chiếu xạ) hay một lỗi xảy ra trong quá trình nguyên phân làm mất đi alen RB+ . Ở một tế bào trong một hoặc hai mắt thì khối u võng mạc sẽ bắt đầu phát triển từ vị trí tế bào sai hỏng. Một nghiên cứu ở các bệnh nhân bị bệnh u võng mạc cho thấy sự xuất hiện của các tế bào mắt với kiểu gen đồng hợp tử RB-/RB-, trong khi tế bào bạch cầu của người bệnh là dạng dị hợp tử RB+/RB-. Như minh họa ở hình A, một TĐC trong nguyên phân giữa gen RB và tâm động của nhiễm sắc thể mang gen là cơ chế gây nên sự hình thành tế bào mang kiểu gen RB-/RB-. Khi tế bào này hình thành, nó được phân chia một cách không được kiểm soát và dẫn đến sự hình thành khối u.
Chỉ có 40% trường hợp bị bệnh ung thư võng mạc là có cơ chế gây bệnh như trên, còn 60% còn lại khi sinh ra có kiểu gen bình thường là RB+/RB+. Ở những người này, hai đột biến phải cùng xảy ra ở cả hai bản sao của gen RB mới gây nên ung thư. Đột biến đầu tiến có thể dẫn đến alen RB+ bị chuyển thành RB-, còn sau đó các tế bào con xảy ra TĐC trong quá trình nguyên phân và dẫn đến sự phát triển ung thư do alen đột biến bị “đồng hợp tử” hóa.
Đáng chú ý là TĐC trong nguyên phân gây nên sự hình thành một số bệnh ung thư võng mạc đã giúp giải thích sự biểu hiện mức độ bệnh lý khác nhau. Những trẻ sơ sinh có kiểu gen RB+/RB- có thể không bị bệnh. Hoặc khi mắc bệnh, sự phát triển của khối u có thể xảy ra ở cả hai mắt, nhưng cũng có thể chỉ xảy ra ở một mắt. Tất cả những hiện tượng đó phụ thuộc vào việc tế bào nào trong cơ thể xảy ra hiện tượng TĐC trong nguyên phân.
2) Đột biến gen mã hóa các protein cảm thụ ánh sáng và thị lực
Những nghiên cứu đầu tiên mô tả sự bất thường trong khả năng cảm thụ ánh sáng ở người được bắt đầu từ khoảng 200 năm trước. Thời đó, người ta phát hiện ra nhiều đột biến có thể gây ảnh hưởng đến thị lực ở người. Bằng việc phân tích các kiểu hình liên quan đến mỗi loại đột biến và sau đó kiểm tra sự biến đổi của ADN. Ngày nay, chúng ta đã có những hiểu biết chi tiết hơn về cơ chế di truyền phân tử của tính trạng cảm nhận ánh sáng, màu sắc và các loại protein mà những gen này mã hóa.
Có một số dạng bệnh rối loạn cảm nhận màu sắc khác nhau ở người đã giúp việc phân tích và làm sáng tỏ cơ chế cảm nhận màu sắc ở người. Đầu tiên, các nhà nghiên cứu nhận biết và mô tả sự khác biệt trong cách những người có rối loạn về cảm nhận màu sắc nhìn thấy sự vật từ sự khác biệt nhỏ khi nhìn thấy mức độ màu đỏ, tới việc không phân biệt được màu đỏ và màu xanh lục, đến việc không nhìn thấy bất cứ màu nào. Thứ hai, sự phát triển khoa học tâm - sinh lý học cung cấp các phép thử để xác định và so sánh chính xác các kiểu hình. Chẳng hạn, một phép phân tích dựa trên sự kiện là mọi người có thể cảm nhận mỗi một màu như sự hòa trộn của ba dải bước sóng cơ bản tương ứng với màu đỏ, xanh dương (xanh lam) và xanh lục và có thể điều chỉnh tỉ lệ cường độ sáng của ba màu này để thu được một dải bước sóng tương ứng với một màu thứ tư, chẳng hạn màu vàng. Một người với thị lực bình thường, sẽ chọn một tỉ lệ màu thích hợp của màu đỏ và màu xanh lục để tạo nên màu vàng đặc thù, nhưng nếu một người không có khả năng phân biệt màu đỏ với màu xanh lục thì mọi sự kết hợp giữa hai màu này sẽ chỉ cho ra một màu giống nhau. Cuối cùng, do những biến dị di truyền liên quan đến thị giác hiếm khi gây ảnh hưởng đến hoạt động sinh sản hay tuổi thọ trong các xã hội người hiện đại, những đột biến này có thể tạo ra nhiều alen mới làm thay đổi khả năng cảm nhận màu sắc và những alen đột biến này được duy trì lâu dài trong quần thể.
a) Cơ sở phân tử và tế bào của sự cảm nhận màu sắc ở mắt
Các tế bào cảm nhận ánh sáng và màu sắc
Chúng ta cảm nhận được hình ảnh qua các nơron thần kinh ở võng mạc phần phía sau nhãn cầu (hình 8a). Những nơron này có hai loại: tế bào hình nón và tế bào hình que. Các tế bào hình que chiếm 95% số lượng các tế bào cảm nhận ánh sáng và được kích thích bởi các ánh sáng yếu trong các bước sóng ánh sáng. ở cường độ sáng lớn hơn, các tế bào hình que bị bão hòa và không còn chức năng gửi các tín hiệu thêm nữa đến não bộ. Lúc này, các tế bào hình nón sẽ tiếp quản chức năng này, xử lý các bước sóng ánh sáng của cường độ sáng mạnh và giúp chúng ta có thể phân biệt được các màu sắc. Các tế bào hình nón có ba loại. Loại thứ nhất chuyên hóa để cảm nhận ánh sáng đỏ, loại thứ hai cảm nhận ánh sáng xanh lục và loại thứ ba cảm nhận ánh sáng xanh dương. Đối với mỗi tế bào thụ quan ánh sáng như vậy, hoạt động cảm nhận ánh sáng bao gồm sự hấp thụ các photon từ ánh sáng ở một dải bước sóng nhất định, chuyển các thông tin về số lượng và năng lượng của các photon thành các tín hiệu điện, và chuyển các tín hiệu đó qua tế bào thần kinh thị giác tới bộ não.
Bốn gen mã hóa bốn chuỗi polypeptit cảm nhận màu sắc
Các protein cảm nhận photon và khởi đầu quá trình truyền tín hiệu trong các tế bào hình nón là rhodopsin. Protein này là một chuỗi polypeptit duy nhất gồm 348 axit amin xếp thành một chuỗi zigzag xuyên màng tế bào (hình 8.b.1). Một axit amin lysine nằm trong chuỗi liên kết với một phân tử carotenoid sắc tố trên võng mạc có khả năng hấp thụ photon. Các axit amin ở gần vùng liên kết võng mạc cấu trúc nên vị trí hoạt động của rhodopsin. Bằng việc thay đổi vị trí võng mạc qua một cơ chế đặc biệt, các rhodopsin xác định sự đáp ứng lại ánh sáng của các tế bào võng mạc. Mỗi một tế bào hình que thường chứa khoảng 100 triệu phân tử rhodopsin trên lớp màng đặc thù của nó. Gen mã hóa tổng hợp rhodopsin ở người nằm trên NST số 3.
Protein có vai trò cảm nhận và khởi đầu quá trình truyền tín hiệu trong các tế bào hình nón đối với photon màu xanh dương có liên quan đến rhodopsin. Protein này cũng là một chuỗi polypeptit duy nhất gồm 348 axit amin và bao quanh một phân tử sắc tố của võng mạc. Gần 50% trên phân tử protein cảm nhận ánh sáng xanh dương là giống hệt trình tự của rhodopsin; phần còn lại có sự khác biệt giữa hai protein này và là phần đặc thù cho sự cảm nhận ánh sáng màu xanh dương (hình 8.b.2). Gen mã hóa protein cảm nhận ánh sáng xanh dương nằm trên NST số 7.
Cũng có quan hệ với protein rhodopsin là các protein cảm nhận ánh sáng màu đỏ và xanh lục nằm trong các tế bào hình nón màu đỏ và xanh lục. Hai protein này cũng chỉ gồm một chuỗi polypeptit duy nhất, gồm 364 axit amin, cũng liên kết với võng mạc và nằm xuyên qua màng tế bào (các hình 8.b.3 và 4). Cũng giống như protein cảm nhận màu xanh dương, các protein cảm nhận màu đỏ và xanh lục có khoảng gần 50% trình tự axit amin giống với rhodopsin; các protein này chỉ khác biệt nhau trung bình 4 / 100 axit amin. Mặc dù chỉ khác biệt nhau nhỏ như vậy, những protein này đủ để để biệt hóa hai loại tế bào hình nón mẫn cảm với các photon ánh sáng thuộc bước sóng khác nhau, là các tế bào hình nón màu đỏ và xanh lục. Cả hai gen mã hóa cho các protein màu đỏ và xanh lục đều nằm trên NST X thành một chuỗi kế tiếp nhau. Phần lớn mỗi NST X trong tế bào ở người mang một gen duy nhất mã hóa protein cảm nhận ánh sáng đỏ, còn có từ một đến ba bản sao gen mã hóa protein cảm nhận ánh sáng xanh lục.
Họ gen rhodopsin hình thành do hiện tượng lặp đoạn và phân ly
Sự giống nhau về cấu trúc và chức năng giữa bốn loại protein rhodopsin cho thấy các gen mã hóa các chuỗi polypeptit này xuất hiện do hiện tượng lặp đoạn của một gen thụ thể cảm nhận ánh sáng tiền thân, rồi sau đó phân ly do sự tích lũy của nhiều đột biến. Các đột biến thúc đẩy khả năng cảm nhận màu sắc đã được ưu tiên chọn lọc qua quá trình tiến hóa hàng triệu năm. Các protein cảm nhận ánh sáng đỏ và xanh lục giống nhau hơn cả, và chỉ khác nhau khoảng 15 axit amin. Điều này cho thấy hai gen này chỉ phân ly trong thời gian gần đây. Sự khác biệt của hai protein này so với protein cảm nhận màu xanh dương và rhodopsin cho thấy các protein này phân ly sớm hơn trong quá trình tiến hóa từ gen mã hóa thụ thể cảm nhận ánh sáng tiền thân (hình 8.d).
b) Các đột biến ở họ gen rhodopsin gây ảnh hưởng đến thị lực và khả năng cảm nhận màu sắc
Nhiều đột biến thay thế axit amin ở gen rhodopsin gây nên bệnh mù một phần hay mù hoàn toàn
Người ta đã phát hiện được ít nhất 29 loại đột biến axit amin duy nhất trong gen mã hóa rhodopsin gây nên một nhóm bệnh di truyền trội nằm trên NST thường được gọi chung là các bệnh loạn sắc tố võng mạc (retinitis pigmentosa) với những triệu chứng đầu tiên là sự mất chức năng của các tế bào hình que, rồi dẫn đến sự thoái hóa dần dần của các tế bào võng mạc ngoại vi. Những đột biến này thường gây nên sự hình thành protein rhodopsin không được gấp nếp theo đúng cấu trúc không gian thông thường, hoặc trở nên kém bền vững. Do protein rhodopsin bình thường là thành phần cấu trúc quan trọng của màng tế bào hình que, những protein đột biến mất chức năng này được duy trì trong tế bào những không được gắn vào màng tế bào như bình thường. Các tế bào hình que không có đủ rhodopsin ở trên màng thường bị chết sau đó. Tùy thuộc vào số tế bào hình que bị chết, mà người bệnh có thể bị mù hoàn toàn hay mù một phần.
Các đột biến khác ở gen mã hóa rhodopsin gây nên một dạng bệnh lý ít nghiêm trọng hơn là bệnh mù ban đêm. Các đột biến có mức độ đa hình cao này làm thay đổi trình tự của các axit amin trong phân tử protein theo hướng làm tăng ngưỡng ánh sáng kích thích cần thiết để khởi đầu chuỗi truyền tín hiệu cảm nhận ánh sáng. Với những thay đổi này, khi cường độ ánh sáng yếu, mắt không cảm nhận được màu sắc.
Các đột biến trong gen mã hóa các sắc tố của tế bào hình nón làm thay đổi thị lực theo một số cách có thể phỏng đoán được
Các rối loạn thị lực gây ra bởi các đột biến liên quan đến các gen sắc tố thuộc tế bào hình nón ít nghiêm trọng hơn so với các rối loạn thị lực gây ra bởi các đột biến tương tự xảy ra với các gen rhodopsin trong các tế bào hình que. Nguyên nhân chủ yếu có lẽ bởi vì các tế bào hình que chiếm đến 95% số nơron thần kinh cảm nhận màu sắc ở người, trong khi các tế bào hình nón chỉ chiếm 5%. Một số đột biến liên quan đến gen mã hóa protein cảm nhận màu xanh dương nằm trên NST số 7 gây nên hội chứng rối loạn thị lực sắc tố xanh (tritanopia). Các đột biến ở gen mã hóa protein cảm nhận sắc tố đỏ trên NST X có thể làm mất chức năng cảm nhận màu đỏ của các tế bào hình nón và gây bệnh mù màu đỏ. Với một số đột biến nhỏ khác liên quan đến gen quy định protein cảm nhận màu đỏ có thể gây nên bệnh mù màu đỏ một phần hoặc hoàn toàn tùy vào vị trị đột biến.
Trao đổi chéo không cân bằng giữa các gen mã hóa protein xanh lục và đỏ gây nên phần lớn các biến dị về tính trạng cảm nhận màu sắc
Một người có thị lực bình thường thông thường có một gen mã hóa protein cảm nhận màu đỏ. Một số trong những người bình thường này có một gen xanh lục nằm gần kề, còn một số người khác có số gen xanh lục dao động từ hai đến năm bản sao. Các gen đỏ và xanh lục giống nhau đến 96% về trình tự ADN. Các gen màu xanh lục khác nhau giống nhau đến 99,9%. Do sự giống nhau và nằm gần nhau của những gen này nên hiện tượng trao đổi chéo không tương đồng dễ xảy ra với những gen này. Hàng loạt các dạng TĐC khác nhau ở vùng gen này có thể tạo ra các kiểu hình đột biến thiếu vắng hoàn toàn gen màu đỏ, hoặc gen màu xanh lục, có sự tổ hợp khác nhau của các gen màu xanh lục, mang gen lai xanh lục - đỏ. Do khả năng cảm nhận màu đỏ và xanh lục phụ thuộc vào tỉ lệ ánh sáng đỏ và xanh lục được phản chiếu từ hình ảnh, những người thiếu các gen đỏ và xanh lục sẽ cảm nhận màu đỏ và xanh lục là một màu giống nhau.
Một số đột biến có thể làm mất hoàn toàn khả năng nhìn màu đỏ và xanh lục
Đến nay, các nhà di truyền học đã tìm thấy bảy loại đột biến mất đoạn gây bệnh mù màu đỏ và xanh lục liên kết với NST giới tính X. Bệnh lý này được gọi là hội chứng tế bào hình nón đơn sắc xanh dương (blue cone monochromacy), bởi những người này chỉ cảm nhận được màu liên quan đến màu xanh dương. Nghiên cứu phân tử cho thấy cả bảy đột biến mất đoạn này đều liên quan đến một đoạn trình tự gồm 600 bp nằm ngoài vùng mã hóa của các gen đỏ và xanh lục. Điều này cho thấy khả năng trình tự này là một đoạn trình tự (gen) điều hòa dài cần thiết cho sự biểu hiện của chuỗi các gen đỏ và xanh lục.
Tóm lại, chúng ta nhìn được và cảm nhận được các màu sắc đa dạng, phong phú của vạn vật một phần là nhờ bốn gen trực tiếp tạo ra bốn loại phân tử protein trong các tế bào hình que và hình nón ở võng mạc mắt. Các đột biến làm thay đổi những chuỗi polypeptit này hoặc số lượng của chúng đều có thể làm thay đổi hoặc làm hỏng thị lực hoặc khả năng cảm nhận màu sắc của mắt.
V. Phân tích gen và sản phẩm của gen
V.1. Các kỹ thuật phân tích axit nucleic
V.1.1. Điện di phân tích ADN và ARN
Có nhiều phương pháp khác nhau có thể được sử dụng để phân tích ADN và ARN, nhưng cho đến nay điện di trên gel là phương pháp được sử dụng phổ biến hơn cả nhờ ưu điểm nhanh và tương đối đơn giản. Nguyên tắc của phương pháp là do: dưới tác động của điện trường, các phân tử ADN (thường tích điện âm) khác nhau về kích thước, điện tích, mức độ cuộn xoắn và dạng phân tử (mạch thẳng hay mạch vòng) sẽ di chuyển qua hệ mạng của gel từ cực âm (cathode) sang cực dương (anode) với tốc độ di chuyển khác nhau. Vì vậy, chúng dần dần tách nhau ra trên trường điện di, qua đó người ta có thể thu thập và phân tích được từng phân đoạn ADN hoặc gen riêng rẽ. Trên điện trường các phân đoạn ADN có kích thước càng nhỏ càng có tốc độ di chuyển trên điện trường nhanh hơn. Sau khi điện di kết thúc, các phân tử ADN có thể quan sát thấy nhờ sử dụng các thuốc nhuộm phát huỳnh quang, chẳng hạn như ethidium (chất này gắn kết với ADN bằng cách cài vào khe ở giữa các nucleotit). Mỗi một băng điện di thường phản ánh một tập hợp các phân tử ADN có cùng kích thước.
Có hai loại vật liệu làm gel được sử dụng phổ biến trong điện di, đó là agarose và polyacrylamid. Trong đó, gel polyacrylamid có khả năng phân tách cao, nhưng khoảng kích thước ADN có thể phân tích hẹp. Vì vậy, điện di trên gel polyacrylamid có thể phân tách được các phân đoạn ADN khác nhau thậm trí chỉ một cặp nucleotit (1 bp) duy nhất, nhưng thường chỉ để phân tích các đoạn ADN kích thước vài trăm bp. Còn gel agarose có khả năng phân tách thấp hơn đối với các phân đoạn ADN kích thước nhỏ, nhưng rất hiệu quả khi phân tách các phân đoạn ADN kích thước lớn tới hàng chục hoặc hàng trăm kb (1 kb = 1000 bp).
Các phân đoạn ADN kích thước lớn không thể “lọt” qua các lỗ có kích thước nhỏ trên các bản gel, kể cả gel agarose. Thay vào đó, chúng sẽ “trườn” qua mạng lưới của gel bằng việc đầu này của phân tử đi trước, còn đầu kia theo sau. Kết quả là các phân đoạn ADN kích thước lớn (từ 30 đến 50 kb) có tốc độ di chuyển trên điện trường gần như tương đương và khó phân tách được bằng phương pháp điện di thông thường. Đối với các phân đoạn ADN kích thước lớn như vậy, người ta có thể phân tách bằng việc sử dụng phương pháp điện di xung trường (pulsed-field gel electrophoresis). Trong phương pháp này, người ta sử dụng 2 cặp điện cực nằm chéo góc trên bản điện di . Việc “bật” và “tắt” luân phiên 2 cặp điện cực sẽ làm cho các phân đoạn ADN lớn thay đổi chiều. Các phân đoạn ADN có kích thước càng lớn càng chậm hơn trong quá trình thay đổi chiều di chuyển. Nhờ vậy, các phân đoạn có kích thước khác nhau sẽ phân tách ra khỏi nhau trong quá trình di chuyển. Kỹ thuật điện di xung trường trong thực tế có thể sử dụng để xác định được kích thước đầy đủ của nhiễm sắc thể vi khuẩn, hoặc nhiễm sắc thể các loài sinh vật nhân chuẩn bậc thấp, như nấm men. Những loài này có kích thước hệ gen khoảng vài Mb.
Điện di không những có thể phân tách các phân đoạn ADN khác nhau về kích thước mà cả về hình dạng và cấu hình không gian của chúng. Các phân tử ADN ở dạng mạch vòng giãn xoắn hoặc bị “đứt gãy” ở một số nucleotit di chuyển chậm hơn trên trường điện di so với các phân tử ADN ở dạng mạch thẳng có cùng khối lượng. Tương tự như vậy, các phân tử ADN ở dạng siêu xoắn, kích thước và thể tích thu nhỏ thường di chuyển nhanh hơn trên trường điện di so với các phân tử ADN dạng mạch vòng giãn xoắn hoặc có mức độ cuộn xoắn thấp hơn có cùng khối lượng.
Kỹ thuật điện di cũng được sử dụng để phân tách các phân tử ARN. Các phân đoạn ADN sợi kép mạch thẳng có cấu trúc bậc hai đồng nhất nên tốc độ di chuyển trên trường điện di tương quan tỉ lệ thuận với khối lượng phân tử của chúng. Cũng giống như ADN, các phân tử ARN cũng thường tích điện âm, nhưng ngoài cấu trúc cơ bản ở dạng mạch đơn, các cấu trúc bậc 2 và 3 của phân tử ARN có ảnh hưởng đến tốc độ di chuyển của chúng trên trường điện di. Để hạn chế điều này, thông thường người ta phải xử lý ARN với một số hóa chất ngăn cản sự hình thành các liên kết cục bộ trong phân tử ARN, chẳng hạn như glyoxal. Hợp chất này liên kết với nhóm -NH2 trong các bazơ nitơ và ngăn cản sự kết cặp của các nucleotit. Các phân tử ARN được xử lý glyoxal không hình thành được các cấu trúc bậc 2 và 3 vì vậy có tốc độ di chuyển trên trường điện di dường như đơn thuần phụ thuộc vào khối lượng phân tử của chúng.
V.1.2. Sử dụng enzym giới hạn trong phân tích ADN
Hầu hết các phân tử ADN trong tự nhiên đều lớn hơn nhiều so với kích thước có thể thao tác và phân tích một cách thuận lợi trong phòng thí nghiệm. Trong các tế bào, phần lớn các nhiễm sắc thể thường là một phân tử ADN dài chứa hàng trăm thậm trí hàng nghìn gen khác nhau. Vì vậy, để có thể phân lập và phân tích từng gen, người ta phải cắt các phân tử ADN kích thước lớn thành các phân đoạn nhỏ. Công việc này được thực hiện bởi một nhóm các enzym đặc biệt gọi là enzym giới hạn.
Tất cả các enzym giới hạn đều có hai đặc tính: 1) nhận biết một trình tự đặc hiệu trên phân tử ADN (gọi là trình tự giới hạn); và 2) cắt bên trong phân tử ADN tại vị trí đặc hiệu (hoặc ngay tại vị trí giới hạn như đối với nhóm enzym giới hạn loại ; hoặc cách vị trí giới hạn một số nucleotit nhất định như đối với các nhóm enzym giới hạn thuộc các nhóm và ). Trong các nhóm enzym giới hạn, nhóm thường được dùng trong các nghiên cứu di truyền phân tử và kỹ nghệ gen là nhóm nhờ vị trí và trình tự cắt của chúng được xác định rõ. Vì vậy chúng ta chỉ đề cập đến việc ứng dụng của nhóm enzym giới hạn này. Các trình tự giới hạn của enzym nhóm thường gồm 4 - 8 bp, thông thường có tính đối xứng và vị trí cắt thường nằm trong trình tự giới hạn này. Ví dụ như enzym giới hạn coR được tìm thấy ở vi khuẩn E. coli có trình tự giới hạn là 5’-GAATTC- 3’ với vị trí cắt ở giữa G và A. Tên enzym gồm 3 ký tự đầu chỉ tên loài vi khuẩn mà từ đó enzym được tìm thấy (Eco = Escherichia coli), các ký tự sau chỉ tên của chủng vi khuẩn và số thứ tự của enzym được tìm thấy ở loài vi khuẩn đó (EcoRI
là enzym giới hạn đầu tiên được tìm thấy ở E. coli).
Một enzym giới hạn có trình tự giới hạn gồm 6 bp giống EcoRI thông thường được trông đợi sẽ có trung bình một vị trí cắt trong một đoạn trình tự có kích thước khoảng 4 kb (bởi theo nguyên tắc xác suất tại một vị trí nhất định xác suất để có một loại nucleotit nhất định là 1/4, vì vậy xác suất để có một trình tự nhất định gồm 6 bp sẽ là 1/46 = 1/4096). Giả sử có một phân tử ADN mạch thẳng có 6 vị trí cắt của enzym EcoRI. Việc cắt phân tử ADN này bằng EcoRI sẽ cho ra 7 phân đoạn ADN khác nhau. Do đó, khi điện di trên gel sản phẩm cắt, 7 phân đoạn ADN sẽ phân tách nhau ra do chúng khác nhau về khối lượng (vì chúng khác nhau về thành phần và trình tự các nucleotit). Như vậy, một phân đoạn ADN sẽ tương ứng với một vùng của phân tử ADN ban đầu.
Việc sử dụng một enzym giới hạn khác, chẳng hạn HindIII cũng có trình tự giới hạn gồm 6 bp, nhưng có trình tự giới hạn thay đổi (5’-AAGCTT- 3’) sẽ cho ra các sản phẩm cắt khác với khi sử dụng EcoRI (với cùng phân tử ADN ban đầu). Như vậy, việc sử dụng đồng thời nhiều enzym giới hạn sẽ tạo ra một kiểu hình phổ điện di các phân đoạn cắt giới hạn đặc thù đối với từng gen phân tích.
Đối với một số enzym giới hạn khác, chẳng hạn như Sau3A1 (tìm thấy ở vi khuẩn Staphylococcus aureus) có trình tự giới hạn ngắn hơn (5’-GATC-3’), nên tần số cắt của chúng thường cao hơn các enzym có trình tự giới hạn dài. Theo xác suất, Sau3A1 có trung bình 1 vị trí cắt trong một đoạn trình tự khoảng 250 bp (1/44 = 1/256). Ngược lại, enzym NotI có trình tự giới hạn dài (5’-GCGGCCGC-3’) trung bình cứ một đoạn trình tự dài khoảng 65 kb, mới có 1 vị trí cắt (1/48 = 1/65536).
Các enzym giới hạn không chỉ khác nhau về trình tự giới hạn và độ dài đoạn trình tự giới hạn đặc trưng của chúng, mà chúng còn khác nhau về cách “cắt” phân tử ADN. Chẳng hạn như enzym HpaI tạo ra các phân tử ADN dạng đầu bằng (đầu tù), còn các enzym ERcoRI, HindIII và PsIt cắt phân tử ADN tạo ra các phân đoạn có đầu dính. Sở dĩ gọi là “đầu dính” bởi phần các trình tự ở hai đầu sau khi được enzym cắt ra bổ trợ với nhau theo nguyên tắc Chargaff và vì vậy chúng có xu hướng “dính” trở lại với nhau, hoặc với các phân tử ADN được cắt bởi cùng một loại enzym giới hạn. Tính chất này được ứng dụng rộng rãi trong công nghệ ADN tái tổ hợp và các kỹ thuật tách dòng phân tử.
V.1.3. Các phương pháp lai phân tử và mẫu dò
Các phân tử ADN sợi kép có một tính chất đặc biệt là khả năng biến tính (phân tách thành hai mạch đơn) và hồi tính (hai mạch đơn có trình tự bổ trợ có xu hướng liên kết trở lại khi vắng mặt các tác nhân gây biến tính). Khả năng liên kết bổ trợ giữa các bazơ nitơ cũng cho phép hai mạch ADN có nguồn gốc khác nhau nhưng có trình tự bổ trợ liên kết với nhau trong điều kiện phù hợp (về nhiệt độ, độ pH, ion hóa P) để tạo nên một phân tử ADN mới. Hiện tượng liên kết như vậy cũng có thể xảy ra giữa hai mạch ADN với nhau, hoặc giữa hai mạch ARN hoặc giữa ADN và ARN. Phân tử axit nucleic sợi kép mới hình thành được gọi là phân tử lai và quá trình kết cặp giữa các bazơ thuộc hai mạch đơn axit nucleic có nguồn gốc khác nhau theo nguyên tắc bổ trợ như vậy được gọi là quá trình lai phân tử.
Nhiều kỹ thuật trong nghiên cứu di truyền phân tử được dựa trên nguyên tắc lai phân tử. Chẳng hạn, bằng nguyên tắc này người ta có thể dùng một trình tự ADN biết trước để xác định một trình tự bổ trợ tương ứng có trong hệ gen của mẫu phân tích. Phân đoạn ADN có trình tự biết trước dùng trong phản ứng lai như vậy được gọi là mẫu dò. Các mẫu dò có thể có nguồn gốc từ các phân đoạn ADN trong tự nhiên hoặc được tổng hợp theo nguyên tắc hóa học, và để nhận biết được chúng, các mẫu dò thường được đánh dấu với các chất phóng xạ hoặc phát huỳnh quang (ở đây, gọi tắt là chất phát quang).
Có hai phương pháp đánh dấu mẫu dò ADN. Phương pháp thứ nhất dùng nguyên tắc tổng hợp hóa học phân tử ADN mới với tiền chất là các phân tử đánh dấu. Phương pháp thứ hai là gắn một phân tử đánh dấu vào đuôi của một trình tự ADN có sẵn. Chẳng hạn, bằng việc sử dụng enzym polynucleotide kinase, người ta có thể bổ sung nhóm phosphat g của ATP vào nhóm 5’- OH của một phân tử ADN định đánh dấu. Nếu nhóm phosphat này được đánh dấu bằng đồng vị phóng xạ 32P thì phân tử ADN sẽ được dánh dấu phóng xạ.
Phương pháp đánh dấu ADN thứ hai (sử dụng các tiền chất đánh dấu) thường được thực hiện dựa trên phản ứng PCR, hoặc đôi khi chỉ cần sử dụng các đoạn mồi ngắn rồi cho enzym ADN polymerase thực hiện phản ứng kéo dài chuỗi. Các tiền chất đánh dấu được sử dụng thường là 1 trong 4 loại nucleotit được cải biến thành dạng được đánh dấu bằng cách gắn với các nhóm chất phát quang hoặc nguyên tử phóng xạ. Với phương pháp này, khoảng 25% nucleotit trong phân tử ADN được đánh dấu và điều đó đủ đáp ứng hầu hết các nhu cầu nghiên cứu khác nhau.
Các phân tử ADN đánh dấu với các tiền chất phát quang được phát hiện bằng cách chiếu xạ mẫu ADN với ánh sáng UV có bước sóng phù hợp và đo ở bước sóng phát xạ tương ứng. Các phân tử ADN được đánh dấu phóng xạ thường được phát hiện bằng cách chụp mẫu ADN với phim tia X, hoặc đo bằng máy khuếch đại tín hiệu hạt b từ các nguyên tố phóng xạ 32P và 35S (đây là hai nguyên tố phóng xạ được sử dụng phổ biến để dánh dấu ADN).
Trong các nghiên cứu di truyền học phân tử hiện nay, có nhiều cách để xác định các phân đoạn ADN và ARN đặc hiệu dựa trên các phương pháp lai. ở đây, chúng ta chỉ đề cập đến hai phương pháp được dùng phổ biến:
Xác định các phân đoạn ADN và ARN bằng điện di và mẫu dò
Phương pháp sử dụng mẫu dò kết hợp với điện di là một phương pháp cơ bản có thể giúp xác định mức độ phổ biến hoặc kích thước của một đoạn trình tự ADN hoăc ARN được quan tâm nghiên cứu. Chẳng hạn như bằng kỹ thuật này, người ta có thể xác định và so sánh được mức biểu hiện của một gen ở các loại tế bào và mô khác nhau thông qua định lượng bản phiên mã mARN tương ứng của gen đó tại các tế bào và mô tương ứng; hay như để xác định kích thước của một đoạn ADN cắt giới hạn mang trình tự gen được quan tâm nghiên cứu.
Giả sử chúng ta cắt hệ gen của nấm men bằng enzym giới hạn EcoR và cần xác định được kích thước của phân đoạn ADN cắt giới hạn mang trình gen A. Sản phẩm ADN tổng số sau khi được cắt bằng EcoR
sẽ tạo ra một số lượng lớn các phân đoạn có kích thước xấp xỉ 4 kb (vì 46 = 4096 bp). Vì vậy, nếu đem sản phẩm cắt giới hạn nhuộm với tBr, thì sản phẩm điện di sẽ là một dải các phân đoạn liên tục có kích thước xấp xỉ 4 kb, và không thể xác định được chính xác phân đoạn nào mang gen A. Trong trường hợp đó, kỹ thuật thẩm tách Southern (còn gọi là lai Southern) có thể được dùng để xác định phân đoạn mang gen đó. Lúc này, người ta sẽ đem sản phẩm cắt giới hạn ngâm vào một dung dịch có tính kiềm để làm biến tính các phân đoạn ADN sợi kép. Các phân đoạn này sau đó được chuyển sang một màng tích điện dương gọi là màng "thẩm tách" theo hình thức "đóng dấu". Nghĩa là các phân đoạn ADN định vị trên màng thẩm tách sẽ tương ứng với các phân đoạn định vị trên gel điện di. Các phân đoạn ADN gắn trên màng thẩm tách sau đó được ủ với mẫu dò là phân đoạn ADN chứa một đoạn trình tự đặc trưng bổ trợ với trình tự của gen A. Quá trình ủ được tiến hành trong điều kiện về nhiệt độ và nồng độ muối tương ứng với sự biến tính và hồi tính của axit nucleic. Trong điều kiện như đó, các mẫu dò sẽ chỉ lai đặc hiệu với phân đoạn ADN mang gen A. Do các phân đoạn gen có kích thước thường lớn hơn nhiều so với mẫu dò, nên khả năng hồi tính khó xảy ra hơn khả năng lai với mẫu dò. Sau đó, nhờ phương pháp phóng xạ tự chụp (mẫu dò được đánh dấu phóng xạ), các phân đoạn ADN bắt cặp với các mẫu dò có thể được xác định và phân lập rõ ràng. Các phân đoạn này chính là các phân đoạn mang trình tự gen A cần phân tích.
Một phương pháp tương tự như vậy cũng có thể được áp dụng trực tiếp để phân tích các sản phẩm phiên mã của gen là mARN, và được gọi là phương pháp thẩm tách Northern (lai Northern). Tuy vậy, vì so với ADN các phân tử mARN thường có kích thước ngắn hơn (khoảng 5 kb), nên trong thẩm tách Northern, các phân tử mARN không cần cắt bằng enzym giới hạn (nếu có cắt thì số vị trí cắt giới hạn của một enzym trên phân tử mARN thường thấp). Các phân tử mARN sau khi phân tách bằng điện di được chuyển lên màng tích điện dương và lai với các mẫu dò ADN có trình tự bổ trợ tương ứng thường được đánh dấu phóng xạ (trong trường hợp này, sản phẩm lai là do sự kết cặp của các bazơ nitơ thuộc hai mạch ARN và ADN có trình tự bổ trợ).
Trong thực tiễn nghiên cứu, phương pháp thẩm tách Northern thường được sử dụng để định lượng một loại phân tử mARN nhất định nào đó có trong một mẫu phân tích, hơn là để xác định kích thước của nó. Lượng mARN được xác định được xem như thông số cơ bản phản ánh mức độ biểu hiện của gen mã hóa tương ứng. Chẳng hạn như, bằng phương pháp thẩm tách Northern, các nhà nghiên cứu có thể đánh giá được ảnh hưởng của một tác nhân phiên mã nào đó đến sự biểu hiện của một gen nhất định khi tiến hành so sánh lượng mARN do gen đó mã hóa có trong các tế bào được xử lý và không được xử lý với tác nhân phiên mã. Tương tự như vậy, kỹ thuật này cho phép xác định và so sánh mức độ biểu hiện của các gen khác nhau ở các loại tế bào, mô và cơ quan khác nhau của cùng một cơ thể trong cùng một giai đoạn hoặc ở các giai đoạn khác nhau của quá trình phát triển cơ thể.
Trong kỹ thuật thẩm tách Northern, mẫu dò thường được đưa vào phản ứng lai với một lượng dư vừa đủ để đảm bảo lượng phân tử lai tạo thành tương ứng với lượng mARN có mặt trong các mẫu nghiên cứu. Hay nói cách khác, qua lượng sản phẩm lai, có thể định lượng được lượng mARN.
Nguyên lý của các phương pháp lai Northern và Southern cũng chính là cơ sở của các kỹ thuật phân tích gen bằng vi dãy phản ứng (microarray) được phát triển và ngày các được sử dụng rộng rãi trong các nghiên cứu di truyền học phân tử gần đây. Trong các phương pháp microarray, các mẫu dò thường là các đoạn cADN được tạo ra từ việc phiên mã ngược các phân tử mARN tương ứng được tách chiết từ các mô hoặc tế bào. Các mẫu dò này sau đó được tiến hành lai với một dãy các phân tử ADN, trong đó mỗi dãy thường liên quan đến một hoặc một số gen khác nhau trong cơ thể sinh vật nghiên cứu. Cường độ biểu hiệu của sản phẩm lai (nhờ sự có mặt của các phân tử đánh dấu) ở các dãy khác nhau sẽ góp phần phản ánh mức độ biểu hiện khác nhau của các gen phân tích.
V.1.4. Tách dòng phân tử và xây dựng thư viện hệ gen
Khái niệm về tách dòng phân tử và thư viện hệ gen
Tách dòng phân tử (molecular cloning) là khái niệm chỉ một nhóm các phương pháp được sử dụng để: i) phân lập một một trình tự gen (ADN) đặc hiệu từ hỗn hợp các phân tử ADN ban đầu được tách chiết từ các mẫu sinh học vốn có cấu trúc phức tạp, kích thước lớn; và ii) khuếch đại (sao chép) trình tự lên một số lượng lớn đủ để có thể tiến hành phân tích về cấu trúc và chức năng của gen tương ứng.
Khả năng tinh sạch các đoạn gen (ADN) đặc hiệu có số lượng đủ lớn là cần thiết để có thể “thao tác” các đoạn gen đó vì các mục tiêu nghiên cứu khác nhau. Chẳng hạn, từ các phân đoạn ADN được tách dòng, người ta có thể tạo ra các phân tử ADN tái tổ hợp mang các phân đoạn ADN mang nguồn gốc khác nhau. Các phân tử ADN tái tổ hợp mới có thể làm thay đổi mức độ biểu hiện bình thường của một gen (chẳng hạn bằng việc dung hợp giữa một trình tự mã hóa của một loài này với trình tự promoter của một loài khác) hoặc thậm chí mã hóa tổng hợp một loại protein “dung hợp” mới (protein lai) mang các trình tự axit amin từ các protein có nguồn gốc khác nhau. Hiện nay, các kỹ thuật tách dòng phân tử (bao gồm cả PCR) đã trở thành các công cụ thiết yếu trong nghiên cứu về sự điều hòa và biểu hiện của các gen và hệ gen ở các loài sinh vật khác nhau.
Quá trình tách dòng ADN và tạo nên các phân tử ADN tái tổ hợp điển hình thường liên quan đến việc sử dụng các véctơ là trình tự mang thông tin điều khiển hoạt động nhân lên (khuếch đại) và/hoặc biểu hiện trong tế bào của phân tử ADN tái tổ hợp mang đoạn ADN cài (đoạn trình tự được phân lập) bao gồm trình tự gen được quan tâm nghiên cứu. Các “công cụ” chính để tạo nên các phân tử ADN tái tổ hợp là các enzym giới hạn giúp cắt các phân tử ADN tại các vị trí xác định và các enzym nối cho phép ghép nối các phân đoạn ADN có nguồn gốc khác nhau với nhau. Bằng việc tạo nên các phân tử ADN tái tổ hợp có thể tự nhận lên trong tế bào chủ, một đoạn ADN cài xác định nào đó