Xem mẫu

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA Y DƯỢC -------- ĐỖ HẠNH NGUYÊN NGHIÊN CỨU ĐA DẠNG DI TRUYỀN NGUỒN GEN DÂY THƯỜNG XUÂN (Hedera nepalensis K. Koch) Ở MIỀN BẮC VIỆT NAM DỰA TRÊN CHỈ THỊ matK KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Hà Nội - 2020
  2. ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA Y DƯỢC -------- Người thực hiện: ĐỖ HẠNH NGUYÊN NGHIÊN CỨU ĐA DẠNG DI TRUYỀN NGUỒN GEN DÂY THƯỜNG XUÂN (Hedera nepalensis K. Koch) Ở MIỀN BẮC VIỆT NAM DỰA TRÊN CHỈ THỊ matK KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC (NGÀNH DƯỢC HỌC) Khóa : QH2015.Y Người hướng dẫn : ThS. Phạm Thị Hồng Nhung Lời cảm ơn Để hoàn thành khóa luận, tôi đã nhận được rất nhiều sự giúp đỡ quý bạn Hà Nội - 2020
  3. LỜI CẢM ƠN Để hoàn thành khóa luận, tôi đã nhận được rất nhiều sự giúp đỡ quý báu cả về vật chất lẫn tinh thần, về những kinh nghiệm và kiến thức chuyên môn của các thầy cô, bạn bè và gia đình. Lời đầu tiên, tôi xin bày tỏ sự kính trọng và lòng biết ơn sâu sắc tới ThS. Phạm Thị Hồng Nhung – Giảng viên Khoa Y Dược – Đại học Quốc gia Hà Nội, người tận tình chỉ bảo và hướng dẫn tôi trong suốt quá trình nghiên cứu đề tài và hoàn thành khóa luận này. Tôi xin cảm ơn ThS. Đỗ Thị Lệ Hằng và bạn Bùi Thị Yến đã hỗ trợ và giúp đỡ tôi trong quá trình thực nghiệm. Các cô, các bạn không chỉ trang bị cho tôi kiến thức, mà còn truyền cho tôi niềm đam mê, lòng nhiệt huyết, sự kiên trì và luôn sẵn sàng giúp đỡ mỗi khi tôi gặp khó khăn. Tôi xin chân thành cảm ơn các thầy cô giáo Bộ môn Y Dược học cơ sở đã hết lòng quan tâm, giúp đỡ và tạo điều kiện tốt nhất cho tôi thực hiện nghiên cứu và hoàn thành khóa luận tốt nghiệp này. Tôi cũng xin cảm ơn những cán bộ tại Viện Dược liệu - Bộ Y tế đã không quản ngại khó khăn thu thập và cung cấp mẫu vật giúp đỡ tôi thực hiện đề tài một cách thuận lợi nhất. Tôi xin gửi lời cảm ơn tới Ban chủ nhiệm khoa, cùng toàn thể các thầy cô giáo Khoa Y Dược - Đại học Quốc gia Hà Nội đã cho tôi những kiến thức quý báu trong quá trình học tập tại nhà trường. Chúng tôi trân trọng cảm ơn sự tài trợ kinh phí của Bộ Khoa học và Công nghệ Việt Nam cho đề tài mã số NVQG-2018/02 do PGS.TS Đinh Đoàn Long chủ trì để thực hiện nghiên cứu này. Cuối cùng, tôi xin được bày tỏ lòng biết ơn và sự yêu thương đến gia đình và bạn bè đã luôn ở bên cổ vũ, động viên và tạo mọi điều kiện giúp đỡ tôi trong thời gian học tập và thực hiện đề tài khóa luận này. Xin chân thành cảm ơn! Hà Nội, ngày 09 tháng 06 năm 2020 Tác giả Đỗ Hạnh Nguyên
  4. DANH MỤC TỪ VIẾT TẮT bp Cặp bazơ (base pair) DNA Axit deoxyribonucleic (Deoxyribonucleic acid) dNTP Deoxyribonucleotide 5’ triphosphate GBSSI Gen mã hóa enzyme tạo liên kết hạt (Granule-Bound Starch Synthase) Genbank Ngân hàng dữ liệu gen quốc tế H.helix Thường xuân (Hedera helix L.) H.nepalensis Dây thường xuân (Hedera nepalensis K.Koch) ITS Vùng sao chép nội bộ (Internal transcribed spacer) Kit Thermo GeneJET Plant Genomic DNA Purification Mini Kit (Thermo Scientific, Mỹ) matK Maturase K ML Maximum Likelihood NCBI Trung tâm Thông tin Công nghệ sinh học Quốc gia (National Center for Biotechnology Information) OD Mật độ quang học (Optical Density) PCR Phản ứng chuỗi trùng hợp (Polymerase Chain Reaction) RNA Axit ribonucleic (Ribonucleic acid) TrnK Translocated tRNA-Lys gene UPGMA Unweighted PairGroup with Method using arthmetic Averages
  5. DANH MỤC CÁC BẢNG Trang Bảng 1.1. Một số cặp mồi được sử trong nghiên cứu phân loại... ..............................9 Bảng 1.2. Các tác dụng dược lý của H. nepalensis ................................................. 20 Bảng 2.1. Thông tin mẫu thực vật dùng trong nghiên cứu ...................................... 21 Bảng 3.1. Nồng độ DNA tổng số của các mẫu nghiên cứu ..................................... 26 Bảng 3.2. Các thành phần và chu trình nhiệt của phản ứng PCR nhân dòng đoạn gen matK .................................................................................................................. 30 Bảng 3.3. Các trình tự tham chiếu lấy từ Genbank sử dụng trong nghiên cứu........ 31 Bảng 3.4. Phân nhóm các mẫu trong nghiên cứu .................................................... 32 Bảng 3.5. Khoảng cách di truyền (phía dưới bên trái) và số lượng nucleotide sai khác (phía tên bên phải) giữa 03 haplotype với 03 trình tự tham chiếu .................. 32 Bảng 4.1. Trình tự các mồi của gen matK được sử dụng trong các nghiên cứu về chi Hedera trên thế giới ................................................................................................. 43
  6. DANH MỤC CÁC HÌNH Trang Hình 1.1. Vị trí của gen matK .................................................................................... 11 Hình 1.2. Đặc điểm hình thái Dây thường xuân......................................................... 17 Hình 1.3. Phân bố địa lý của Dây thường xuân ở miền Bắc Việt Nam. .................... 18 Hình 2.1. Sơ đồ thiết kế nghiên cứu ........................................................................... 23 Hình 3.1. Ảnh điện di DNA tổng số trên gel agarose 1,2% ....................................... 26 Hình 3.2. Tối ưu nhiệt độ gắn mồi phản ứng nhân dòng gen matK .......................... 28 Hình 3.3. Tối ưu nồng độ DNA phản ứng nhân dòng gen matK ............................... 29 Hình 3.4. Tối ưu nồng độ mồi phản ứng nhân dòng gen matK .................................. 29 Hình 3.5. Kết quả PCR nhân dòng đoạn gen matK .................................................... 30 Hình 3.6. Kết quả hiển thị giải trình tự của mẫu đại diện H4 của gen matK qua phần mềm BioEdit ............................................................................................................... 31 Hình 3.7. So sánh trình tự đoạn gen matK của các haplotype nghiên cứu với các trình tự tham chiếu ...................................................................................................... 33 Hình 3.8. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03 haplotype nghiên cứu với 03 trình tự tham chiếu dựa trên chỉ thị matK .................... 34 Hình 3.9. Cây phát sinh chủng loại xây dựng bằng phương pháp Maximum Likelihood của 03 haplotype nghiên cứu với 03 trình tự tham chiếu dựa trên chỉ thị matK ............................................................................................................................ 35 Hình 3.10. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03 haplotype nghiên cứu với trình tự các loài Hedera dựa trên chỉ thị matK.................. 36
  7. MỤC LỤC Trang ĐẶT VẤN ĐỀ ............................................................................................................ 1 CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 3 1.1. Đa dạng và phân loại sinh học .......................................................................... 3 1.1.1. Khái niệm đa dạng sinh học ....................................................................... 3 1.1.2. Đa dạng di truyền ....................................................................................... 3 1.1.3. Thực trạng đa dạng sinh học tại Việt Nam................................................. 4 1.1.4. Các phương pháp phân loại học ................................................................. 5 1.2. Công cụ phân tích đa dạng di truyền và tiến hóa.............................................. 8 1.2.1. Tổng quan về mã vạch DNA ...................................................................... 8 1.2.2. Ứng dụng của mã vạch DNA ở thực vật .................................................... 9 1.2.3. Vùng gen lục lạp matK (maturase K)....................................................... 11 1.3. Phân tích phát sinh gen (Phylogenetic Analysis) ........................................... 12 1.3.1. Lựa chọn trình tự sinh học........................................................................ 12 1.3.2. Sắp xếp đa chuỗi....................................................................................... 13 1.3.3. Lựa chọn mô hình tiến hóa ....................................................................... 13 1.3.4. Xây dựng cây phát sinh loài ..................................................................... 14 1.3.5. Đánh giá cây phát sinh loài ...................................................................... 15 1.4. Tổng quan về loài Dây thường xuân (Hedera nepalensis K.Koch) ............... 15 1.4.1. Đặc điểm hình thái chung của loài Dây thường xuân .............................. 15 1.4.2. Đặc điểm phân bố, sinh thái ..................................................................... 18 1.4.3. Thành phần hóa học ................................................................................. 19 1.4.4. Tác dụng dược lý ...................................................................................... 19 CHƯƠNG 2. ĐỐI TƯỢNG & PHƯƠNG PHÁP NGHIÊN CỨU ..................... 21 2.1. Đối tượng nghiên cứu ..................................................................................... 21 2.1.1. Đối tượng .................................................................................................. 21 2.1.2. Tiêu chuẩn lựa chọn mẫu ......................................................................... 21 2.2. Thời gian, địa điểm nghiên cứu ...................................................................... 22 2.3. Dụng cụ, trang thiết bị và hóa chất nghiên cứu .............................................. 22 2.3.1. Hóa chất .................................................................................................... 22
  8. 2.3.2. Trang thiết bị ............................................................................................ 23 2.4. Phương pháp nghiên cứu ................................................................................ 23 2.4.1. Tách chiết DNA tổng số ........................................................................... 24 2.4.2. Khuếch đại đoạn gen đích bằng kỹ thuật PCR ......................................... 24 2.4.3. Tinh sạch và giải trình tự .......................................................................... 25 2.4.4. Xử lý số liệu và phân tích kết quả ............................................................ 25 CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU .............................................................. 26 3.1. Tách chiết DNA tổng số ................................................................................. 26 3.2. Kết quả tối ưu hóa quy trình nhân dòng đoạn gen matK bằng kỹ thuật PCR 27 3.2.1. Tối ưu quy trình PCR ............................................................................... 27 3.2.2. Kết quả nhân dòng gen matK từ các mẫu thực vật ................................... 29 3.3. Giải trình tự ..................................................................................................... 31 3.4. Độ tương đồng của trình tự gen matK được khuếch đại................................. 31 3.5. Cây phát sinh chủng loại dựa trên vùng gen matK ......................................... 34 CHƯƠNG 4. BÀN LUẬN ....................................................................................... 38 4.1. Kết quả xây dựng quy trình phân tích đoạn gen matK ................................... 38 4.1.1. Tách chiết DNA tổng số ........................................................................... 38 4.1.2. Khuếch đại đoạn gen matK ...................................................................... 39 4.1.3. Giải trình tự và so sánh độ tương đồng .................................................... 40 4.2. Nghiên cứu đa dạng di truyền nguồn gen Dây thường xuân sử dụng mã vạch matK.......................................................................................................................40 4.2.1. Khoảng cách di truyền .............................................................................. 40 4.2.2. Phân tích đa dạng di truyền nguồn gen Dây thường xuân ở miền Bắc Việt Nam ............................................................................................................ 41 KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................ 47 TÀI LIỆU THAM KHẢO ..........................................................................................
  9. ĐẶT VẤN ĐỀ Việt Nam nằm trong vùng khí hậu nhiệt đới ẩm gió mùa nên có hệ thực vật phong phú và đa dạng, trong đó đặc biệt phải kể đến nhóm tài nguyên cây thuốc. Theo kết quả điều tra của Viện Dược liệu, Việt Nam có 3948 loài thực vật bậc cao, bậc thấp và nấm lớn được dùng làm thuốc [2]. Tuy nhiên, phần lớn các cây thuốc được sử dụng theo kinh nghiệm dân gian hoặc theo Y học cổ truyền mà chưa được nghiên cứu một cách chuyên sâu và đầy đủ. Vì vậy, cần có thêm nhiều nghiên cứu đánh giá chính xác mức độ đa dạng di truyền của các loài cây thuốc nhằm định hướng bảo tồn, chọn, tạo và nhân giống để đáp ứng yêu cầu phát triển của nền công nghiệp chế biến dược liệu bền vững. Trong hệ thực vật đó, Hedera (L.) là một chi thuộc họ Nhân sâm (Araliaceae) trên thế giới đã ghi nhận 16 loài, một số loài được biết có giá trị làm thuốc [15]. Trong số đó, 2 loài đến nay được sử dụng rộng rãi và nghiên cứu nhiều hơn cả về dược học là Thường xuân - H. helix và Dây thường xuân - H. nepalensis đều có phạm vi phân bố tương đối hẹp trên thế giới. Theo đó H. helix được tìm thấy chủ yếu ở Châu Âu và một phần Nam Á, còn H. nepalensis được phát hiện phân bố ở các nước châu Á như: Trung Quốc, Ấn Độ, Pakistan, Nepal, Thái Lan,… Ở Việt Nam, loài này được báo cáo xuất hiện tại một số tỉnh vùng núi phía Bắc như Lào Cai, Hà Giang,... H. helix đã được các nhà khoa học trên thế giới chứng minh có nhiều tác dụng dược lý trong điều trị các bệnh về hô hấp, nhiễm khuẩn, bảo vệ gan và đã được phát triển thành thuốc điều trị viêm đường hô hấp cấp và mạn tính (Prospan). Trong khi đó ở Việt Nam, Dây thường xuân (H. nepalensis) chủ yếu được dùng làm cây cảnh và chưa có một nghiên cứu nào về thành phần hoá học và tác dụng dược lý. Trong Dây thường xuân có chứa các hợp chất n-hexan và ethyl acetate có tác dụng chống ung thư [55], ngoài ra còn chứa lupeol, một triterpenoid có hoạt tính ức chế dipeptidyl peptidase-4 với tiềm năng chữa bệnh tiểu đường [40, 83]. Không chỉ vậy, nhiều nghiên cứu đã chứng minh rằng H. nepalensis có tác dụng bảo vệ thần kinh [40], chống viêm, giảm đau, chống đông máu và chống trầm cảm [52]. Với những tiềm năng dược lý như vậy, song hiện nay chưa có nhiều nghiên cứu về H. nepalensis, đặc biệt là các nghiên cứu đánh giá tiềm năng đa dạng sinh học phục vụ công tác bảo tồn, khai thác và phát triển nguồn gen. Chúng tôi cho rằng việc phân tích đa dạng di truyền nguồn gen Dây thường xuân là thực sự cần thiết nhất là khi phạm vi phân bố tự nhiên của loài này trên thế giới tương đối hạn chế. Ngoài yêu 1
  10. cầu đánh giá đa dạng di truyền nguồn gen Dây thường xuân ở Việt Nam, định loại chính xác loài để từ đó có chiến lược bảo tồn, khai thác và phát triển cũng là vấn đề nghiên cứu cấp thiết hiện nay. Trên thế giới, việc sử dụng các chỉ thị DNA ngày càng được dùng rộng rãi trong các nghiên cứu phân loại, phân tích đa dạng sinh học, xác định khoảng cách di truyền và đặc trưng cá thể và quần thể thực vật nhằm mục đích bảo tồn và chọn giống. So với các chỉ thị truyền thống (chỉ thị hình thái và chỉ thị hóa học), thì chỉ thị DNA mang những ưu điểm nổi bật: dễ thực hiện trong điều kiện phòng thí nghiệm, không phụ thuộc vào các yếu tố môi trường và hiện tượng tương tác gen, có thể xác định được các biến dị DNA trong các giai đoạn khác nhau và ở các cơ quan khác nhau của thực vật. Để phục vụ cho nghiên cứu này, chúng tôi sử dụng chỉ thị phân tử là matK (maturase K) trong vùng gen lục lạp làm công cụ giúp xây dựng cây phát sinh loài. Mã vạch này là chỉ thị phân tử nổi bật được ứng dụng thành công trong nhiều nghiên cứu giúp phân tích đa dạng di truyền và định danh nhiều loài thực vật, có thể kể đến như chi Panax, chi Alium[14], họ Valerianaceae [46] hay chi Dalbergia [22],… Nhưng câu hỏi được đặt ra là liệu matK có phải là chỉ thị DNA thích hợp để phân tích đa dạng di truyền loài Dây thường xuân hay không? Chính vì vậy, chúng tôi thực hiện đề tài “Nghiên cứu đa dạng di truyền nguồn gen Dây thường xuân (Hedera nepalensis K.Koch) ở miền Bắc Việt Nam dựa trên chỉ thị matK”. Nghiên cứu này hướng đến hai mục tiêu: 1. Xây dựng được quy trình nhân dòng đoạn gen matK của Dây thường xuân. 2. Xây dựng cây phát sinh chủng loại dựa vào chỉ thị matK và dùng chỉ thị này để đánh giá mức độ đa dạng di truyền nguồn gen Dây thường xuân thu thập ở miền Bắc Việt Nam. Để thực hiện được mục tiêu nghiên cứu này, chúng tôi tiến hành các nội dung nghiên cứu sau: 1. Tách DNA tổng số thu từ mẫu lá khô Dây thường xuân 2. Tối ưu phản ứng PCR và tiến hành nhân dòng đoạn gen matK 3. Giải trình tự vùng gen matK được nhân dòng 4. Xây dựng cây phát sinh chủng loại dựa trên chỉ thị matK 2
  11. CHƯƠNG 1. TỔNG QUAN TÀI LIỆU 1.1. Đa dạng và phân loại sinh học 1.1.1. Khái niệm đa dạng sinh học Năm 1982, định nghĩa của Wilcox “Đa dạng sinh học là sự đa dạng của các dạng sống ở tất cả các cấp độ của hệ thống sinh học” được đưa ra bởi Liên minh quốc tế về bảo tồn tài nguyên và tự nhiên (IUCN). Đến năm 1984, Wilcox cho rằng đa dạng sinh học có thể được định nghĩa về mặt di truyền là sự đa dạng của các alen, gen của sinh vật. Cho đến năm 1992, một định nghĩa khác được quốc tế công nhận và được sử dụng trong Công ước Liên hợp Quốc về đa dạng sinh học: Đa dạng sinh học là sự biến đổi sinh vật sống từ tất cả các nguồn bao gồm các hệ sinh thái và các phức hợp sinh thái mà chúng là một phần: bao gồm sự đa dạng trong loài (đa dạng di truyền, đa dạng gen), giữa loài (đa dạng loài) và hệ sinh thái (đa dạng hệ sinh thái) [41]. Ngoài ra, trong cuốn sách “Biodiversity: an introduction”, Gaston và Spicer định nghĩa “Đa dạng sinh học là sự biến đổi của sự sống ở tất cả các cấp độ tổ chức sinh học” [35]. Đa dạng sinh học thường được sử dụng để thay thế các thuật ngữ đa dạng loài và sự phong phú của loài. Các nhà sinh học thường định nghĩa đa dạng sinh học là “tổng số gen, loài và hệ sinh thái của một khu vực” [67]. Định nghĩa này có lợi thế trong việc bao trùm tất cả các trường hợp và trình bày một quan điểm thống nhất về các loại sinh học truyền thống bao gồm: đa dạng phân loại (cấp độ loài), đa dạng sinh thái (dưới góc độ hệ sinh thái), đa dạng hình thái (bắt nguồn từ đa dạng di truyền và đa dạng phân tử) và đa dạng chức năng (thước đo số lượng các loài khác nhau về chức năng trong quần thể). Đa dạng sinh học có vai trò quan trọng trong việc phát triển kinh tế, xã hội và môi trường, là cơ sở đảm bảo an ninh lương thực; duy trì nguồn gen vật nuôi, cây trồng; cung cấp các vật liệu cho xây dựng và các nguồn nguyên liệu và dược liệu. 1.1.2. Đa dạng di truyền Đa dạng di truyền là sự đa dạng ở cấp độ phân tử về thành phần gen giữa các cá thể trong cùng một loài và giữa các loài khác nhau; là sự đa dạng về gen có thể di truyền được trong một quần thể hoặc giữa các quần thể, tồn tại trong một loài và giữa các loài khác nhau. Đa dạng di truyền là cơ chế giúp sinh vật tồn tại trong những điều kiện khác nhau nên cần thiết cho tất cả các sinh vật để duy trì nòi giống. Thông qua đa dạng di truyền, sinh vật tạo nên những cơ chế mới, kháng lại các loại dịch bệnh và thích nghi với biến đổi môi trường [34]. Mỗi loài có chứa những gen 3
  12. riêng biệt thể hiện đặc tính riêng của nó như một cách để các quần thể có thể thích nghi được với môi trường sống thay đổi. Với các áp lực như: chọn lọc nhân tạo, môi trường sống khắc nghiệt,… một số cá thể trong một quần thể sẽ có cơ hội cao hơn trong việc sở hữu những biến dị alen phù hợp với môi trường giúp duy trì nòi giống có alen đó. Quần thể đó sẽ tiếp tục có thêm nhiều thế hệ nhờ sự thành công của những cá thể này. Đa dạng di truyền là phân mức cơ bản nhất trong đa dạng sinh học, tạo nên sự khác biệt của các cá thể trong quần thể. Đa dạng sinh học dù trong phạm vi một loài hay giữa các loài và các hệ sinh thái với nhau thì cũng đều xuất phát từ đa dạng di truyền. Nghiên cứu về đa dạng di truyền cũng là các nghiên cứu cơ bản và chính xác nhất về sự khác biệt giữa các loài. Tuy nhiên, đa dạng di truyền vẫn chưa được quan tâm đúng mức mặc dù loại đa dạng này chính là nền tảng cho sự đa dạng của sinh giới [5]. Ứng dụng của nghiên cứu đa dạng di truyền bao gồm: Bảo tồn nguồn gen; Lai tạo giống mới và Nghiên cứu tiến hóa. 1.1.3. Thực trạng đa dạng sinh học tại Việt Nam Việt Nam đứng thứ 16 về mức độ đa dạng sinh học trên thế giới và được biết đến như một trung tâm đa dạng sinh học với các hệ sinh thái tự nhiên phong phú và sự giàu có về các loài và nguồn gen sinh vật. Trong đó, đã xác định được khoảng 49200 loài sinh vật bao gồm: khoảng 7500 chủng vi sinh vật; 20000 loài thực vật trên cạn và dưới nước; 10500 loài động vật trên cạn; 2000 loài động vật không xương sống và cá sống ở nước ngọt; khoảng trên 11000 loài sinh vật biển. Đặc biệt, một bộ phận lớn của các giống thực vật, động vật này có các đặc tính quý chỉ có ở nước ta, nên tiềm năng phát triển và đem lại giá trị kinh tế rất cao [6]. Việt Nam có số lượng lớn nguồn gen dược liệu, sở hữu nhiều loài dược liệu quý hiếm và là nơi có nguồn đa dạng sinh học phong phú. Tuy nhiên, những sản phẩm từ dược liệu quý của nước ta chưa trở thành hàng hóa có giá trị cao và chưa được sử dụng rộng rãi trong cộng đồng. Cũng như nhiều quốc gia khác trên thế giới, Việt Nam đang đối diện với nguy cơ suy thoái đa dạng sinh học và sự mất cân bằng sinh thái diễn ra mạnh mẽ. Tài nguyên đa dạng sinh học đang trên đà suy giảm một cách đáng báo động, các hệ sinh thái bị thu hẹp, suy giảm và bị chia cắt, nguồn gen bị thất thoát, mai một. Nguyên nhân là do áp lực của gia tăng dân số kéo theo tài nguyên sinh vật bị khai thác quá mức và không được tái tạo. Ngoài ra, công tác bảo tồn còn nhiều bất cập, hệ thống các quy định pháp luật về bảo tồn đa dạng sinh học chưa đồng bộ. Vì vậy, vấn đề cấp thiết hiện nay là cần phải bảo tồn và phát triển nguồn gen. 4
  13. 1.1.4. Các phương pháp phân loại học Phân loại học là lĩnh vực sinh học liên quan đến xác định, đặt tên và phân loại các loài. Phân loại học là quá trình các nhà khoa học nhóm các sinh vật sống dựa trên mức độ giống nhau của chúng nhằm phản ánh sự liên quan tiến hóa của các sinh vật và các nhóm sinh vật. Trong lịch sử, sự giống nhau được xác định bằng cách kiểm tra các đặc điểm vật lý, hóa học. Theo truyền thống những đặc điểm này có thể quan sát bằng hình thái nhưng với sự ra đời và phát triển của giải trình tự gen, trình tự DNA và các dấu hiệu phân tử cũng được sử dụng để phân loại, định danh các loài. 1.1.4.1. Phương pháp phân loại học truyền thống Phân loại học truyền thồng gồm 2 phân loại là phân loại dựa trên các chỉ thị hình thái và dựa vào các chỉ thị hóa học (như sắc ký lớp mỏng - TLC hay sắc ký lớp mỏng hiệu năng cao – HPLC,…). Trong đó, phân loại học hình thái được sử dụng phổ biến hơn và đóng vai trò quan trọng trong lĩnh vực phân loại học. Phân loại học hình thái dựa trên sự tương đồng rõ ràng nhất giữa các loài và đã được đưa ra từ rất lâu trước khi ý tưởng về sự tiến hóa xuất hiện. Phân loại học này chủ yếu dựa trên sự khác biệt đặc điểm hình thái các cơ quan của thực vật, đặc biệt là hoa (cơ quan sinh sản). Phương pháp phân loại học hình thái có lịch sử lâu đời và nhờ vào phương pháp này mà hệ thống phân loại thực vật được hoàn thiện khá đầy đủ. Ưu điểm của nó là có thể phân biệt các loài dựa trên sự quan sát các đặc điểm bên ngoài, dễ ứng dụng và thân thiện với nhiều đối tượng. Tuy nhiên, nhược điểm của phương pháp này là sẽ gặp khó khăn khi phân loại các mẫu đang trong giai đoạn phát triển (chưa ra hoa) hoặc có các đặc điểm hình thái giống nhau do cùng sinh trưởng và phát triển trong cùng một điều kiện môi trường địa lý hay có nhiều điểm tương đồng do ở mức độ phân loại thấp như loài và dưới loài [57]. Không chỉ vậy, phương pháp này thường được sử dụng bởi các chuyên gia hình thái và cần một khoảng thời gian tương đối dài và tốn nhiều công sức [42]. Dù còn tồn tại nhiều nhược điểm nhưng không thể phủ nhận tầm quan trọng của phân loại học hình thái trong lĩnh vực phân loại học hiện nay. 1.4.1.2. Phương pháp phân loại học hiện đại Để khắc phục những nhược điểm của phương pháp phân loại học truyền thống, hiện nay các nhà khoa học đã xây dựng nhiều phương pháp phân loại học mới, trong đó: 5
  14. Phân loại học phân tử Với sự phát triển của sinh học phân tử vào những năm 1990 cùng với thành công của việc giải trình tự gen, phân loại học phân tử được hình thành. Phương pháp phân loại này dựa trên việc phân tích các dữ liệu về gen (DNA) trong hoặc ngoài nhân hoặc cả hệ gen hay các sản phẩm của chúng như protein, enzyme. Từ đó giúp định danh và xây dựng mối quan hệ tiến hóa và di truyền giữa các loài. Tùy vào mục đích nghiên cứu, có thể lựa chọn một trong các công cụ DNA hay protein. Các kỹ thuật sinh học phân tử được sử dụng gồm: giải trình tự DNA, đa hình các đoạn DNA nhân bản ngẫu nhiên (Random Amplified Polymorphic DNA), đa hình chiều dài các đoạn cắt giới hạn (Restriction Fragment Length Polymorphism) hay kỹ thuật đồng enzyme (isozyme),…[10] Các kỹ thuật này đã được ứng dụng thành công trong việc phân loại, định danh và xác định mối quan hệ tiến hóa của nhiều loài sinh vật và ngày càng cho thấy những lợi ích thiết thực. So với phân loại học truyền thống thì phương pháp này giúp quá trình xác định các loài trở nên nhanh, chính xác và ít tốn kém hơn [9]. Mục tiêu chính của phân loại học phân tử là: (i) Xác định mối quan hệ phân cấp giữa các loài hiện có theo mối quan hệ tiến hóa của chúng. Vì vậy, các sinh vật có chung một tổ tiên chung được nhóm lại sớm hơn so với những sinh vật có tổ tiên chung xa hơn. (ii) Ước tính thời gian phân kỳ giữa các loài, tức là thời gian tồn tại của tổ tiên chung gần nhất. Phân loại học hiện trạng số (Numerical taxonomy) Phân loại học hiện trạng số là một hệ thống phân loại cho phép so sánh số lượng lớn các đặc điểm (từ 60 dấu hiệu trở lên) cho số lượng lớn các chủng bằng cách phân tích bộ dữ liệu được tạo ra bằng máy tính. Phương pháp này áp dụng các quy trình toán học khác nhau cho dữ liệu trạng thái ký tự được mã hóa số. Nó nhằm mục đích tạo ra một phân loại sử dụng các thuật toán số như phân tích cụm thay vì sử dụng đánh giá chủ quan các thuộc tính. Các bộ dữ liệu về ma trận cho thấy mức độ tương đồng giữa từng cụm rồi từ đó tạo thành một bức tranh chung về đặc điểm kiểu hình của một nhóm cụ thể. Khái niệm này được đưa ra lần đầu tiên bởi Robert R. Sokal và Peter HA Sneath vào năm 1963 [87], sau đó được xây dựng và phát triển bởi cùng nhóm tác giả [86]. Ưu điểm của phương pháp này là dữ liệu phân loại được thu thập từ nhiều nguồn khác nhau, như hình thái, hóa học, sinh lý,… Sự trợ giúp của hệ thống dữ liệu điện tử cho phép nhiều công việc phân loại được thực 6
  15. hiện. Tuy nhiên, vẫn tồn tại nhược điểm bao gồm: Đối xử với sinh vật như những đối tượng phi sinh vật; Loại trừ yếu tố tiến hóa, không phân loại được phát sinh gen; Sự lựa chọn trọng số ngầm định hoặc rõ ràng của các đặc điểm bị ảnh hưởng bởi dữ liệu sẵn có và lợi ích của điều tra viên. Phân loại số đã được áp dụng thành công trong các nghiên cứu về sự tương đồng và khác biệt ở vi khuẩn và một số nhóm động vật, phân định một số chi như Oryza, Sarcostemma Solarium. Phân loại học PhyloCode PhyloCode hay còn gọi là Bộ luật danh pháp phát sinh quốc tế (International Code of Phylogenetic Nomenclature) là một dự thảo phát triển một bộ chính thức của quy tắc chi phối danh pháp phát sinh loài [85]. Khác với phân loại học truyền thống, PhyloCode không chia thành nhiều thứ hạng phân loại (như bộ, họ, chi, loài,…) mà chỉ gồm các bậc tiến hóa được xác định bởi các đặc điểm tổ tiên và các đặc điểm phân ly từ tổ tiên ban đầu từ đó tạo thành các nhánh tiến hóa đơn dòng [9]. Tất cả các bậc tiến hóa hình thành trong một nhánh đều được xác định như các loài, không có thứ hạng trên loài như trong phân loại học truyền thống. Ưu điểm của phương pháp này là cho phép đặt tên các cấp bậc trung gian; Cải thiện sự ổn định danh pháp; Tạo điều kiện cho việc đặt tên của các nhánh mới khi chúng được phát hiện; Cho phép loại bỏ các cấp bậc phân loại, loại bỏ khía cạnh chủ quan nhất của phân loại truyền thống và được áp dụng ở tất cả các cấp độ của phân loại. Tuy nhiên, PhyloCode còn gây nhiều tranh cãi và chưa được sử dụng rộng rãi [73]. Cận phân loại học (Parataxonomy) Cận phân loại học là một hệ thống phân công lao động sử dụng trong nghiên cứu đa dạng sinh học. Trong đó các nhiệm vụ sắp xếp sơ bộ của việc thu thập mẫu, nhận dạng và bảo quản được thực hiện bởi người ít chuyên môn hơn do đó giảm bớt khối lượng công việc cho các chuyên gia phân loại học. Phương pháp này được sử dụng để cải thiện hiệu quả và đẩy nhanh tốc độ phân loại [19]. Xu hướng của cận phân loại học không phân loại sinh vật thành các loài theo những nguyên tắc chung mà phân thành các đơn vị phân loại có thể thừa nhận dựa trên những đặc điểm dễ nhận biết bằng mắt thường [9]. Tuy nhiên, không thể sử dụng Parataxonomy vào việc thống kê sinh vật như trong phân loại học mà chỉ nên coi là một biện pháp kỹ thuật hỗ trợ phân loại học chứ không thể thay thế phân loại hoc truyền thống. 7
  16. 1.2. Công cụ phân tích đa dạng di truyền và tiến hóa 1.2.1. Tổng quan về mã vạch DNA Để định danh loài cũng như phân tích mối quan hệ di truyền và tiến hóa, các nhà khoa học thường sử dụng chỉ thị phân tử như dấu vân tay DNA (DNA fingerprinting), PCR RFLP (sử dụng enzyme giới hạn kết hợp với lai DNA) và đặc biệt là mã vạch DNA (DNA barcode). Nguyên lý chung của các phương pháp này đều dựa trên sự khác biệt của trình tự nucleotide (base nitơ) trong cấu trúc hóa học của DNA để xác định loài. Mã vạch DNA được ứng dụng và có tiềm năng trong nhiều ngành khoa học như phân loại học, công nghệ sinh học, công nghệ thực phẩm, pháp ý,...giúp nhận diện và định danh nhiều mẫu vật [42]. DNA Barcode hay mã vạch DNA lần đầu tiên được đề xuất là phương pháp định danh loài bởi Paul Hebert (Đại học Guelph – Cananda) vào năm 2003 [42]. Mã vạch DNA có thể là vùng gen trong nhân hay ngoài nhân mã hóa hoặc không mã hóa protein. Mã vạch này tương tự như mã vạch sọc đen dán vào các sản phẩm trong siêu thị. Tuy nhìn hai sản phẩm bên ngoài giống nhau và không thể phân biệt được bằng mắt thường nhưng khi quét mã vạch lại có thể xác định được chúng [88]. Để trở thành một mã vạch DNA, cần đáp ứng những yêu cầu sau: (i) Tồn tại phổ biến (có mặt trong nhiều loài sinh vật); (ii) Trình tự có hiệu suất nhân dòng cao và đặc hiệu; (iii) Khả năng phân biệt được nhiều loài [50]. Hiện nay thì nhiều mã vạch DNA ngày càng được sử dụng phổ biến, có thể kể đến chỉ thị nằm trong hệ gen nhân (ITS,...) [18, 27, 28], hệ gen ty thể (Cytb, COI...) [18, 25, 43] hay hệ gen lục lạp (matK, trnK, rbcL,...) [48, 49, 71]. Đặc điểm chung của những chỉ thị này là đều có tính đặc hiệu cao và dễ sử dụng. Chúng có những đặc tính lý tưởng bao gồm: đủ độ bảo thủ để xác định những sinh vật cùng loài nhưng cũng đủ đột biến để phân biệt các loài [65]; có độ dài thích hợp (không quá ngắn để xuất hiện vị trí đa hình giữa các taxon, không quá dài để thuận lợi trong quá trình giải trình tự); vị trí mồi bảo tồn cao, DNA được khuếch đại và giải trình tự có độ tin cậy cao. Trong đó, ở động vật, vùng gen ty thể có ưu thế hơn vùng gen nhân do có tốc độ tiến hóa nhanh [26, 81]. Còn ở thực vật, vùng gen ty thể không được lựa chọn làm mã vạch DNA do hệ gen này tiến hóa chậm [38, 48]. Thay vào đó, hệ gen lục lạp được cho thấy khả năng phân biệt tốt các loài [23, 48, 74]. Ngoài ra, để tăng độ chính xác khả năng phân loại, các nghiên cứu thường kết hợp nhiều 8
  17. hơn một chỉ thị phân tử. Thông tin về một số cặp mồi trong nghiên cứu phân loại được trình bày chi tiết trong Bảng 1.1. Bảng 1.1: Một số cặp mồi được sử trong nghiên cứu phân loại Barcode Mồi Trình tự TLTK ITS P1 F ATT GAA TGG TCC GGT GAA GTG TTC G [77] P2 R AAT TCC CCG GTT CGC TCG CCG TTAC [77] Is2P1 F ATG CGA TAC TTG GTG TGA AT [27] Is2P1 R TCC TCC GCT TAT TGA TAT GC [27] rbcL rP1 F ATG TCA CCA CAA ACA GAG ACT AAA GC [63] rP1 R GTA AAA TCA AGT CCA CCT CG [63] matK KIM 3F CGT ACA GTA CTT TTG TGT TTA CGA G [38, 58] KIM 1R ACC CAG TCC ATC TGG AAA TCT TGG TTC [38, 58] 390F CGA TCT ATT CAT TCA ATA TTT C [29] 1326R TCT AGC ACA CGA AAG TCG AAG T [29] 1F ACC GTA TCG CAC TAT GTA TC [93] 1R GAA CTA GTC GGA TGG AGT AG [93] 1.2.2. Ứng dụng của mã vạch DNA ở thực vật 1.2.2.1. Ứng dụng ở thực vật nói chung Ở thực vật, nghiên cứu mã vạch DNA không chỉ dùng để đánh giá sự khác nhau giữa các vùng DNA mà còn tiến tới những ứng dụng thực tế hơn. Các ứng dụng này bao gồm: (i) Cung cấp thông tin sâu hơn về phân loại học ở cấp độ loài đồng thời tham gia vào quá trình phân loại học: Nhận diện và phân biệt các loài. (ii) Hỗ trợ nhận diện các mẫu vật chưa được nhận biết thuộc loài nào hoặc xác định loài mới (Đây là ứng dụng chính). Với những loài có hình thái đơn giản, phân bố rộng, kích thước nhỏ hay hệ thống phân loại chưa đầy đủ và chưa được phân loại một cách triệt để thì mã vạch DNA giúp hoàn thiện hệ thống phân loại. Ngoài ra, nó còn cung cấp thêm thông tin 9
  18. hữu ích về đa dạng loài có thể kể đến như nghiên cứu về nhóm thực vật bryphytes (rêu) [71] hay nhận diện những loài lan ẩn danh [66]. Ngày nay, mã vạch DNA được ứng dụng nhiều trong các nghiên cứu bao gồm: (i) Nghiên cứu đánh giá đa dạng di truyền của một vùng địa lý (các mẫu nghiên cứu thuộc nhiều bộ, họ, chi, loài); (ii) Phân biệt tập hợp mục tiêu các loài họ hàng có khả năng thay thế loài có giá trị thương mại; (iii) Nhận diện mẫu vật mà người sử dụng không có khái niệm quen thuộc. 1.2.2.2. Ứng dụng trong nhận biết dược liệu Ngày nay, thuốc được phát triển từ dược liệu ngày càng trở nên phổ biến và nhu cầu sử dụng các sản phẩm chăm sóc sức khỏe có nguồn gốc thiên nhiên ngày càng tăng. Tổ chức Y tế Thế giới (WHO) ước tính khoảng 80% dân số thế giới sử dụng cây thuốc để chăm sóc sức khỏe ban đầu [17]. Ở nước phương Tây, cây thuốc là nguồn gốc của nhiều loại thuốc thảo dược hỗ trợ chăm sóc sức khỏe. Còn ở các nước phương Đông, đặc biệt là Trung Quốc, việc sử dụng nguyên liệu thảo dược đã có lịch sử lâu đời, thống kê cho thấy có đến hơn 10000 loài, hơn 2000 chi và 400 họ được sử dụng để làm thuốc [27]. Thị trường toàn cầu cho dược liệu và cây cho tinh dầu thơm là 62 tỷ đô la vào năm 2002 và có thể đạt 5 nghìn tỷ đô la vào năm 2050 [85]. Nhu cầu sử dụng dược liệu thúc đẩy sự mở rộng và phát triển của thị trường xuyên quốc gia về nguồn nguyên liệu thảo dược. Tuy nhiên, nó cũng làm xuất hiện tình trạng giả mạo dược liệu. Các loài thảo dược này có thể bị thay thế bởi các loài có quan hệ gần gũi, thậm chí là bị giả mạo hoàn toàn. Tồn tại tình trạng này là do: (i) Nguyên liệu không phân biệt được bằng đặc điểm hình thái. (ii) Nguyên liệu có đặc điểm tương tự nhau. (iii) Thay thế các nguyên liệu có giá trị kinh tế bằng các nguyên liệu dễ kiếm và rẻ tiền hơn. Ngoài ra, việc định danh và xác định nguyên liệu thảo dược theo phương pháp truyền thống như đặc điểm cảm quan và phân tích hóa học đôi khi gặp khó khăn nhất là khi nguyên liệu được chế biến thành các dạng bào chế như bột hay bị phân cắt thành các đoạn nhỏ. Chính vì vậy, mã vạch phân tử có lợi thế ưu việt trong việc nhận biết nguồn gốc dược liệu từ các mẫu mô nhỏ. Không chỉ vậy, mã vạch phân tử còn được sử dụng phổ biến trong những năm gần đây để đánh giá đa dạng 10
  19. sinh học phục vụ công tác bảo tồn và kiểm soát chất lượng sản phẩm. Việc định danh các nguyên liệu thảo dược bằng cách sử dụng mã vạch DNA giúp bảo vệ người dùng khỏi nguy cơ bị tổn hại sức khỏe bởi các thuốc giả mạo. 1.2.3. Vùng gen lục lạp matK (maturase K) Gen matK (maturase K), trước đây được gọi là orfK, là chỉ thị quan trọng được biểu hiện từ bộ gen lục lạp [47]. Gen này có tỷ lệ thay thế cao trong loài và nổi lên như một ứng cử viên tiềm năng để nghiên cứu hệ thống tiến hóa thực vật [75]. matK là một trong hai gen plastid (rbcL và matK) được Nhóm công tác thực vật (PWG) của Hiệp hội mã vạch sự sống (CBOL) khuyến nghị sử dụng làm mã vạch DNA thực vật tiêu chuẩn [38, 50]. matK là gen mã hoá một protein có liên quan đến quá trình cắt nối intron - exon nhóm II, dài khoảng 1500 bp, nằm trong intron của gen lục lạp trnK [20, 47] (Hình 1.1). Trong số các maturase, protein này chỉ giữ lại một miền X được bảo tồn tốt và tàn dư của một miền phiên mã ngược [72]. Các phức hợp gen matK-trnK thường được sử dụng cho các nghiên cứu tiến hóa thực vật và giải quyết quan hệ di truyền ở các mức phân loại khác nhau [54]. Hình 1.1:Vị trí của gen matK [47] Gen matK có tính đa dạng hơn những gen khác trong lục lạp, do vậy nó trở thành chỉ thị quan trọng giúp phân loại thực vật. Những đặc điểm của gen được khai thác bao gồm: có kích thước lý tưởng, tỷ lệ chuyển đổi cao và có trình tự bảo thủ. Tỷ lệ thay thế trong matK cao hơn gấp ba lần ở mức nucleotide và cao gấp sáu lần ở mức axit amin so với rbcL. Mặt khác sự hiện diện của vùng 3' tương đối được bảo tồn và vùng 5' ít được bảo tồn có thể được sử dụng để giải quyết các mối quan hệ phát sinh loài từ các mức độ phân loại nông đến sâu [31, 47]. Việc khuếch đại và giải trình tự vùng mã vạch matK rất khó khăn do tính biến thiên trình tự cao trong các vị trí liên kết mồi, đặc biệt khi đối tượng nghiên cứu không phải là thực vật hạt kín [38, 48, 50]. Hiện tại, có ba cặp mồi matK được sử dụng phổ biến để khuếch đại là: 390F/1326R [29, 90], KIM 3F /KIM 1R [38, 58] và XF/5R [33]. Kress và cộng sự (2009) đã sử dụng ba cặp mồi này để khuếch đại 11
  20. mã vạch DNA từ 296 loài thực vật [64]. Sự kết hợp mồi này đã thành công khuếch đại trong 85% và thành công tuần tự ở 69% các loài, chứng minh rằng khuếch đại là đáng tin cậy. Tuy nhiên, việc sử dụng nhiều hơn một cặp mồi có thể tốn thời gian cũng như kinh phí và thường phức tạp đối với các dự án quy mô lớn [44]. Gen matK cho thấy khả năng phân biệt cao các loài thực vật hạt kín và hỗ trợ định danh cho nhiều loài thực vật [80]. Chỉ thị này đã được ứng dụng thành công để xây dựng cây phát sinh loài cho họ Valerianaceae [46], Saxifragaceae, Polemoniaceae, Poaceae [47],… và giải quyết mối quan hệ di truyền của họ Aurantioideae đặc biệt là chi Citrus [76],… Mã vạch này được sử dụng thành công để phân biệt Panax notoginseng (Araliaceae) giữa các vùng địa lý khác nhau [95] và xây dựng cây phân loài của Panax vietnamensis và 5 trình tự liên quan [62]. 1.3. Phân tích phát sinh gen (Phylogenetic Analysis) Việc xác định mối quan hệ phân cấp giữa các loài và ước lượng thời gian phân kỳ giữa chúng dựa trên các trình tự sinh học như protein hoặc DNA được thực hiện bởi các nghiên cứu phát sinh gen. Các nghiên cứu phát sinh gen thường được chia làm 5 giai đoạn: Giai đoạn 1: Lựa chọn trình tự sinh học cần phân tích. Giai đoạn 2: Xây dựng sự liên kết (sắp xếp đa chuỗi) giữa các trình tự sinh học được chọn. Giai đoạn 3: Lựa chọn các mô hình thay thế, các mô hình thống kê về tiến hóa phân tử cho các trình tự. Giai đoạn 4: Xây dựng các cây phát sinh loài Giai đoạn 5: Đánh giá thống kê các cây phát sinh loài 1.3.1. Lựa chọn trình tự sinh học Các nghiên cứu phát sinh gen dựa trên việc so sánh các trình tự sinh học tương đồng. Nghiên cứu về sự khác biệt giữa các trình tự cho phép ước tính mối quan hệ tiến hóa giữa các loài tương ứng và thời gian phân kỳ của chúng. Để có được các chuỗi tương đồng, các cơ sở dữ liệu như RefSeq, Uniprot hoặc HomoloGene có thể rất hữu ích. Một cách khác để có được các chuỗi tương đồng là sử dụng các trình tự từ các kết quả BLAST. Hai trình tự DNA ở hai sinh vật khác nhau tiến hóa từ một trình tự DNA tổ tiên thì được gọi hai trình tự DNA tương đồng. Tuy nhiên, vẫn có những khác biệt 12
nguon tai.lieu . vn