- Trang Chủ
- Y khoa - Dược
- Khóa luận tốt nghiệp đại học ngành Dược học: Nghiên cứu đa dạng di truyền nguồn gen Dây thường xuân (Hedera nepalensis K.Koch) ở miền Bắc Việt Nam dựa trên chỉ thị matK
Xem mẫu
- ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC
--------
ĐỖ HẠNH NGUYÊN
NGHIÊN CỨU ĐA DẠNG DI TRUYỀN NGUỒN GEN
DÂY THƯỜNG XUÂN (Hedera nepalensis K. Koch)
Ở MIỀN BẮC VIỆT NAM DỰA TRÊN CHỈ THỊ matK
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC
Hà Nội - 2020
- ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC
--------
Người thực hiện: ĐỖ HẠNH NGUYÊN
NGHIÊN CỨU ĐA DẠNG DI TRUYỀN NGUỒN GEN
DÂY THƯỜNG XUÂN (Hedera nepalensis K. Koch)
Ở MIỀN BẮC VIỆT NAM DỰA TRÊN CHỈ THỊ matK
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
(NGÀNH DƯỢC HỌC)
Khóa : QH2015.Y
Người hướng dẫn : ThS. Phạm Thị Hồng Nhung
Lời cảm ơn
Để hoàn thành khóa luận, tôi đã nhận được rất nhiều sự giúp đỡ quý
bạn
Hà Nội - 2020
- LỜI CẢM ƠN
Để hoàn thành khóa luận, tôi đã nhận được rất nhiều sự giúp đỡ quý báu cả
về vật chất lẫn tinh thần, về những kinh nghiệm và kiến thức chuyên môn của các
thầy cô, bạn bè và gia đình. Lời đầu tiên, tôi xin bày tỏ sự kính trọng và lòng biết ơn
sâu sắc tới ThS. Phạm Thị Hồng Nhung – Giảng viên Khoa Y Dược – Đại học
Quốc gia Hà Nội, người tận tình chỉ bảo và hướng dẫn tôi trong suốt quá trình
nghiên cứu đề tài và hoàn thành khóa luận này. Tôi xin cảm ơn ThS. Đỗ Thị Lệ
Hằng và bạn Bùi Thị Yến đã hỗ trợ và giúp đỡ tôi trong quá trình thực nghiệm. Các
cô, các bạn không chỉ trang bị cho tôi kiến thức, mà còn truyền cho tôi niềm đam
mê, lòng nhiệt huyết, sự kiên trì và luôn sẵn sàng giúp đỡ mỗi khi tôi gặp khó khăn.
Tôi xin chân thành cảm ơn các thầy cô giáo Bộ môn Y Dược học cơ sở đã
hết lòng quan tâm, giúp đỡ và tạo điều kiện tốt nhất cho tôi thực hiện nghiên cứu và
hoàn thành khóa luận tốt nghiệp này.
Tôi cũng xin cảm ơn những cán bộ tại Viện Dược liệu - Bộ Y tế đã không
quản ngại khó khăn thu thập và cung cấp mẫu vật giúp đỡ tôi thực hiện đề tài một
cách thuận lợi nhất.
Tôi xin gửi lời cảm ơn tới Ban chủ nhiệm khoa, cùng toàn thể các thầy cô
giáo Khoa Y Dược - Đại học Quốc gia Hà Nội đã cho tôi những kiến thức quý báu
trong quá trình học tập tại nhà trường.
Chúng tôi trân trọng cảm ơn sự tài trợ kinh phí của Bộ Khoa học và Công
nghệ Việt Nam cho đề tài mã số NVQG-2018/02 do PGS.TS Đinh Đoàn Long chủ
trì để thực hiện nghiên cứu này.
Cuối cùng, tôi xin được bày tỏ lòng biết ơn và sự yêu thương đến gia đình và
bạn bè đã luôn ở bên cổ vũ, động viên và tạo mọi điều kiện giúp đỡ tôi trong thời
gian học tập và thực hiện đề tài khóa luận này.
Xin chân thành cảm ơn!
Hà Nội, ngày 09 tháng 06 năm 2020
Tác giả
Đỗ Hạnh Nguyên
- DANH MỤC TỪ VIẾT TẮT
bp Cặp bazơ (base pair)
DNA Axit deoxyribonucleic (Deoxyribonucleic acid)
dNTP Deoxyribonucleotide 5’ triphosphate
GBSSI Gen mã hóa enzyme tạo liên kết hạt (Granule-Bound Starch
Synthase)
Genbank Ngân hàng dữ liệu gen quốc tế
H.helix Thường xuân (Hedera helix L.)
H.nepalensis Dây thường xuân (Hedera nepalensis K.Koch)
ITS Vùng sao chép nội bộ (Internal transcribed spacer)
Kit Thermo GeneJET Plant Genomic DNA Purification Mini Kit (Thermo
Scientific, Mỹ)
matK Maturase K
ML Maximum Likelihood
NCBI Trung tâm Thông tin Công nghệ sinh học Quốc gia (National
Center for Biotechnology Information)
OD Mật độ quang học (Optical Density)
PCR Phản ứng chuỗi trùng hợp (Polymerase Chain Reaction)
RNA Axit ribonucleic (Ribonucleic acid)
TrnK Translocated tRNA-Lys gene
UPGMA Unweighted PairGroup with Method using arthmetic Averages
- DANH MỤC CÁC BẢNG
Trang
Bảng 1.1. Một số cặp mồi được sử trong nghiên cứu phân loại... ..............................9
Bảng 1.2. Các tác dụng dược lý của H. nepalensis ................................................. 20
Bảng 2.1. Thông tin mẫu thực vật dùng trong nghiên cứu ...................................... 21
Bảng 3.1. Nồng độ DNA tổng số của các mẫu nghiên cứu ..................................... 26
Bảng 3.2. Các thành phần và chu trình nhiệt của phản ứng PCR nhân dòng đoạn
gen matK .................................................................................................................. 30
Bảng 3.3. Các trình tự tham chiếu lấy từ Genbank sử dụng trong nghiên cứu........ 31
Bảng 3.4. Phân nhóm các mẫu trong nghiên cứu .................................................... 32
Bảng 3.5. Khoảng cách di truyền (phía dưới bên trái) và số lượng nucleotide sai
khác (phía tên bên phải) giữa 03 haplotype với 03 trình tự tham chiếu .................. 32
Bảng 4.1. Trình tự các mồi của gen matK được sử dụng trong các nghiên cứu về chi
Hedera trên thế giới ................................................................................................. 43
- DANH MỤC CÁC HÌNH
Trang
Hình 1.1. Vị trí của gen matK .................................................................................... 11
Hình 1.2. Đặc điểm hình thái Dây thường xuân......................................................... 17
Hình 1.3. Phân bố địa lý của Dây thường xuân ở miền Bắc Việt Nam. .................... 18
Hình 2.1. Sơ đồ thiết kế nghiên cứu ........................................................................... 23
Hình 3.1. Ảnh điện di DNA tổng số trên gel agarose 1,2% ....................................... 26
Hình 3.2. Tối ưu nhiệt độ gắn mồi phản ứng nhân dòng gen matK .......................... 28
Hình 3.3. Tối ưu nồng độ DNA phản ứng nhân dòng gen matK ............................... 29
Hình 3.4. Tối ưu nồng độ mồi phản ứng nhân dòng gen matK .................................. 29
Hình 3.5. Kết quả PCR nhân dòng đoạn gen matK .................................................... 30
Hình 3.6. Kết quả hiển thị giải trình tự của mẫu đại diện H4 của gen matK qua phần
mềm BioEdit ............................................................................................................... 31
Hình 3.7. So sánh trình tự đoạn gen matK của các haplotype nghiên cứu với các
trình tự tham chiếu ...................................................................................................... 33
Hình 3.8. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03
haplotype nghiên cứu với 03 trình tự tham chiếu dựa trên chỉ thị matK .................... 34
Hình 3.9. Cây phát sinh chủng loại xây dựng bằng phương pháp Maximum
Likelihood của 03 haplotype nghiên cứu với 03 trình tự tham chiếu dựa trên chỉ thị
matK ............................................................................................................................ 35
Hình 3.10. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03
haplotype nghiên cứu với trình tự các loài Hedera dựa trên chỉ thị matK.................. 36
- MỤC LỤC
Trang
ĐẶT VẤN ĐỀ ............................................................................................................ 1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 3
1.1. Đa dạng và phân loại sinh học .......................................................................... 3
1.1.1. Khái niệm đa dạng sinh học ....................................................................... 3
1.1.2. Đa dạng di truyền ....................................................................................... 3
1.1.3. Thực trạng đa dạng sinh học tại Việt Nam................................................. 4
1.1.4. Các phương pháp phân loại học ................................................................. 5
1.2. Công cụ phân tích đa dạng di truyền và tiến hóa.............................................. 8
1.2.1. Tổng quan về mã vạch DNA ...................................................................... 8
1.2.2. Ứng dụng của mã vạch DNA ở thực vật .................................................... 9
1.2.3. Vùng gen lục lạp matK (maturase K)....................................................... 11
1.3. Phân tích phát sinh gen (Phylogenetic Analysis) ........................................... 12
1.3.1. Lựa chọn trình tự sinh học........................................................................ 12
1.3.2. Sắp xếp đa chuỗi....................................................................................... 13
1.3.3. Lựa chọn mô hình tiến hóa ....................................................................... 13
1.3.4. Xây dựng cây phát sinh loài ..................................................................... 14
1.3.5. Đánh giá cây phát sinh loài ...................................................................... 15
1.4. Tổng quan về loài Dây thường xuân (Hedera nepalensis K.Koch) ............... 15
1.4.1. Đặc điểm hình thái chung của loài Dây thường xuân .............................. 15
1.4.2. Đặc điểm phân bố, sinh thái ..................................................................... 18
1.4.3. Thành phần hóa học ................................................................................. 19
1.4.4. Tác dụng dược lý ...................................................................................... 19
CHƯƠNG 2. ĐỐI TƯỢNG & PHƯƠNG PHÁP NGHIÊN CỨU ..................... 21
2.1. Đối tượng nghiên cứu ..................................................................................... 21
2.1.1. Đối tượng .................................................................................................. 21
2.1.2. Tiêu chuẩn lựa chọn mẫu ......................................................................... 21
2.2. Thời gian, địa điểm nghiên cứu ...................................................................... 22
2.3. Dụng cụ, trang thiết bị và hóa chất nghiên cứu .............................................. 22
2.3.1. Hóa chất .................................................................................................... 22
- 2.3.2. Trang thiết bị ............................................................................................ 23
2.4. Phương pháp nghiên cứu ................................................................................ 23
2.4.1. Tách chiết DNA tổng số ........................................................................... 24
2.4.2. Khuếch đại đoạn gen đích bằng kỹ thuật PCR ......................................... 24
2.4.3. Tinh sạch và giải trình tự .......................................................................... 25
2.4.4. Xử lý số liệu và phân tích kết quả ............................................................ 25
CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU .............................................................. 26
3.1. Tách chiết DNA tổng số ................................................................................. 26
3.2. Kết quả tối ưu hóa quy trình nhân dòng đoạn gen matK bằng kỹ thuật PCR 27
3.2.1. Tối ưu quy trình PCR ............................................................................... 27
3.2.2. Kết quả nhân dòng gen matK từ các mẫu thực vật ................................... 29
3.3. Giải trình tự ..................................................................................................... 31
3.4. Độ tương đồng của trình tự gen matK được khuếch đại................................. 31
3.5. Cây phát sinh chủng loại dựa trên vùng gen matK ......................................... 34
CHƯƠNG 4. BÀN LUẬN ....................................................................................... 38
4.1. Kết quả xây dựng quy trình phân tích đoạn gen matK ................................... 38
4.1.1. Tách chiết DNA tổng số ........................................................................... 38
4.1.2. Khuếch đại đoạn gen matK ...................................................................... 39
4.1.3. Giải trình tự và so sánh độ tương đồng .................................................... 40
4.2. Nghiên cứu đa dạng di truyền nguồn gen Dây thường xuân sử dụng mã vạch
matK.......................................................................................................................40
4.2.1. Khoảng cách di truyền .............................................................................. 40
4.2.2. Phân tích đa dạng di truyền nguồn gen Dây thường xuân ở miền Bắc
Việt Nam ............................................................................................................ 41
KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................ 47
TÀI LIỆU THAM KHẢO ..........................................................................................
- ĐẶT VẤN ĐỀ
Việt Nam nằm trong vùng khí hậu nhiệt đới ẩm gió mùa nên có hệ thực vật
phong phú và đa dạng, trong đó đặc biệt phải kể đến nhóm tài nguyên cây thuốc.
Theo kết quả điều tra của Viện Dược liệu, Việt Nam có 3948 loài thực vật bậc cao,
bậc thấp và nấm lớn được dùng làm thuốc [2]. Tuy nhiên, phần lớn các cây thuốc
được sử dụng theo kinh nghiệm dân gian hoặc theo Y học cổ truyền mà chưa được
nghiên cứu một cách chuyên sâu và đầy đủ. Vì vậy, cần có thêm nhiều nghiên cứu
đánh giá chính xác mức độ đa dạng di truyền của các loài cây thuốc nhằm định
hướng bảo tồn, chọn, tạo và nhân giống để đáp ứng yêu cầu phát triển của nền công
nghiệp chế biến dược liệu bền vững.
Trong hệ thực vật đó, Hedera (L.) là một chi thuộc họ Nhân sâm
(Araliaceae) trên thế giới đã ghi nhận 16 loài, một số loài được biết có giá trị làm
thuốc [15]. Trong số đó, 2 loài đến nay được sử dụng rộng rãi và nghiên cứu nhiều
hơn cả về dược học là Thường xuân - H. helix và Dây thường xuân - H. nepalensis
đều có phạm vi phân bố tương đối hẹp trên thế giới. Theo đó H. helix được tìm thấy
chủ yếu ở Châu Âu và một phần Nam Á, còn H. nepalensis được phát hiện phân bố
ở các nước châu Á như: Trung Quốc, Ấn Độ, Pakistan, Nepal, Thái Lan,… Ở Việt
Nam, loài này được báo cáo xuất hiện tại một số tỉnh vùng núi phía Bắc như Lào
Cai, Hà Giang,... H. helix đã được các nhà khoa học trên thế giới chứng minh có
nhiều tác dụng dược lý trong điều trị các bệnh về hô hấp, nhiễm khuẩn, bảo vệ gan
và đã được phát triển thành thuốc điều trị viêm đường hô hấp cấp và mạn tính
(Prospan). Trong khi đó ở Việt Nam, Dây thường xuân (H. nepalensis) chủ yếu
được dùng làm cây cảnh và chưa có một nghiên cứu nào về thành phần hoá học và
tác dụng dược lý.
Trong Dây thường xuân có chứa các hợp chất n-hexan và ethyl acetate có tác
dụng chống ung thư [55], ngoài ra còn chứa lupeol, một triterpenoid có hoạt tính ức
chế dipeptidyl peptidase-4 với tiềm năng chữa bệnh tiểu đường [40, 83]. Không chỉ
vậy, nhiều nghiên cứu đã chứng minh rằng H. nepalensis có tác dụng bảo vệ thần
kinh [40], chống viêm, giảm đau, chống đông máu và chống trầm cảm [52]. Với
những tiềm năng dược lý như vậy, song hiện nay chưa có nhiều nghiên cứu về H.
nepalensis, đặc biệt là các nghiên cứu đánh giá tiềm năng đa dạng sinh học phục vụ
công tác bảo tồn, khai thác và phát triển nguồn gen. Chúng tôi cho rằng việc phân
tích đa dạng di truyền nguồn gen Dây thường xuân là thực sự cần thiết nhất là khi
phạm vi phân bố tự nhiên của loài này trên thế giới tương đối hạn chế. Ngoài yêu
1
- cầu đánh giá đa dạng di truyền nguồn gen Dây thường xuân ở Việt Nam, định loại
chính xác loài để từ đó có chiến lược bảo tồn, khai thác và phát triển cũng là vấn đề
nghiên cứu cấp thiết hiện nay. Trên thế giới, việc sử dụng các chỉ thị DNA ngày
càng được dùng rộng rãi trong các nghiên cứu phân loại, phân tích đa dạng sinh
học, xác định khoảng cách di truyền và đặc trưng cá thể và quần thể thực vật nhằm
mục đích bảo tồn và chọn giống. So với các chỉ thị truyền thống (chỉ thị hình thái và
chỉ thị hóa học), thì chỉ thị DNA mang những ưu điểm nổi bật: dễ thực hiện trong
điều kiện phòng thí nghiệm, không phụ thuộc vào các yếu tố môi trường và hiện
tượng tương tác gen, có thể xác định được các biến dị DNA trong các giai đoạn
khác nhau và ở các cơ quan khác nhau của thực vật. Để phục vụ cho nghiên cứu
này, chúng tôi sử dụng chỉ thị phân tử là matK (maturase K) trong vùng gen lục lạp
làm công cụ giúp xây dựng cây phát sinh loài. Mã vạch này là chỉ thị phân tử nổi
bật được ứng dụng thành công trong nhiều nghiên cứu giúp phân tích đa dạng di
truyền và định danh nhiều loài thực vật, có thể kể đến như chi Panax, chi
Alium[14], họ Valerianaceae [46] hay chi Dalbergia [22],… Nhưng câu hỏi được
đặt ra là liệu matK có phải là chỉ thị DNA thích hợp để phân tích đa dạng di truyền
loài Dây thường xuân hay không?
Chính vì vậy, chúng tôi thực hiện đề tài “Nghiên cứu đa dạng di truyền
nguồn gen Dây thường xuân (Hedera nepalensis K.Koch) ở miền Bắc Việt Nam
dựa trên chỉ thị matK”. Nghiên cứu này hướng đến hai mục tiêu:
1. Xây dựng được quy trình nhân dòng đoạn gen matK của Dây thường xuân.
2. Xây dựng cây phát sinh chủng loại dựa vào chỉ thị matK và dùng chỉ thị
này để đánh giá mức độ đa dạng di truyền nguồn gen Dây thường xuân thu
thập ở miền Bắc Việt Nam.
Để thực hiện được mục tiêu nghiên cứu này, chúng tôi tiến hành các nội
dung nghiên cứu sau:
1. Tách DNA tổng số thu từ mẫu lá khô Dây thường xuân
2. Tối ưu phản ứng PCR và tiến hành nhân dòng đoạn gen matK
3. Giải trình tự vùng gen matK được nhân dòng
4. Xây dựng cây phát sinh chủng loại dựa trên chỉ thị matK
2
- CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. Đa dạng và phân loại sinh học
1.1.1. Khái niệm đa dạng sinh học
Năm 1982, định nghĩa của Wilcox “Đa dạng sinh học là sự đa dạng của các
dạng sống ở tất cả các cấp độ của hệ thống sinh học” được đưa ra bởi Liên minh
quốc tế về bảo tồn tài nguyên và tự nhiên (IUCN). Đến năm 1984, Wilcox cho rằng
đa dạng sinh học có thể được định nghĩa về mặt di truyền là sự đa dạng của các
alen, gen của sinh vật. Cho đến năm 1992, một định nghĩa khác được quốc tế công
nhận và được sử dụng trong Công ước Liên hợp Quốc về đa dạng sinh học: Đa dạng
sinh học là sự biến đổi sinh vật sống từ tất cả các nguồn bao gồm các hệ sinh thái và
các phức hợp sinh thái mà chúng là một phần: bao gồm sự đa dạng trong loài (đa
dạng di truyền, đa dạng gen), giữa loài (đa dạng loài) và hệ sinh thái (đa dạng hệ
sinh thái) [41]. Ngoài ra, trong cuốn sách “Biodiversity: an introduction”, Gaston và
Spicer định nghĩa “Đa dạng sinh học là sự biến đổi của sự sống ở tất cả các cấp độ
tổ chức sinh học” [35].
Đa dạng sinh học thường được sử dụng để thay thế các thuật ngữ đa dạng
loài và sự phong phú của loài. Các nhà sinh học thường định nghĩa đa dạng sinh học
là “tổng số gen, loài và hệ sinh thái của một khu vực” [67]. Định nghĩa này có lợi
thế trong việc bao trùm tất cả các trường hợp và trình bày một quan điểm thống nhất
về các loại sinh học truyền thống bao gồm: đa dạng phân loại (cấp độ loài), đa dạng
sinh thái (dưới góc độ hệ sinh thái), đa dạng hình thái (bắt nguồn từ đa dạng di
truyền và đa dạng phân tử) và đa dạng chức năng (thước đo số lượng các loài khác
nhau về chức năng trong quần thể). Đa dạng sinh học có vai trò quan trọng trong
việc phát triển kinh tế, xã hội và môi trường, là cơ sở đảm bảo an ninh lương thực;
duy trì nguồn gen vật nuôi, cây trồng; cung cấp các vật liệu cho xây dựng và các
nguồn nguyên liệu và dược liệu.
1.1.2. Đa dạng di truyền
Đa dạng di truyền là sự đa dạng ở cấp độ phân tử về thành phần gen giữa các
cá thể trong cùng một loài và giữa các loài khác nhau; là sự đa dạng về gen có thể di
truyền được trong một quần thể hoặc giữa các quần thể, tồn tại trong một loài và
giữa các loài khác nhau. Đa dạng di truyền là cơ chế giúp sinh vật tồn tại trong
những điều kiện khác nhau nên cần thiết cho tất cả các sinh vật để duy trì nòi giống.
Thông qua đa dạng di truyền, sinh vật tạo nên những cơ chế mới, kháng lại các loại
dịch bệnh và thích nghi với biến đổi môi trường [34]. Mỗi loài có chứa những gen
3
- riêng biệt thể hiện đặc tính riêng của nó như một cách để các quần thể có thể thích
nghi được với môi trường sống thay đổi. Với các áp lực như: chọn lọc nhân tạo, môi
trường sống khắc nghiệt,… một số cá thể trong một quần thể sẽ có cơ hội cao hơn
trong việc sở hữu những biến dị alen phù hợp với môi trường giúp duy trì nòi giống
có alen đó. Quần thể đó sẽ tiếp tục có thêm nhiều thế hệ nhờ sự thành công của
những cá thể này.
Đa dạng di truyền là phân mức cơ bản nhất trong đa dạng sinh học, tạo nên
sự khác biệt của các cá thể trong quần thể. Đa dạng sinh học dù trong phạm vi một
loài hay giữa các loài và các hệ sinh thái với nhau thì cũng đều xuất phát từ đa dạng
di truyền. Nghiên cứu về đa dạng di truyền cũng là các nghiên cứu cơ bản và chính
xác nhất về sự khác biệt giữa các loài. Tuy nhiên, đa dạng di truyền vẫn chưa được
quan tâm đúng mức mặc dù loại đa dạng này chính là nền tảng cho sự đa dạng của
sinh giới [5]. Ứng dụng của nghiên cứu đa dạng di truyền bao gồm: Bảo tồn nguồn
gen; Lai tạo giống mới và Nghiên cứu tiến hóa.
1.1.3. Thực trạng đa dạng sinh học tại Việt Nam
Việt Nam đứng thứ 16 về mức độ đa dạng sinh học trên thế giới và được biết
đến như một trung tâm đa dạng sinh học với các hệ sinh thái tự nhiên phong phú và
sự giàu có về các loài và nguồn gen sinh vật. Trong đó, đã xác định được khoảng
49200 loài sinh vật bao gồm: khoảng 7500 chủng vi sinh vật; 20000 loài thực vật
trên cạn và dưới nước; 10500 loài động vật trên cạn; 2000 loài động vật không
xương sống và cá sống ở nước ngọt; khoảng trên 11000 loài sinh vật biển. Đặc biệt,
một bộ phận lớn của các giống thực vật, động vật này có các đặc tính quý chỉ có ở
nước ta, nên tiềm năng phát triển và đem lại giá trị kinh tế rất cao [6]. Việt Nam có
số lượng lớn nguồn gen dược liệu, sở hữu nhiều loài dược liệu quý hiếm và là nơi
có nguồn đa dạng sinh học phong phú. Tuy nhiên, những sản phẩm từ dược liệu quý
của nước ta chưa trở thành hàng hóa có giá trị cao và chưa được sử dụng rộng rãi
trong cộng đồng. Cũng như nhiều quốc gia khác trên thế giới, Việt Nam đang đối
diện với nguy cơ suy thoái đa dạng sinh học và sự mất cân bằng sinh thái diễn ra
mạnh mẽ. Tài nguyên đa dạng sinh học đang trên đà suy giảm một cách đáng báo
động, các hệ sinh thái bị thu hẹp, suy giảm và bị chia cắt, nguồn gen bị thất thoát,
mai một. Nguyên nhân là do áp lực của gia tăng dân số kéo theo tài nguyên sinh vật
bị khai thác quá mức và không được tái tạo. Ngoài ra, công tác bảo tồn còn nhiều
bất cập, hệ thống các quy định pháp luật về bảo tồn đa dạng sinh học chưa đồng bộ.
Vì vậy, vấn đề cấp thiết hiện nay là cần phải bảo tồn và phát triển nguồn gen.
4
- 1.1.4. Các phương pháp phân loại học
Phân loại học là lĩnh vực sinh học liên quan đến xác định, đặt tên và phân
loại các loài. Phân loại học là quá trình các nhà khoa học nhóm các sinh vật sống
dựa trên mức độ giống nhau của chúng nhằm phản ánh sự liên quan tiến hóa của các
sinh vật và các nhóm sinh vật. Trong lịch sử, sự giống nhau được xác định bằng
cách kiểm tra các đặc điểm vật lý, hóa học. Theo truyền thống những đặc điểm này
có thể quan sát bằng hình thái nhưng với sự ra đời và phát triển của giải trình tự
gen, trình tự DNA và các dấu hiệu phân tử cũng được sử dụng để phân loại, định
danh các loài.
1.1.4.1. Phương pháp phân loại học truyền thống
Phân loại học truyền thồng gồm 2 phân loại là phân loại dựa trên các chỉ thị
hình thái và dựa vào các chỉ thị hóa học (như sắc ký lớp mỏng - TLC hay sắc ký lớp
mỏng hiệu năng cao – HPLC,…). Trong đó, phân loại học hình thái được sử dụng
phổ biến hơn và đóng vai trò quan trọng trong lĩnh vực phân loại học.
Phân loại học hình thái dựa trên sự tương đồng rõ ràng nhất giữa các loài và
đã được đưa ra từ rất lâu trước khi ý tưởng về sự tiến hóa xuất hiện. Phân loại học
này chủ yếu dựa trên sự khác biệt đặc điểm hình thái các cơ quan của thực vật, đặc
biệt là hoa (cơ quan sinh sản). Phương pháp phân loại học hình thái có lịch sử lâu
đời và nhờ vào phương pháp này mà hệ thống phân loại thực vật được hoàn thiện
khá đầy đủ. Ưu điểm của nó là có thể phân biệt các loài dựa trên sự quan sát các đặc
điểm bên ngoài, dễ ứng dụng và thân thiện với nhiều đối tượng. Tuy nhiên, nhược
điểm của phương pháp này là sẽ gặp khó khăn khi phân loại các mẫu đang trong
giai đoạn phát triển (chưa ra hoa) hoặc có các đặc điểm hình thái giống nhau do
cùng sinh trưởng và phát triển trong cùng một điều kiện môi trường địa lý hay có
nhiều điểm tương đồng do ở mức độ phân loại thấp như loài và dưới loài [57].
Không chỉ vậy, phương pháp này thường được sử dụng bởi các chuyên gia hình thái
và cần một khoảng thời gian tương đối dài và tốn nhiều công sức [42]. Dù còn tồn
tại nhiều nhược điểm nhưng không thể phủ nhận tầm quan trọng của phân loại học
hình thái trong lĩnh vực phân loại học hiện nay.
1.4.1.2. Phương pháp phân loại học hiện đại
Để khắc phục những nhược điểm của phương pháp phân loại học truyền
thống, hiện nay các nhà khoa học đã xây dựng nhiều phương pháp phân loại học
mới, trong đó:
5
- Phân loại học phân tử
Với sự phát triển của sinh học phân tử vào những năm 1990 cùng với thành
công của việc giải trình tự gen, phân loại học phân tử được hình thành. Phương
pháp phân loại này dựa trên việc phân tích các dữ liệu về gen (DNA) trong hoặc
ngoài nhân hoặc cả hệ gen hay các sản phẩm của chúng như protein, enzyme. Từ đó
giúp định danh và xây dựng mối quan hệ tiến hóa và di truyền giữa các loài. Tùy
vào mục đích nghiên cứu, có thể lựa chọn một trong các công cụ DNA hay protein.
Các kỹ thuật sinh học phân tử được sử dụng gồm: giải trình tự DNA, đa hình các
đoạn DNA nhân bản ngẫu nhiên (Random Amplified Polymorphic DNA), đa hình
chiều dài các đoạn cắt giới hạn (Restriction Fragment Length Polymorphism) hay
kỹ thuật đồng enzyme (isozyme),…[10] Các kỹ thuật này đã được ứng dụng thành
công trong việc phân loại, định danh và xác định mối quan hệ tiến hóa của nhiều
loài sinh vật và ngày càng cho thấy những lợi ích thiết thực. So với phân loại học
truyền thống thì phương pháp này giúp quá trình xác định các loài trở nên nhanh,
chính xác và ít tốn kém hơn [9]. Mục tiêu chính của phân loại học phân tử là:
(i) Xác định mối quan hệ phân cấp giữa các loài hiện có theo mối quan hệ
tiến hóa của chúng. Vì vậy, các sinh vật có chung một tổ tiên chung được nhóm lại
sớm hơn so với những sinh vật có tổ tiên chung xa hơn.
(ii) Ước tính thời gian phân kỳ giữa các loài, tức là thời gian tồn tại của tổ
tiên chung gần nhất.
Phân loại học hiện trạng số (Numerical taxonomy)
Phân loại học hiện trạng số là một hệ thống phân loại cho phép so sánh số
lượng lớn các đặc điểm (từ 60 dấu hiệu trở lên) cho số lượng lớn các chủng bằng
cách phân tích bộ dữ liệu được tạo ra bằng máy tính. Phương pháp này áp dụng các
quy trình toán học khác nhau cho dữ liệu trạng thái ký tự được mã hóa số. Nó nhằm
mục đích tạo ra một phân loại sử dụng các thuật toán số như phân tích cụm thay vì
sử dụng đánh giá chủ quan các thuộc tính. Các bộ dữ liệu về ma trận cho thấy mức
độ tương đồng giữa từng cụm rồi từ đó tạo thành một bức tranh chung về đặc điểm
kiểu hình của một nhóm cụ thể. Khái niệm này được đưa ra lần đầu tiên bởi Robert
R. Sokal và Peter HA Sneath vào năm 1963 [87], sau đó được xây dựng và phát
triển bởi cùng nhóm tác giả [86]. Ưu điểm của phương pháp này là dữ liệu phân loại
được thu thập từ nhiều nguồn khác nhau, như hình thái, hóa học, sinh lý,… Sự trợ
giúp của hệ thống dữ liệu điện tử cho phép nhiều công việc phân loại được thực
6
- hiện. Tuy nhiên, vẫn tồn tại nhược điểm bao gồm: Đối xử với sinh vật như những
đối tượng phi sinh vật; Loại trừ yếu tố tiến hóa, không phân loại được phát sinh gen;
Sự lựa chọn trọng số ngầm định hoặc rõ ràng của các đặc điểm bị ảnh hưởng bởi dữ
liệu sẵn có và lợi ích của điều tra viên. Phân loại số đã được áp dụng thành công
trong các nghiên cứu về sự tương đồng và khác biệt ở vi khuẩn và một số nhóm
động vật, phân định một số chi như Oryza, Sarcostemma Solarium.
Phân loại học PhyloCode
PhyloCode hay còn gọi là Bộ luật danh pháp phát sinh quốc tế (International
Code of Phylogenetic Nomenclature) là một dự thảo phát triển một bộ chính thức
của quy tắc chi phối danh pháp phát sinh loài [85]. Khác với phân loại học truyền
thống, PhyloCode không chia thành nhiều thứ hạng phân loại (như bộ, họ, chi,
loài,…) mà chỉ gồm các bậc tiến hóa được xác định bởi các đặc điểm tổ tiên và các
đặc điểm phân ly từ tổ tiên ban đầu từ đó tạo thành các nhánh tiến hóa đơn dòng [9].
Tất cả các bậc tiến hóa hình thành trong một nhánh đều được xác định như các loài,
không có thứ hạng trên loài như trong phân loại học truyền thống. Ưu điểm của
phương pháp này là cho phép đặt tên các cấp bậc trung gian; Cải thiện sự ổn định
danh pháp; Tạo điều kiện cho việc đặt tên của các nhánh mới khi chúng được phát
hiện; Cho phép loại bỏ các cấp bậc phân loại, loại bỏ khía cạnh chủ quan nhất của
phân loại truyền thống và được áp dụng ở tất cả các cấp độ của phân loại. Tuy
nhiên, PhyloCode còn gây nhiều tranh cãi và chưa được sử dụng rộng rãi [73].
Cận phân loại học (Parataxonomy)
Cận phân loại học là một hệ thống phân công lao động sử dụng trong nghiên
cứu đa dạng sinh học. Trong đó các nhiệm vụ sắp xếp sơ bộ của việc thu thập mẫu,
nhận dạng và bảo quản được thực hiện bởi người ít chuyên môn hơn do đó giảm bớt
khối lượng công việc cho các chuyên gia phân loại học. Phương pháp này được sử
dụng để cải thiện hiệu quả và đẩy nhanh tốc độ phân loại [19]. Xu hướng của cận
phân loại học không phân loại sinh vật thành các loài theo những nguyên tắc chung
mà phân thành các đơn vị phân loại có thể thừa nhận dựa trên những đặc điểm dễ
nhận biết bằng mắt thường [9]. Tuy nhiên, không thể sử dụng Parataxonomy vào
việc thống kê sinh vật như trong phân loại học mà chỉ nên coi là một biện pháp kỹ
thuật hỗ trợ phân loại học chứ không thể thay thế phân loại hoc truyền thống.
7
- 1.2. Công cụ phân tích đa dạng di truyền và tiến hóa
1.2.1. Tổng quan về mã vạch DNA
Để định danh loài cũng như phân tích mối quan hệ di truyền và tiến hóa, các
nhà khoa học thường sử dụng chỉ thị phân tử như dấu vân tay DNA (DNA
fingerprinting), PCR RFLP (sử dụng enzyme giới hạn kết hợp với lai DNA) và đặc
biệt là mã vạch DNA (DNA barcode). Nguyên lý chung của các phương pháp này
đều dựa trên sự khác biệt của trình tự nucleotide (base nitơ) trong cấu trúc hóa học
của DNA để xác định loài. Mã vạch DNA được ứng dụng và có tiềm năng trong
nhiều ngành khoa học như phân loại học, công nghệ sinh học, công nghệ thực
phẩm, pháp ý,...giúp nhận diện và định danh nhiều mẫu vật [42].
DNA Barcode hay mã vạch DNA lần đầu tiên được đề xuất là phương pháp
định danh loài bởi Paul Hebert (Đại học Guelph – Cananda) vào năm 2003 [42]. Mã
vạch DNA có thể là vùng gen trong nhân hay ngoài nhân mã hóa hoặc không mã
hóa protein. Mã vạch này tương tự như mã vạch sọc đen dán vào các sản phẩm
trong siêu thị. Tuy nhìn hai sản phẩm bên ngoài giống nhau và không thể phân biệt
được bằng mắt thường nhưng khi quét mã vạch lại có thể xác định được chúng [88].
Để trở thành một mã vạch DNA, cần đáp ứng những yêu cầu sau:
(i) Tồn tại phổ biến (có mặt trong nhiều loài sinh vật);
(ii) Trình tự có hiệu suất nhân dòng cao và đặc hiệu;
(iii) Khả năng phân biệt được nhiều loài [50].
Hiện nay thì nhiều mã vạch DNA ngày càng được sử dụng phổ biến, có thể
kể đến chỉ thị nằm trong hệ gen nhân (ITS,...) [18, 27, 28], hệ gen ty thể (Cytb,
COI...) [18, 25, 43] hay hệ gen lục lạp (matK, trnK, rbcL,...) [48, 49, 71]. Đặc điểm
chung của những chỉ thị này là đều có tính đặc hiệu cao và dễ sử dụng. Chúng có
những đặc tính lý tưởng bao gồm: đủ độ bảo thủ để xác định những sinh vật cùng
loài nhưng cũng đủ đột biến để phân biệt các loài [65]; có độ dài thích hợp (không
quá ngắn để xuất hiện vị trí đa hình giữa các taxon, không quá dài để thuận lợi trong
quá trình giải trình tự); vị trí mồi bảo tồn cao, DNA được khuếch đại và giải trình tự
có độ tin cậy cao. Trong đó, ở động vật, vùng gen ty thể có ưu thế hơn vùng gen
nhân do có tốc độ tiến hóa nhanh [26, 81]. Còn ở thực vật, vùng gen ty thể không
được lựa chọn làm mã vạch DNA do hệ gen này tiến hóa chậm [38, 48]. Thay vào
đó, hệ gen lục lạp được cho thấy khả năng phân biệt tốt các loài [23, 48, 74]. Ngoài
ra, để tăng độ chính xác khả năng phân loại, các nghiên cứu thường kết hợp nhiều
8
- hơn một chỉ thị phân tử. Thông tin về một số cặp mồi trong nghiên cứu phân loại
được trình bày chi tiết trong Bảng 1.1.
Bảng 1.1: Một số cặp mồi được sử trong nghiên cứu phân loại
Barcode Mồi Trình tự TLTK
ITS P1 F ATT GAA TGG TCC GGT GAA GTG TTC G [77]
P2 R AAT TCC CCG GTT CGC TCG CCG TTAC [77]
Is2P1 F ATG CGA TAC TTG GTG TGA AT [27]
Is2P1 R TCC TCC GCT TAT TGA TAT GC [27]
rbcL rP1 F ATG TCA CCA CAA ACA GAG ACT AAA GC [63]
rP1 R GTA AAA TCA AGT CCA CCT CG [63]
matK KIM 3F CGT ACA GTA CTT TTG TGT TTA CGA G [38, 58]
KIM 1R ACC CAG TCC ATC TGG AAA TCT TGG TTC [38, 58]
390F CGA TCT ATT CAT TCA ATA TTT C [29]
1326R TCT AGC ACA CGA AAG TCG AAG T [29]
1F ACC GTA TCG CAC TAT GTA TC [93]
1R GAA CTA GTC GGA TGG AGT AG [93]
1.2.2. Ứng dụng của mã vạch DNA ở thực vật
1.2.2.1. Ứng dụng ở thực vật nói chung
Ở thực vật, nghiên cứu mã vạch DNA không chỉ dùng để đánh giá sự khác
nhau giữa các vùng DNA mà còn tiến tới những ứng dụng thực tế hơn. Các ứng
dụng này bao gồm:
(i) Cung cấp thông tin sâu hơn về phân loại học ở cấp độ loài đồng thời tham
gia vào quá trình phân loại học: Nhận diện và phân biệt các loài.
(ii) Hỗ trợ nhận diện các mẫu vật chưa được nhận biết thuộc loài nào hoặc
xác định loài mới (Đây là ứng dụng chính).
Với những loài có hình thái đơn giản, phân bố rộng, kích thước nhỏ hay hệ
thống phân loại chưa đầy đủ và chưa được phân loại một cách triệt để thì mã vạch
DNA giúp hoàn thiện hệ thống phân loại. Ngoài ra, nó còn cung cấp thêm thông tin
9
- hữu ích về đa dạng loài có thể kể đến như nghiên cứu về nhóm thực vật bryphytes
(rêu) [71] hay nhận diện những loài lan ẩn danh [66]. Ngày nay, mã vạch DNA
được ứng dụng nhiều trong các nghiên cứu bao gồm:
(i) Nghiên cứu đánh giá đa dạng di truyền của một vùng địa lý (các mẫu
nghiên cứu thuộc nhiều bộ, họ, chi, loài);
(ii) Phân biệt tập hợp mục tiêu các loài họ hàng có khả năng thay thế loài có
giá trị thương mại;
(iii) Nhận diện mẫu vật mà người sử dụng không có khái niệm quen thuộc.
1.2.2.2. Ứng dụng trong nhận biết dược liệu
Ngày nay, thuốc được phát triển từ dược liệu ngày càng trở nên phổ biến và
nhu cầu sử dụng các sản phẩm chăm sóc sức khỏe có nguồn gốc thiên nhiên ngày
càng tăng. Tổ chức Y tế Thế giới (WHO) ước tính khoảng 80% dân số thế giới sử
dụng cây thuốc để chăm sóc sức khỏe ban đầu [17]. Ở nước phương Tây, cây thuốc
là nguồn gốc của nhiều loại thuốc thảo dược hỗ trợ chăm sóc sức khỏe. Còn ở các
nước phương Đông, đặc biệt là Trung Quốc, việc sử dụng nguyên liệu thảo dược đã
có lịch sử lâu đời, thống kê cho thấy có đến hơn 10000 loài, hơn 2000 chi và 400 họ
được sử dụng để làm thuốc [27]. Thị trường toàn cầu cho dược liệu và cây cho tinh
dầu thơm là 62 tỷ đô la vào năm 2002 và có thể đạt 5 nghìn tỷ đô la vào năm 2050
[85]. Nhu cầu sử dụng dược liệu thúc đẩy sự mở rộng và phát triển của thị trường
xuyên quốc gia về nguồn nguyên liệu thảo dược. Tuy nhiên, nó cũng làm xuất hiện
tình trạng giả mạo dược liệu. Các loài thảo dược này có thể bị thay thế bởi các loài
có quan hệ gần gũi, thậm chí là bị giả mạo hoàn toàn. Tồn tại tình trạng này là do:
(i) Nguyên liệu không phân biệt được bằng đặc điểm hình thái.
(ii) Nguyên liệu có đặc điểm tương tự nhau.
(iii) Thay thế các nguyên liệu có giá trị kinh tế bằng các nguyên liệu dễ kiếm
và rẻ tiền hơn.
Ngoài ra, việc định danh và xác định nguyên liệu thảo dược theo phương
pháp truyền thống như đặc điểm cảm quan và phân tích hóa học đôi khi gặp khó
khăn nhất là khi nguyên liệu được chế biến thành các dạng bào chế như bột hay bị
phân cắt thành các đoạn nhỏ. Chính vì vậy, mã vạch phân tử có lợi thế ưu việt trong
việc nhận biết nguồn gốc dược liệu từ các mẫu mô nhỏ. Không chỉ vậy, mã vạch
phân tử còn được sử dụng phổ biến trong những năm gần đây để đánh giá đa dạng
10
- sinh học phục vụ công tác bảo tồn và kiểm soát chất lượng sản phẩm. Việc định
danh các nguyên liệu thảo dược bằng cách sử dụng mã vạch DNA giúp bảo vệ
người dùng khỏi nguy cơ bị tổn hại sức khỏe bởi các thuốc giả mạo.
1.2.3. Vùng gen lục lạp matK (maturase K)
Gen matK (maturase K), trước đây được gọi là orfK, là chỉ thị quan trọng
được biểu hiện từ bộ gen lục lạp [47]. Gen này có tỷ lệ thay thế cao trong loài và nổi
lên như một ứng cử viên tiềm năng để nghiên cứu hệ thống tiến hóa thực vật [75].
matK là một trong hai gen plastid (rbcL và matK) được Nhóm công tác thực vật
(PWG) của Hiệp hội mã vạch sự sống (CBOL) khuyến nghị sử dụng làm mã vạch
DNA thực vật tiêu chuẩn [38, 50]. matK là gen mã hoá một protein có liên quan đến
quá trình cắt nối intron - exon nhóm II, dài khoảng 1500 bp, nằm trong intron của
gen lục lạp trnK [20, 47] (Hình 1.1). Trong số các maturase, protein này chỉ giữ lại
một miền X được bảo tồn tốt và tàn dư của một miền phiên mã ngược [72]. Các
phức hợp gen matK-trnK thường được sử dụng cho các nghiên cứu tiến hóa thực vật
và giải quyết quan hệ di truyền ở các mức phân loại khác nhau [54].
Hình 1.1:Vị trí của gen matK [47]
Gen matK có tính đa dạng hơn những gen khác trong lục lạp, do vậy nó trở
thành chỉ thị quan trọng giúp phân loại thực vật. Những đặc điểm của gen được khai
thác bao gồm: có kích thước lý tưởng, tỷ lệ chuyển đổi cao và có trình tự bảo thủ.
Tỷ lệ thay thế trong matK cao hơn gấp ba lần ở mức nucleotide và cao gấp sáu lần ở
mức axit amin so với rbcL. Mặt khác sự hiện diện của vùng 3' tương đối được bảo
tồn và vùng 5' ít được bảo tồn có thể được sử dụng để giải quyết các mối quan hệ
phát sinh loài từ các mức độ phân loại nông đến sâu [31, 47].
Việc khuếch đại và giải trình tự vùng mã vạch matK rất khó khăn do tính
biến thiên trình tự cao trong các vị trí liên kết mồi, đặc biệt khi đối tượng nghiên
cứu không phải là thực vật hạt kín [38, 48, 50]. Hiện tại, có ba cặp mồi matK được
sử dụng phổ biến để khuếch đại là: 390F/1326R [29, 90], KIM 3F /KIM 1R [38, 58]
và XF/5R [33]. Kress và cộng sự (2009) đã sử dụng ba cặp mồi này để khuếch đại
11
- mã vạch DNA từ 296 loài thực vật [64]. Sự kết hợp mồi này đã thành công khuếch
đại trong 85% và thành công tuần tự ở 69% các loài, chứng minh rằng khuếch đại là
đáng tin cậy. Tuy nhiên, việc sử dụng nhiều hơn một cặp mồi có thể tốn thời gian
cũng như kinh phí và thường phức tạp đối với các dự án quy mô lớn [44].
Gen matK cho thấy khả năng phân biệt cao các loài thực vật hạt kín và hỗ trợ
định danh cho nhiều loài thực vật [80]. Chỉ thị này đã được ứng dụng thành công để
xây dựng cây phát sinh loài cho họ Valerianaceae [46], Saxifragaceae,
Polemoniaceae, Poaceae [47],… và giải quyết mối quan hệ di truyền của họ
Aurantioideae đặc biệt là chi Citrus [76],… Mã vạch này được sử dụng thành công
để phân biệt Panax notoginseng (Araliaceae) giữa các vùng địa lý khác nhau [95]
và xây dựng cây phân loài của Panax vietnamensis và 5 trình tự liên quan [62].
1.3. Phân tích phát sinh gen (Phylogenetic Analysis)
Việc xác định mối quan hệ phân cấp giữa các loài và ước lượng thời gian
phân kỳ giữa chúng dựa trên các trình tự sinh học như protein hoặc DNA được thực
hiện bởi các nghiên cứu phát sinh gen. Các nghiên cứu phát sinh gen thường được
chia làm 5 giai đoạn:
Giai đoạn 1: Lựa chọn trình tự sinh học cần phân tích.
Giai đoạn 2: Xây dựng sự liên kết (sắp xếp đa chuỗi) giữa các trình tự sinh
học được chọn.
Giai đoạn 3: Lựa chọn các mô hình thay thế, các mô hình thống kê về tiến
hóa phân tử cho các trình tự.
Giai đoạn 4: Xây dựng các cây phát sinh loài
Giai đoạn 5: Đánh giá thống kê các cây phát sinh loài
1.3.1. Lựa chọn trình tự sinh học
Các nghiên cứu phát sinh gen dựa trên việc so sánh các trình tự sinh học
tương đồng. Nghiên cứu về sự khác biệt giữa các trình tự cho phép ước tính mối
quan hệ tiến hóa giữa các loài tương ứng và thời gian phân kỳ của chúng. Để có
được các chuỗi tương đồng, các cơ sở dữ liệu như RefSeq, Uniprot hoặc
HomoloGene có thể rất hữu ích. Một cách khác để có được các chuỗi tương đồng là
sử dụng các trình tự từ các kết quả BLAST.
Hai trình tự DNA ở hai sinh vật khác nhau tiến hóa từ một trình tự DNA tổ
tiên thì được gọi hai trình tự DNA tương đồng. Tuy nhiên, vẫn có những khác biệt
12
nguon tai.lieu . vn