Xem mẫu

  1. Thực hành bioinformatics (Bài thực hành 1 và 2) Lưu ý: 1. Thực hành tại phòng máy tính của Khoa Tin học, tầng 1 nhà B. Thời gian bắt đầu từ 8h00 đến 11h30 2. Có 4 bài thực hành (tương ứng với 4 buổi cho mỗi nhóm) 3. Đề nghị các nhóm in tài liệu hướng dẫn thực hành trước mỗi buổi thực tập 4. Bài thực hành 1 và 2 sẽ được tiến hành trong 2 buổi. Mỗi buổi làm 2 phần. 5. Kết thúc mỗi buổi thực hành, nộp ngay câu trả lời tại lớp. Phần 1. Làm quen với Genome browser Sử dụng máy tính kết nối Internet truy cập vào các trang web sau: i. UCSC genome browser (http://genome.ucsc.edu/) ii. Ensembl genome browser (http://www.ensembl.org) iii. NCBI MapViewer (http://www.ncbi.nlm.nih.gov/mapview/) iv. ECR Browser (http://ecrbrowser.dcode.org) Câu hỏi : Sau khi tìm hiểu các trang web ở trên hãy giải thích thế nào là genome browser ? 1. Mục đích của genome browser ? 2. Cho biết có bao nhiêu genome đã được xác định trình tự ở các genome browser ? 3. Sử dụng UCSC genome browser, hãy cho biết ý nghĩa của : 4. BLAT Gene Sorter Insilico PCR Micribial genomes 5. Sử dụng Ensembl genome browser, hãy cho biết : Có bao nhiêu loài trong bộ linh trưởng (primates) đã được xác định trình tự Có bao nhiêu gene mã hóa cho enzym amylase trong genome người ? Các enzym này nằm trên NST nào ? 6. Sử dụng Map Viewer, hãy cho biết: Asperginus niger có bao nhiêu NST? Genome ti thể của sinh vật này có chiều dài bao nhiêu? (tính theo Kilobase_Kb) Đến thời điểm hiện nay có bao nhiêu gene trong genome ti thể của sinh vật này đã được xác định?
  2. Hình 1. UCSC genome browser Hình 2. Ensembl genome browser
  3. Phần 2. Làm quen với cơ sở dữ liệu của các ngân hàng gen Truy cập vào các trang web sau: i. http://www.ncbi.nlm.nih.gov/ ii. http://www.ebi.ac.uk/embl/ iii. http://www.ddbj.nig.ac.jp/ iv. http://www.ebi.ac.uk/uniprot/ v. http://expasy.org/ vi. http://www.pdb.org/pdb/home/home.do Câu hỏi: 1. Hãy cho biết tên và ý nghĩa của các trang web trên? 2. Truy cập vào các trang web i, ii, iii và iv ở trên. Hãy kể tên những CSDL chính và ý nghĩa của chúng. 3. Truy cập vào trang web http://www.ncbi.nlm.nih.gov/ • Trong mục tìm kiếm Search, tìm mục All database. Hãy cho biết có tất cả bao nhiêu CSDL? Kể tên và nói ngắn gọn ý nghĩa của từng CSDL. • Trong CSDL gene, hãy cho biết có bao nhiêu gene mã hóa cho enzyme amylase đã được biết cho tới nay? (ở tất cả các loài có trong CSDL) 4. Gene mã hóa cho enzyme alpha amylase ở Bacillus subtilis 168 có gene ID là 938356, locus tag là: BSU03040, số truy cập trong NCBI là AL009126, NCBI Reference Sequence là NC_000964.3, GI:255767013. Hãy sử dụng CSDL của ngân hàng gene NCBI để trả lời các câu hỏi sau: • Thông tin tóm tắt về gene này? (bao gồm gene symbol, gene description, locus tag, gene type, RefSeq status, organism, lineage). • Kích thước của gene (coding sequence)? • Có bao nhiêu amino acid trong phân tử enzyme do gene đó mã hóa • Gene mã hóa cho amylase ở trên nằm trước và sau gene nào trên NST? • Gene ở trên liên quan đến con đường chuyển hóa nào của vi khuẩn B. subtilis? • Trên cơ sở các kết quả đã tìm được, tìm hiểu thêm các thông tin để trả lời các câu hỏi: i. Kích thước genome của B. subtilis ? ii. Sử dụng công cụ Graphic để hiển thị vị trí của gene trên NST. Cho biết vị trí của gene đó trên NST? (điểm bắt đầu và kết thúc). Tìm hiểu các gene lân cận và các khoảng trống giữa các gene. Nếu có thời gian hãy phân tích trình tự upstream (đầu 5’) của gene này. iii. Copy trình tự coding sequence (CDS) và trình tự amino acid của gene này dưới dạng FASTA và lưu lại trên máy tính cho các bài tập tiếp theo. Phần 3. Làm quen với các công cụ phân tích CSDL Truy cập vào các trang web sau: vii. http://www.ncbi.nlm.nih.gov/ viii. http://www.ebi.ac.uk/embl/
  4. ix. http://www.ddbj.nig.ac.jp/ x. http://www.ebi.ac.uk/uniprot/ xi. http://expasy.org/ xii. http://www.pdb.org/pdb/home/home.do Câu hỏi: 1. Cho kể tên một số công cụ phân tích cơ bản có trong các trang web trên. Nêu ý nghĩa của chúng? 2. Truy cập vào trang web (EMBL) http://www.ebi.ac.uk/embl/ • Hãy quan sát các công cụ phân tích có trong mục Tools. Kể tên và nói ngắn gọn ý nghĩa của một số công cụ phân tích cơ bản (ít nhất 5 nhóm công cụ) • Vẫn trong phần Tools của EMBL, tìm hiểu nhóm công cụ phân tích Similarity & Homology. Hãy cho biết ý nghĩa và mục đích sử dụng của các công cụ sau: i. BLAST2-WU Protein ii. BLAST2-WU Nucleotide iii. BLAST2-NCBI iv. BLAST2-NCBI Nucleotide v. BLAST2-NCBI EVEC vi. PSI-BLAST (old version) vii. PSI-BLAST (new version) viii. PHI-BLAST ix. FASTA Nucleotide x. FASTA Protein xi. FASTA-Proteome Server xii. FASTA-Genome Server xiii. FASTA-WGS Server 3. Truy cập vào trang web của NCBI theo địa chỉ sau: http://www.ncbi.nlm.nih.gov/Tools/ Hãy liệt kê các công cụ phân tích và nêu ý nghĩa của chúng 4. Truy cập vào trang web (ExPASy) http://expasy.org/ Trong phần Tools and Software, chọn mục ExPASy Proteomics tools. Hãy cho biết có bao nhiêu nhóm công cụ phân tích proteomic? Trong mỗi nhóm công cụ, hãy kể ra ít nhất 2 công cụ phân tích và nêu ý nghĩa của chúng? Phần 4. Làm quen với việc phân tích CSDL trình tự sinh học 4.1. Phân tích bản đồ giới hạn Truy cập vào các địa chỉ sau: Địa chỉ Tên trang web NEB Cutter http://tools.neb.com/NEBcutter2/index.php Restriction/Mapper http://arbl.cvmbs.colostate.edu/molkit/mapper/index.html http://www.restrictionmapper.org/ Webcutter http://www.ccsi.com/firstmarket/cutter/cut2.html In Silico Restriction insilico.ehu.es
  5. WatCut http://watcut.uwaterloo.ca/watcut/watcut/ EnzymeX http://mekentosj.com/enzymex/ Silent http://bioweb.pasteur.fr/seqanal/interfaces/silent.html Câu hỏi : 1. Hãy cho biết ý nghĩa của các trang web trên 2. Truy cập vào trang web NEB Cutter. Hãy paste trình tự của gene mã hóa cho enzym amylase của B. subtilis ở bài tập trên vào ô trống hoặc điền địa chỉ ID của gene. Quan sát bản đồ của các enzym cắt giới hạn đối với gene trên. 3. Áp dụng tương tự với các công cụ trong các trang web còn lại. Cho biết website nào cung cấp công cụ phân tích bản đồ giới hạn cho kết quả tốt nhất (dễ thao tác, thuận tiện, kết quả hiển thị rõ ràng). Hình 3. Kết quả phân tích bản đồ giới hạn của enzym alpha amylase của B. subtilis
  6. Tìm kiếm khung đọc mở (ORF) 4.2. Câu hỏi : 1. Sử dụng công cụ tìm kiếm (search engine), tìm một số công cụ phân tích khung đọc mở (open reading frame). Hãy viết lại tên và địa chỉ của các trang web đó. 2. Truy cập vào trang web NCBI theo địa chỉ : http://www.ncbi.nlm.nih.gov/gorf/gorf.html Copy và paste trình tự gene hoặc điền số GI của gene vào ô trống sau đó Click vào OrfFind. Hãy trả lời các câu hỏi sau. • Có tối đa bao nhiêu khung đọc mở? • Giải thích kết quả phân tích ORF Tìm kiếm trình tự tương đồng : 4.3. Truy cập vào NCBI, hãy tìm trình tự nucleotide của 1 gene có số ID: 9223824. Câu hỏi. Hãy cho biết : 1. gene đó mã hóa cho protein, enzym gì ? Enzym này thường được sử dụng làm gì ? 2. Tên loài sinh vật mang gene đó 3. Sử dụng công cụ BLAST, hãy cho biết có bao nhiêu gene có trình tự tương đồng với gene đã nêu ở trên. 4. Hãy cho biết gene nào cho kết quả tương đồng cao nhất và thấp nhất với gene ở trên ? và ghi lại các ID của những gene đó? Cho biết số lượng gaps khi so sánh trình tự của các gene này ? (chỗ trống khi thực hiện việc alignment giữa 2 trình tự). Có thể nhận xét gì về mối liên hệ giữa số lượng gaps và mức độ tương đồng giữa các trình tự.
nguon tai.lieu . vn