Xem mẫu
- Phần phụ lục 185
2. Lớp Get FieldInLocVerAcc: tách trƣờng con trong các trƣờng chính LOCUS
và VERSION
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 186
3. Lớp GetFieldInSmallFieldOfFeature: Tách các nội dung khác trong trƣờng
CDS.
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 187
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 188
4. Lớp Servlet Controller: Nhận tham số do ngƣời dùng gởi tới khi nhấn nút
submit
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 189
5. Lớp Check: kiểm tra các điều kiện ngƣời dùng đặt ra.
6. Lớp CheckFieldOfVerAcc: tìm kiếm trong các trƣờng LOCUS, VERSION,
ACCESSION.
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 190
7. Lớp CheckOtherRequest: cho phép tìm kiếm trong các trƣờng còn lại, nhƣ
DEFINITION, TITLE…
8. Lớp CheckFieldInSmallFieldOfFeature: cho phép tìm kiếm các trƣờng trong
CDS nhƣ gene, product…
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 191
9. Lớp CheckOriginRequest: cho phép tìm kiếm trình tự trong ORIGIN
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 192
10. Lớp Servlet Result: Nhận các file thỏa kết quả tìm kiếm, tại đây thực hiện
việc lấy nội dung các file kết quả và thực hiện xuất kết quả theo yêu cầu ngƣời dùng
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 193
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 194
11. Lớp Servlet printSummaryHtml: xuất kết quả với thông tin tóm tắt trình tự.
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 195
12. Lớp Servlet PrintGenbankHtml: xuất kết quả theo định dạng GenBank
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 196
13. Lớp printCdsNucleotideSeqHtml: xuất kết quả trình tự CDS dƣới dạng
FASTA
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 197
14. Lớp ReadGB: cho phép xuất trình tự toàn bộ Nucleotide hay trình tự từ điểm
khởi đầu đến điểm kết thúc cho trƣớc.
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 198
15. Lớp Servlet PrintNucleotideSeqFastaHtml: xuất kết quả trình tự nucleotide
dƣới dạng FASTA
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 199
16. Lớp Servlet PrintCdsAAcidSeqFastaHtml: xuất kết quả trình tự amino acid
dƣới dạng FASTA
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 200
PHỤ LỤC E
* Nguyên tắc hoạt động của hai công cụ tìm kiếm Google và Scirus
Google
Trong bảng trên cho thấy Google dung lƣợng chỉ mục rộng nhất. Đây là công cụ
tìm kiếm mang tính chất mới mẽ dựa trên các chỉ mục tác phẩm khoa học đƣợc trích
dẫn (Butler, 2000). Các công cụ tìm kiếm truyền thống sử dụng thuật toán và qui luật
đơn giản tạo ra thứ tự các trang dựa trên tần số xuất hiện keywords đƣợc chỉ ra tr ong
query. Google dựa vào việc kết nối giữa các trang web để xếp loại kết quả tìm kiếm.
Vì thế các trang web đƣợc trích dẫn cao trên thế giới với nhiều liên kết dẫn đến chúng
đƣợc sắp xếp cao nhất trong kết quả tìm kiếm. Đây là một cơ chế tìm kiếm hiệu quả
mà bắt hiệu quả chính xác trên các trang web tốt và hay đƣợc dùng nhất trên Internet.
Scirus
Sự giới hạn lớn nhất cho các công cụ tìm web là không đƣợc chỉ mục tới đƣợc cơ
sở dữ liệu. Vấn đề này xảy ra ở nhiều cơ sở dữ liệu tạo ra internet sinh học, nhƣ cơ sở
dữ liệu trình tự và một vài nguồn dựa trên sự cho phép nhƣ các tạp chí full -text, và cơ
sở dữ liệu thƣơng mại. Mặc dù nội dung bị giới hạn ở các địa chỉ này, tuy nhiên tài
liệu và nội dung tóm tắt vẫn đƣợc liệt kê bởi các công cụ tìm kiếm, nhƣng dữ l iệu nằm
bên dƣới không có sẵn bởi vì tƣờng lửa (firewalls) của cơ sở dữ liệu khóa sự chỉ mục
nội bộ.
Trong một nỗ lực để giải quyết vấn đề này, nhà xuất bản Elsevier đã phát triển Scirus
(http://www.scirus.com/). Đây là một dự án đƣợc kết hợp với FAST, công ty công cụ
tìm kiếm của NaUy đã tạo ra các công cụ tìm kiếm chuyên biệt về khoa học. Scirus
tăng cƣờng phạm vi và tính chuyên biệt của nó bởi chỉ chỉ mục tới các nguồn với các
thông tin khoa học. Các trang web này bao gồm, tạp chí full-text và các tóm tắt của
Medline. Điều này khiến cho Scirus là công cụ hiệu quả cho cả hai công cụ tìm tác
phẩm và web. Cả hai full-text và tạp chí định dạng PDF đƣợc chỉ mục bởi thực hiện
MetaSearch của các nhà cung cấp full-text chủ yếu – Elsevier‟s ScienceDirect và
Academic Press‟s IDEAL. Scirus cũng tìm kiếm web dựa vào key words, phạm vi bao
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
- Phần phụ lục 201
gồm Medline, các bản quyền từ cơ sở dữ liệu của phòng bản quyền Mỹ (the US Patent
Office), các hội nghị và các tóm tắt liên quan khoa học. Cơ sở dữ liệu Medline đƣợc
cung cấp trên hệ thống BioMedNet, đòi hỏi đăng nhập BioMedNet miễn phí và mật
mã để lấy ra. Scirus cung cấp nhiều tùy chọn qui định cách tìm kiếm để tìm kiếm chỉ
trên địa chỉ miễn phí, chỉ trên địa chỉ thành viên hay chỉ trên một địa chỉ đặc biệt.
Tháng 3 năm 2002 Scirus đã chỉ mục tới 69 triệu trang liên quan tới khoa học, bao
gồm file PDF và các mẫu tin phản biện, vì thế nó bao phủ đa số internet liên quan sinh
học.
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
nguon tai.lieu . vn