tailieunhanh - Đoán nhận gen bằng kỹ thuật phân cụm trong tin học

Bài toán thường gặp trong sinh học đó là phân chia tập các dữ liệu thí nghiệm thành các cụm sao cho các điểm dữ liệu trong cùng cụm có độ tương đồng cao, và nếu ở khác cụm thì chúng sẽ khác biệt nhau. Có nhiều cách phân cụm, và không có cách phân cụm nào được cho là tốt nhất mà nó tùy thuộc vào mục đích của việc phân cụm. | 48 TRƯỜNG ĐẠI HỌC PHÚ YÊN ĐOÁN NHẬN GEN BẰNG KỸ THUẬT PHÂN CỤM TRONG TIN HỌC Phan Thị Thanh Thủy Tóm tắt Bài toán thường gặp trong sinh học đó là phân chia tập các dữ liệu thí nghiệm thành các cụm sao cho các điểm dữ liệu trong cùng cụm có độ tương đồng cao và nếu ở khác cụm thì chúng sẽ khác biệt nhau. Có nhiều cách phân cụm và không có cách phân cụm nào được cho là tốt nhất mà nó tùy thuộc vào mục đích của việc phân cụm. Việc phân cụm các gen sẽ hy vọng các gen cùng cụm có liên quan với nhau cùng thực hiện một chức năng nào đó. Từ đó có thể tìm ra chức năng của một số gen mới dựa vào những gen đã biết trước đó. Các nhà sinh học sẽ quyết định chọn cách phân cụm nào là hợp lý nhất. Từ khóa phân cụm gen kỹ thuật tin học Tin sinh học là một lĩnh vực nghiên cứu khá mới ở Việt Nam được ra đời bởi sự kết hợp giữa hai ngành khoa học chính là công nghệ thông tin và công nghệ sinh học. Tin sinh học hiện đang và sẽ tiếp tục đóng góp nhiều thành tựu trong khoa học sinh học như tìm ra nguyên nhân các loại bệnh làm đẩy nhanh quá trình chẩn đoán bệnh và tìm ra các loại thuốc chữa bệnh mới tìm ra các giống cây trồng và vật nuôi mới cho năng suất cao. Việc phân tích về sự giống nhau giữa các chuỗi DNA từ các sinh vật khác nhau cũng mở ra hướng mới trong việc nghiên cứu lí thuyết tiến hóa. Với sự phát triển mạnh trong cả hai lĩnh vực là công nghệ sinh học và công nghệ thông tin ngày nay một khối lượng khổng lồ dữ liệu sinh học phân tử được thu thập và phục vụ cho quá trình nghiên cứu. Một trong những ví dụ tiêu biểu nhất có lẽ là sự hoàn thành việc giải mã bản đồ gen của người vào năm 2003. Bộ gen của người bao gồm khoảng 3 tỷ nucleotide và được lưu trữ dưới dạng số hóa. Tuy nhiên việc giải mã thành công bộ gen của người hay các sinh vật khác như chuột hay lúa mới chỉ là bước đầu tiên trong quá trình tìm hiểu về chúng. Và để hiểu được chức năng của tất cả các gen lại là một bài toán khác và còn lâu mới giải quyết xong cũng như nhiều bài toán khác đang được quan tâm nghiên cứu. Số