tailieunhanh - Phân lớp dữ liệu CGH dự đoán bệnh ung thư ở người

Bài báo trình bày các kết quả thực nghiệm của chúng tôi tiến hành theo các đề xuất của Jun Liu. Kết quả cho thấy rằng phương pháp này có khả năng phân lớp dự đoán bệnh ung thư (dựa trên mẫu dữ liệu CGH của bệnh nhân) chính xác hơn so với các phương pháp thường được sử dụng trước đó. | JOURNAL OF SCIENCE OF HNUE FIT. 2011 Vol. 56 pp. 48-58 PHÂN LỚP DỮ LIỆU CGH DỰ ĐOÁN BỆNH UNG THƯ Ở NGƯỜI Hồ Cẩm Hà Nguyễn Thị Hạnh Khoa CNTT - ĐHSP Hà Nội Email hahc@ Tóm tắt. Bằng phép lai gen so sánh CGH Comparative Genomic Hy- bridization người ta đã phát hiện ra sự mất cân bằng số lượng sao chép Copy Number Alterations ADN trong các gen đột biến gây ung thư. Tiến sĩ Jun Liu 2 đã đề xuất phương pháp sử dụng bộ phân loại vectơ hỗ trợ SVM Support Vector Machine với hàm nhân Raw và phương pháp lựa chọn đặc trưng phân lớp MIFS Maximum Influence Feature Selection để phân tích dữ liệu CGH. Bài báo trình bày các kết quả thực nghiệm của chúng tôi tiến hành theo các đề xuất của Jun Liu. Kết quả cho thấy rằng phương pháp này có khả năng phân lớp dự đoán bệnh ung thư dựa trên mẫu dữ liệu CGH của bệnh nhân chính xác hơn so với các phương pháp thường được sử dụng trước đó. 1. Giới thiệu Ung thư là một căn bệnh nguy hiểm đe dọa mạng sống con người nhưng nó không phải là không thể chữa trị được. Nhiệm vụ quan trọng hàng đầu đặt ra cho các nghiên cứu về căn bệnh này là phát hiện và phân loại bệnh nhân ung thư sớm trước khi có các triệu chứng lâm sàng dựa trên việc phân tích di truyền học phân tử của đột biến gen gây ung thư. Một cách tiếp cận được đề xuất là khai phá nguồn dữ liệu CGH để hỗ trợ cho việc xác định sớm bệnh nhân có mắc ung thư hay không cụ thể là ung thư loại nào nếu có . Đây chính là bài toán phân lớp dữ liệu classification trong lĩnh vực học máy Machine Learning . Mục tiêu của bài toán là phân lớp dữ liệu CGH để chuẩn đoán và phân loại bệnh nhân ung thư ngay từ giai đoạn tiền phát thông qua phân tích sự thay đổi trong cấu trúc phân tử ADN của người bệnh. Đã có nhiều nghiên cứu phân lớp dữ liệu CGH với các phương pháp khác nhau như Na ıve Bayes K-láng giềng gần nhất K-nearest neighbor cây quyết định Decision Tree . Trong đó phương pháp dùng bộ phân loại vectơ hỗ trợ SVM cho kết quả tốt nhất 2 . SVM được đánh giá là một công cụ rất mạnh trong việc phân

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN