tailieunhanh - Mở rộng độ đo thông tin tương hỗ có điều kiện cho trường hợp nhiều biến

Trong bài báo này, theo hướng tiếp cận của Lí thuyết thông tin, chúng tôi đề xuất một mở rộng của độ đo thông tin tương hỗ có điều kiện trong trường hợp nhiều biến. Sau đó, chúng tôi giới thiệu một phương pháp mới sử dụng cả hai độ đo là độ đo thông tin tương hỗ (MI) và độ đo thông tin tương hỗ có điều kiện (CMI) để phát hiện các mối quan hệ giữa các gen, từ đó tái tạo mạng điều khiển gen. | JOURNAL OF SCIENCE OF HNUE FIT. 2013 Vol. 58 pp. 3-12 This paper is available online at http MỞ RỘNG ĐỘ ĐO THÔNG TIN TƯƠNG HỖ CÓ ĐIỀU KIỆN CHO TRƯỜNG HỢP NHIỀU BIẾN Nguyễn Quỳnh Diệp Nguyễn Thị Bích Ngọc Phạm Thọ Hoàn và Trần Đăng Hưng Khoa Công nghệ Thông tin Trường Đại học Sư Phạm Hà Nội E-mail diepnq@ Tóm tắt. Phân tích dữ liệu biểu hiện gen là một trong những thao tác quan trọng để tìm ra chức năng của các phần tử sinh học. Để có thể hiểu được cơ chế phức tạp của hệ thống sinh học việc tái tạo mạng điều khiển gen Gene Regulatory Networks-GRNs là một nhiệm vụ hết sức quan trọng và đã trở thành một vấn đề thách thức. Trong bài báo này chúng tôi đề xuất một mở rộng độ đo thông tin tương hỗ có điều kiện Conditional Mutual Information-CMI cho trường hợp nhiều biến. Sau đó chúng tôi trình bày thuật toán Path Consistency Algorithm-PCA. Đây là một phương pháp mới để tái tạo GRNs từ dữ liệu biểu hiện gen bằng cách sử dụng thông tin tương hỗ MI và thông tin tương hỗ có điều kiện CMI . Trong thuật toán này sự phụ thuộc có điều kiện giữa một cặp gen được biểu diễn bằng CMI giữa chúng. Kết quả thử nghiệm đã xác nhận hiệu quả của phương pháp PCA-CMI tốt hơn so với các phương pháp trước đây. Từ khóa Phần tử sinh học mở rộng độ đo thông tin tương hỗ có điều kiện phương pháp PCA-CMI. 1. Mở đầu Trong lĩnh vực sinh học phân tử việc tìm hiểu về tương tác giữa các phân tử của hệ thống sinh học là hết sức quan trọng đây có thể được xem như là mục tiêu cuối cùng của di truyền học. Mặc dù toàn bộ hệ gen của con người đã được nghiên cứu và sắp xếp theo trình tự nhưng hiểu biết về mạng điều khiển gen ở người còn rất hạn chế. Hiện nay có nhiều phương pháp tiếp cận để tái tạo mạng điều khiển gen GRNs từ dữ liệu biểu hiện gen như Mô hình đồ thị chẳng hạn như đồ thị Gauss 9 mạng Bayes 10 Phương trình vi phân tích phân 1 6 Phương pháp hồi quy quy hoạch tuyến tính 2 8 Lí thuyết thông tin 3 4 . Mặc dù nhiều giải thuật xây dựng mạng đã được công bố nhưng vẫn còn một

TỪ KHÓA LIÊN QUAN