tailieunhanh - Phân loại gene mã hóa protein vận chuyển sử dụng các gene hàng xóm

Trong bài báo này tác giả đề xuất một phương pháp sử dụng dữ liệu sinh học để phân lớp các protein vận chuyển trên màng tế bào dựa vào cơ chất mà chúng vận chuyển. Dựa trên ý tưởng của các Operon, các tác giả sử dụng dữ liệu biểu hiện gene và các GO terms của các gene hàng xóm để tạo dữ liệu đầu vào cho máy vector hỗ trợ. | J. Sci. Devel. 2015 Vol. 13 No. 2 291-300 Tạp chí Khoa học và Phát triển 2015 tập 13 số 2 291-300 PHÂN LOẠI GENE MÃ HÓA PROTEIN VẬN CHUYỂN SỬ DỤNG CÁC GENE HÀNG XÓM Trần Vũ Hà Phạm Quang Dũng Nguyễn Thị Thảo Đoàn Thị Thu Hà Khoa Công nghệ thông tin Học viện Nông nghiệp Việt Nam Email tvha@ Ngày gửi bài Ngày chấp nhận TÓM TẮT Cũng giống như sự đa dạng sinh học trong tự nhiên có quá nhiều loại protein để chúng ta có thể miêu tả chức năng của chúng anotate bằng các thí nghiệm khoa học. Do đó các phương pháp để dự đoán chức năng của các protein trở nên cần thiết. Trong bài báo này chúng tôi đề xuất một phương pháp sử dụng dữ liệu sinh học để phân lớp các protein vận chuyển trên màng tế bào dựa vào cơ chất mà chúng vận chuyển. Dựa trên ý tưởng của các Operon chúng tôi sử dụng dữ liệu biểu hiện gene và các GO terms của các gene hàng xóm để tạo dữ liệu đầu vào cho máy vector hỗ trợ. Để nhanh chóng thu được kết quả chúng tôi tích hợp LIBSVM A Library for Support Vector Machines vào công cụ xử lý dữ liệu và sử dụng công cụ này để huấn luyện cũng như kiểm tra các bộ phân loại. Với công cụ này người dùng có thể phân loại các protein vận chuyển và cả các loại protein khác cho phép người dùng thêm dữ liệu của các sinh vật mới ngoài các sinh vật được sử dụng để thử nghiệm. Từ khóa Protein vận chuyển gene hàng xóm Gene Ontology. Classifying Genes Encode Transmembrane Proteins Using Neighboring Genes ABSTRACT Like bio-diversity there are too many proteins to experimentally annotate. Thus methods for predicting the functions of proteins become necessary. In this article we proposed a method that uses biological data to classify membrane transporters according to transported substrates. Motivated by the concept of Operons our method used expression data and GO terms of neighboring genes to create input data for support vector machine. To rapidly obtain the result we integrated LIBSVM in our tool then used this tool to train and test .

TỪ KHÓA LIÊN QUAN