Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Nông - Lâm - Ngư
Lâm nghiệp
Phương pháp lấy mẫu thuộc tính mới trong rừng ngẫu nhiên cho phân tích dữ liệu SNP
tailieunhanh - Phương pháp lấy mẫu thuộc tính mới trong rừng ngẫu nhiên cho phân tích dữ liệu SNP
Trong bài báo này đề xuất một phương pháp lấy mẫu hai bước để lựa chọn các đặc trưng có ý nghĩa trong việc huấn luyện mô hình rừng ngẫu nhiên. Phương pháp này cho phép chọn ra một tập nhỏ các đặc trưng có liên hệ chặt chẽ với biến đích (bệnh), do đó làm giảm số chiều và có thể xử lý tốt trên các tập dữ liệu có số chiều cao. Mời bạn đọc tham khảo. | J. Sci. Devel. 2015 Vol. 13 No. 2 301-307 Tạp chí Khoa học và Phát triển 2015 tập 13 số 2 301-307 PHƯƠNG PHÁP LẤY MẪU THUỘC TÍNH MỚI TRONG RỪNG NGẪU NHIÊN CHO PHÂN TÍCH DỮ LIỆU SNP Nguyễn Văn Hoàng Phan Thị Thu Hồng Nguyễn Thanh Tùng Nguyễn Thị Thủy Khoa Công nghệ thông tin Học viện Nông nghiệp Việt Nam Email nvhoang@ Ngày gửi bài Ngày chấp nhận TÓM TẮT Gần đây các nghiên cứu liên kết mức toàn hệ gen GWAS đã đạt được thành công trong việc xác định một số biến thể di truyền có ảnh hưởng tương đối lớn tới một số bệnh phức tạp. Hầu hết các GWAS sử dụng các tiếp cận đơn SNP đa hình đơn nucleotide chỉ tập trung vào việc đánh giá sự liên hệ giữa từng SNP riêng biệt với bệnh. Tuy nhiên trên thực tế các bệnh phức tạp được cho là liên quan tới những nguyên nhân phức tạp bao gồm những tương tác rắc rối giữa nhiều SNPs. Do đó cần có những cách tiếp cận khác để xác định sự ảnh hưởng của các SNP hoặc những tương tác phức tạp của các SNP tới bệnh. Phương pháp rừng ngẫu nhiên Random Forest RF gần đây đã được ứng dụng thành công trong GWAS cho việc xác định một số nhân tố di truyền có ảnh hưởng lớn tới một số bệnh phức tạp. Mặc dù RF xử lý tốt trên khía cạnh chính xác dự đoán trên một số tập dữ liệu có kích cỡ trung bình nhưng mô hình RF truyền thống có nhiều hạn chế trong việc xác định các SNPs có ý nghĩa và xây dựng các mô hình dự đoán chính xác. Trong bài báo này chúng tôi đề xuất một phương pháp lấy mẫu hai bước để lựa chọn các đặc trưng có ý nghĩa trong việc huấn luyện mô hình rừng ngẫu nhiên. Phương pháp này cho phép chọn ra một tập nhỏ các đặc trưng có liên hệ chặt chẽ với biến đích bệnh do đó làm giảm số chiều và có thể xử lý tốt trên các tập dữ liệu có số chiều cao. Chúng tôi cũng tiến hành các thực nghiệm trên hai tập dữ liệu chuẩn SNP ở mức toàn bộ hệ gen để làm sáng tỏ hiệu quả của phương pháp đề xuất. Từ khóa Genome-wide Association Study học máy khai phá dữ liệu rừng ngẫu nhiên A New Feature Sampling Method in Learning
Thảo Quyên
80
7
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Phân tích dữ liệu và ứng dụng phân tích dữ liệu cho doanh nghiệp
8
1
1
Bài giảng Phân tích và xử lý dữ liệu với R: Bài thực hành 3 - Học viện Ngân hàng
12
174
2
Công cụ ứng dụng phân tích dữ liệu cho doanh nghiệp
10
2
1
Bài giảng Tin học ứng dụng phân tích dữ liệu nghiên cứu với SPSS - Bài 6: Phân tích dữ liệu
91
138
2
Bài giảng Phân tích dữ liệu nghiên cứu: Chủ đề 1 - Lê Kim Long và Phạm Thành Thái
31
104
0
Bài giảng Giới thiệu sơ lược phân tích dữ liệu với SPSS - TS. Lê Văn Huy
40
128
4
Bài giảng Phân tích dữ liệu nghiên cứu với SPSS
55
130
5
Bài giảng Phương pháp phân tích dữ liệu
63
117
2
Bài giảng Phân tích dữ liệu
60
158
1
Bài giảng Thống kê và phân tích dữ liệu - Lê Kim Long và Phạm Thành Thái
10
143
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461871
55
Giới thiệu :Lập trình mã nguồn mở
14
22687
61
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10901
530
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10072
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9536
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8295
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8244
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6697
253
Vật lý hạt cơ bản (1)
29
5778
85
TỪ KHÓA LIÊN QUAN
Lâm nghiệp
Phân tích dữ liệu SNP
Genome wide Association Study
Khai phá dữ liệu
Rừng ngẫu nhiên
Dữ liệu SNP
Phương pháp lấy mẫu
Cách lấy mẫu
Kỹ thuật lấy mẫu
Khung lấy mẫu
Các kỹ thuật lấy mẫu
Bí quyết lấy mẫu
Phương pháp lấy mẫu nước
Mẫu tổ hợp
Thiết bị lấy mẫu
Bảo quản mẫu
Bình chứa mẫu
Thực hành lấy mẫu
Bài giảng Phương pháp nghiên cứu khoa học
Phương pháp nghiên cứu khoa học
Phương pháp lấy mẫu xác suất
Sơ đồ lấy mẫu xác suất
Danh sách dân số
Phát triển phương pháp lấy mẫu thụ động POCIS
Phương pháp lấy mẫu thụ động POCIS
Hợp chất bảo vệ thực vật phân cực
Nước bề mặt
Nồng độ dư lượng
Bài giảng Phân tích thực phẩm
Phân tích thực phẩm
Phương pháp lấy mẫu thực phẩm
Mẫu thử trung bình
Lô hàng đồng nhất
Tiêu chuẩn lấy mẫu
Bài giảng Thống kê và phân tích dữ liệu
Thống kê dữ liệu
Phân tích dữ liệu
Phân phối mẫu
Lấy mẫu ngẫu nhiên đơn giản
Phương pháp định lượng chính sách
Phương pháp phân tích định lượng
Bài giảng Phương pháp phân tích định lượng
Chính sách công
Phương pháp polynomial chaos
Hệ thống treo trên ô tô
Phương pháp PC
Phương pháp Monte Carlo
Chuẩn mực kiểm toán
Hệ thống chuẩn mực kiểm toán Việt Nam
Lấy mẫu kiểm toán
Chuẩn mực kiểm toán số 530
Phương pháp lấy mẫu kiểm toán
Lựa chọn mẫu kiểm toán
Bài giảng Kiểm toán
Kiểm toán
Quy trình lấy mẫu kiểm toán
Phương pháp chọn mẫu phi thống kê
Dự tính sai phạm
Kỹ thuật lấy mẫu phi xác suất
Thiết kế mẫu
Phương pháp chọn mẫu
Bài giảng kinh tế học
Tài liệu kinh tế học
Mẫu sinh thiết thận
Phương pháp lấy mẫu sinh thiết thận
Bệnh ở thận
Thận bình thường
Đặc điểm thận ghép
Mẫu sinh thiết thận ghéo
Tiêu chuẩn Việt Nam
Tiêu chuẩn Quốc gia
Sản phẩm dầu mỏ
Tiêu chuẩn dầu mỏ
Phương pháp lấy mẫu dầu mỏ
Lấy mẫu dầu mỏ
Lấy mẫu thủ công dầu mỏ
Lấy mẫu cà phê nhân
Cà phê nhân
Quy trình lấy mẫu cà phê nhân
Phương pháp lấy mẫu cà phê nhân
Áp dụng lấy mẫu Gibbs
Lấy mẫu Gibbs
Phương pháp hợp lí cực đại biên (MML)
Mô hình Rasch
Ước lượng độ khó câu hỏi
Phương pháp nghiên cứu trong kinh doanh
Nghiên cứu trong kinh doanh
Phương pháp nghiên cứu
Lấy mẫu nghiên cứu
Xác định cỡ mẫu
Luận văn Toán học
Lý thuyết xác suất
Thống kê toán học
Xử lý mẫu
Luận văn Thạc sĩ
Xét nghiệm vi sinh lâm sàng
Tài liệu vi sinh lâm sàng
Kỹ thuật vi sinh lâm sàng
Vi sinh lâm sàng
Vật liệu lấy mẫu
Phương pháp lấy bệnh phẩm
Chuyển bệnh phẩm
Mức lọc cầu thận
Xạ hình chức năng thận
Phương pháp lấy mẫu máu
Dược chất phóng xạ
Y học hạt nhân
mẫu nước uống
tiêu chuẩn nước uống
tiêu chuẩn chất lượng
kiểm tra chất lượng
quản lý sản xuất
kinh doanh
tiếp thị
quản trị kinh doanh
quản trị sản xuất
Kỹ Thuật
Công Nghệ
Cơ khí
Chế tạo máy
Kiểm tra bằng phương pháp lấy mẫu
chất lượng không khí
hóa học môi trường
ô nhiễm không khí
phân tích môi trường
phương pháp lấy mẫu trong nghiên cứu
phân tích chất độc hại
Tiêu chuẩn Việt Nam TCVN 66052007
TCVN 66052007
Cà phê hòa tan
Phương pháp lấy mẫu bao gói cà phê
Phương pháp lấy mẫu cà phê
Tiêu chuẩn Việt Nam TCVN 44412009
TCVN 44412009
Phương pháp lấy mẫu ngẫu nhiên
TCVN 4441 1987
TÀI LIỆU MỚI ĐĂNG
Mass Transfer in Multiphase Systems and its Applications Part 19
40
256
1
29-04-2024
Posted prices versus bargaining in markets_7
23
157
0
29-04-2024
Đóng mới oto 8 chỗ ngồi part 9
10
118
0
29-04-2024
GIÁO TRÌNH VI XỬ LÝ 1 - CHƯƠNG 5. LẬP TRÌNH CHO VI ĐIỀU KHIỂN 80C51
23
107
1
29-04-2024
báo cáo hóa học:" Increased androgen receptor expression in serous carcinoma of the ovary is associated with an improved survival"
6
100
0
29-04-2024
Báo cáo nghiên cứu nông nghiệp " Biofertiliser inoculant technology for the growth of rice in Vietnam: Developing technical infrastructure for quality assurance and village production for farmers "
12
87
0
29-04-2024
Loading Data into a Database - 19
40
98
0
29-04-2024
Bảng màu theo chữ cái – V
11
101
0
29-04-2024
GYNECOLOGIC CANCERS IN PREGNANCY: GUIDELINES OF AN INTERNATIONAL CONSENSUS MEETING
12
91
0
29-04-2024
Sử dụng mô hình ARCH và GARCH để phân tích và dự báo về giá cổ phiếu trên thị trường chứng khoán
24
1023
0
29-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7866
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5765
1383
Ebook Chào con ba mẹ đã sẵn sàng
112
3770
1232
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5328
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8295
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3504
643
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10901
530
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3689
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4060
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4133
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.