Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Nông - Lâm - Ngư
Lâm nghiệp
Phương pháp lấy mẫu thuộc tính mới trong rừng ngẫu nhiên cho phân tích dữ liệu SNP
tailieunhanh - Phương pháp lấy mẫu thuộc tính mới trong rừng ngẫu nhiên cho phân tích dữ liệu SNP
Trong bài báo này đề xuất một phương pháp lấy mẫu hai bước để lựa chọn các đặc trưng có ý nghĩa trong việc huấn luyện mô hình rừng ngẫu nhiên. Phương pháp này cho phép chọn ra một tập nhỏ các đặc trưng có liên hệ chặt chẽ với biến đích (bệnh), do đó làm giảm số chiều và có thể xử lý tốt trên các tập dữ liệu có số chiều cao. Mời bạn đọc tham khảo. | J. Sci. Devel. 2015 Vol. 13 No. 2 301-307 Tạp chí Khoa học và Phát triển 2015 tập 13 số 2 301-307 PHƯƠNG PHÁP LẤY MẪU THUỘC TÍNH MỚI TRONG RỪNG NGẪU NHIÊN CHO PHÂN TÍCH DỮ LIỆU SNP Nguyễn Văn Hoàng Phan Thị Thu Hồng Nguyễn Thanh Tùng Nguyễn Thị Thủy Khoa Công nghệ thông tin Học viện Nông nghiệp Việt Nam Email nvhoang@ Ngày gửi bài Ngày chấp nhận TÓM TẮT Gần đây các nghiên cứu liên kết mức toàn hệ gen GWAS đã đạt được thành công trong việc xác định một số biến thể di truyền có ảnh hưởng tương đối lớn tới một số bệnh phức tạp. Hầu hết các GWAS sử dụng các tiếp cận đơn SNP đa hình đơn nucleotide chỉ tập trung vào việc đánh giá sự liên hệ giữa từng SNP riêng biệt với bệnh. Tuy nhiên trên thực tế các bệnh phức tạp được cho là liên quan tới những nguyên nhân phức tạp bao gồm những tương tác rắc rối giữa nhiều SNPs. Do đó cần có những cách tiếp cận khác để xác định sự ảnh hưởng của các SNP hoặc những tương tác phức tạp của các SNP tới bệnh. Phương pháp rừng ngẫu nhiên Random Forest RF gần đây đã được ứng dụng thành công trong GWAS cho việc xác định một số nhân tố di truyền có ảnh hưởng lớn tới một số bệnh phức tạp. Mặc dù RF xử lý tốt trên khía cạnh chính xác dự đoán trên một số tập dữ liệu có kích cỡ trung bình nhưng mô hình RF truyền thống có nhiều hạn chế trong việc xác định các SNPs có ý nghĩa và xây dựng các mô hình dự đoán chính xác. Trong bài báo này chúng tôi đề xuất một phương pháp lấy mẫu hai bước để lựa chọn các đặc trưng có ý nghĩa trong việc huấn luyện mô hình rừng ngẫu nhiên. Phương pháp này cho phép chọn ra một tập nhỏ các đặc trưng có liên hệ chặt chẽ với biến đích bệnh do đó làm giảm số chiều và có thể xử lý tốt trên các tập dữ liệu có số chiều cao. Chúng tôi cũng tiến hành các thực nghiệm trên hai tập dữ liệu chuẩn SNP ở mức toàn bộ hệ gen để làm sáng tỏ hiệu quả của phương pháp đề xuất. Từ khóa Genome-wide Association Study học máy khai phá dữ liệu rừng ngẫu nhiên A New Feature Sampling Method in Learning
Thảo Quyên
89
7
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Phân tích dữ liệu và ứng dụng phân tích dữ liệu cho doanh nghiệp
8
21
1
Bài giảng Phân tích và xử lý dữ liệu với R: Bài thực hành 3 - Học viện Ngân hàng
12
205
2
Công cụ ứng dụng phân tích dữ liệu cho doanh nghiệp
10
20
1
Bài giảng Tin học ứng dụng phân tích dữ liệu nghiên cứu với SPSS - Bài 6: Phân tích dữ liệu
91
171
2
Bài giảng Phân tích dữ liệu nghiên cứu: Chủ đề 1 - Lê Kim Long và Phạm Thành Thái
31
127
1
Bài giảng Giới thiệu sơ lược phân tích dữ liệu với SPSS - TS. Lê Văn Huy
40
148
4
Bài giảng Phân tích dữ liệu nghiên cứu với SPSS
55
157
5
Bài giảng Phương pháp phân tích dữ liệu
63
146
2
Bài giảng Phân tích dữ liệu
60
193
4
Bài giảng Thống kê và phân tích dữ liệu - Lê Kim Long và Phạm Thành Thái
10
180
2
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462343
61
Giới thiệu :Lập trình mã nguồn mở
14
26098
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11349
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10553
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9844
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8891
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8507
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8101
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7758
1792
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7273
268
TỪ KHÓA LIÊN QUAN
Lâm nghiệp
Phân tích dữ liệu SNP
Genome wide Association Study
Khai phá dữ liệu
Rừng ngẫu nhiên
Dữ liệu SNP
Phương pháp lấy mẫu
Cách lấy mẫu
Kỹ thuật lấy mẫu
Khung lấy mẫu
Các kỹ thuật lấy mẫu
Bí quyết lấy mẫu
Phương pháp lấy mẫu nước
Mẫu tổ hợp
Thiết bị lấy mẫu
Bảo quản mẫu
Bình chứa mẫu
Thực hành lấy mẫu
Bài giảng Phương pháp nghiên cứu khoa học
Phương pháp nghiên cứu khoa học
Phương pháp lấy mẫu xác suất
Sơ đồ lấy mẫu xác suất
Danh sách dân số
Phát triển phương pháp lấy mẫu thụ động POCIS
Phương pháp lấy mẫu thụ động POCIS
Hợp chất bảo vệ thực vật phân cực
Nước bề mặt
Nồng độ dư lượng
Bài giảng Phân tích thực phẩm
Phân tích thực phẩm
Phương pháp lấy mẫu thực phẩm
Mẫu thử trung bình
Lô hàng đồng nhất
Tiêu chuẩn lấy mẫu
Bài giảng Thống kê và phân tích dữ liệu
Thống kê dữ liệu
Phân tích dữ liệu
Phân phối mẫu
Lấy mẫu ngẫu nhiên đơn giản
Phương pháp định lượng chính sách
Phương pháp phân tích định lượng
Bài giảng Phương pháp phân tích định lượng
Chính sách công
Phương pháp polynomial chaos
Hệ thống treo trên ô tô
Phương pháp PC
Phương pháp Monte Carlo
Chuẩn mực kiểm toán
Hệ thống chuẩn mực kiểm toán Việt Nam
Lấy mẫu kiểm toán
Chuẩn mực kiểm toán số 530
Phương pháp lấy mẫu kiểm toán
Lựa chọn mẫu kiểm toán
Bài giảng Kiểm toán
Kiểm toán
Quy trình lấy mẫu kiểm toán
Phương pháp chọn mẫu phi thống kê
Dự tính sai phạm
Kỹ thuật lấy mẫu phi xác suất
Thiết kế mẫu
Phương pháp chọn mẫu
Bài giảng kinh tế học
Tài liệu kinh tế học
Mẫu sinh thiết thận
Phương pháp lấy mẫu sinh thiết thận
Bệnh ở thận
Thận bình thường
Đặc điểm thận ghép
Mẫu sinh thiết thận ghéo
Tiêu chuẩn Việt Nam
Tiêu chuẩn Quốc gia
Sản phẩm dầu mỏ
Tiêu chuẩn dầu mỏ
Phương pháp lấy mẫu dầu mỏ
Lấy mẫu dầu mỏ
Lấy mẫu thủ công dầu mỏ
Lấy mẫu cà phê nhân
Cà phê nhân
Quy trình lấy mẫu cà phê nhân
Phương pháp lấy mẫu cà phê nhân
Áp dụng lấy mẫu Gibbs
Lấy mẫu Gibbs
Phương pháp hợp lí cực đại biên (MML)
Mô hình Rasch
Ước lượng độ khó câu hỏi
Phương pháp nghiên cứu trong kinh doanh
Nghiên cứu trong kinh doanh
Phương pháp nghiên cứu
Lấy mẫu nghiên cứu
Xác định cỡ mẫu
Luận văn Toán học
Lý thuyết xác suất
Thống kê toán học
Xử lý mẫu
Luận văn Thạc sĩ
Xét nghiệm vi sinh lâm sàng
Tài liệu vi sinh lâm sàng
Kỹ thuật vi sinh lâm sàng
Vi sinh lâm sàng
Vật liệu lấy mẫu
Phương pháp lấy bệnh phẩm
Chuyển bệnh phẩm
mẫu nước uống
tiêu chuẩn nước uống
tiêu chuẩn chất lượng
kiểm tra chất lượng
Mức lọc cầu thận
Xạ hình chức năng thận
Phương pháp lấy mẫu máu
Dược chất phóng xạ
Y học hạt nhân
quản lý sản xuất
kinh doanh
tiếp thị
quản trị kinh doanh
quản trị sản xuất
Kỹ Thuật
Công Nghệ
Cơ khí
Chế tạo máy
Kiểm tra bằng phương pháp lấy mẫu
chất lượng không khí
hóa học môi trường
ô nhiễm không khí
phân tích môi trường
phương pháp lấy mẫu trong nghiên cứu
phân tích chất độc hại
Tiêu chuẩn Việt Nam TCVN 66052007
TCVN 66052007
Cà phê hòa tan
Phương pháp lấy mẫu bao gói cà phê
Phương pháp lấy mẫu cà phê
Tiêu chuẩn Việt Nam TCVN 44412009
TCVN 44412009
Phương pháp lấy mẫu ngẫu nhiên
TCVN 4441 1987
TÀI LIỆU MỚI ĐĂNG
B2B Content Marketing: 2012 Benchmarks, Budgets & Trends
17
229
3
28-12-2024
báo cáo hóa học:" Increased androgen receptor expression in serous carcinoma of the ovary is associated with an improved survival"
6
156
3
28-12-2024
Giáo trình phân tích phương trình vi phân viết dưới dạng thuật toán đặc tính của hệ thống p1
5
164
1
28-12-2024
Quy Trình Canh Tác Cây Bông Vải
8
164
3
28-12-2024
báo cáo hóa học:" Perceptions of rewards among volunteer caregivers of people living with AIDS working in faith-based organizations in South Africa: a qualitative study"
10
157
1
28-12-2024
báo cáo hóa học:" Quality of data collection in a large HIV observational clinic database in sub-Saharan Africa: implications for clinical research and audit of care"
7
154
4
28-12-2024
Giáo án điện tử tiểu học môn lịch sử: Cách mạng mùa thu
39
165
1
28-12-2024
ETHICAL CODE HANDBOOK: Demonstrate your commitment to high standards
7
148
1
28-12-2024
Bệnh sán lá gan trên gia súc và cách phòng trị
3
162
1
28-12-2024
Lập trình Java cơ bản : Luồng và xử lý file part 8
5
141
1
28-12-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8101
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7758
1792
Ebook Chào con ba mẹ đã sẵn sàng
112
4409
1371
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6293
1266
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8891
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3843
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3920
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4718
565
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11349
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4510
490