tailieunhanh - Sử dụng kỹ thuật khai phá dữ liệu phần mềm độc hại từ mã lệnh
Trong bài báo này, phân tích các kỹ thuật khai phá dữ liệu mà chúng tôi đã áp dụng thành công cho an ninh mạng. Nghiên cứu này tập trung vào việc sử dụng các phương pháp khai phá dữ liệu để phát hiện phần mềm độc hại (các chương trình độc hại) và đề xuất một giải pháp nhằm thay thế cho các phương pháp phát hiện dựa trên chữ ký truyền thống. Các ứng dụng này bao gồm phát hiện mã độc hại bằng cách khai thác các mã nhị phân dựa trên phát hiện sự bất thường, và khai thác luồng dữ liệu. | Sử dụng kỹ thuật khai phá dữ liệu phần mềm độc hại từ mã lệnh Nghiên cứu khoa học công nghệ Sö dông kü thuËt khai ph¸ d÷ liÖu phÇn mÒm ®éc h¹i tõ m· lÖnh HOÀNG SỸ TƯƠNG*, TRẦN THỊ LAN ANH** Tóm tắt: Trong bài báo này, chúng tôi phân tích các kỹ thuật khai phá dữ liệu mà chúng tôi đã áp dụng thành công cho an ninh mạng. Nghiên cứu này tập trung vào việc sử dụng các phương pháp khai phá dữ liệu để phát hiện phần mềm độc hại (các chương trình độc hại) và đề xuất một giải pháp nhằm thay thế cho các phương pháp phát hiện dựa trên chữ ký truyền thống. Các ứng dụng này bao gồm phát hiện mã độc hại bằng cách khai thác các mã nhị phân dựa trên phát hiện sự bất thường, và khai thác luồng dữ liệu. So sánh với phương pháp phát hiện mã độc dựa trên chữ ký truyền thống, phương pháp đề xuất của chúng tôi có tốc độ phát hiện mã độc nhanh gấp đôi. Từ khóa: Khai phá dữ liệu, Phát hiện mã độc, Phân tích tĩnh, Phát hiện tuần tự, Đặc trưng dữ liệu, Phòng chống virus. 1. GIỚI THIỆU Phát hiện virus máy tính đã phát triển thành chương trình phát hiện mã độc hại từ khi Cohen đưa ra thuật ngữ virus máy tính lần đầu tiên vào năm 1983 [3]. Các chương trình độc hại có thể được phân loại thành các loại phần mềm độc hại như sau: virus, worm, trojan, spyware, adware và các lớp con mã độc hại khác [4]. Một trong những vấn đề chính mà cộng đồng những người nghiên cứu về virus phải đối mặt đó là tìm ra được các phương pháp phát hiện các chương trình độc hại mới các mã độc chưa được phân tích [1]. Công nghệ quét virus hiện nay có hai phần: một là bộ phát hiện dựa trên chữ ký và hai là bộ phân loại phỏng đoán (heuristic) có thể phát hiện được các virus mới [2]. Khai phá dữ liệu đề cập đến việc trích rút hoặc 'khai phá' các tri thức cần thiết từ một lượng lớn dữ liệu [5]. Nó cung cấp một cách thức trích rút thông tin được dự đoán và chưa biết trước đó dựa trên dữ liệu có thể truy cập được trong các kho dữ liệu. Các phương pháp khai phá dữ liệu .
đang nạp các trang xem trước