Trong bài này, chúng tôi giới thiệu một phương pháp mới phát hiện những ảnh khiêu dâm dựa trên sự kết hợp giữa phương pháp biểu diễn ảnh bằng các nét đặc trưng không đổi với những biến đổi tỉ lệ (Scale-invariant feature transform – SIFT), mô hình túi từ trực quan (the bag-of-visual-words (BoVW) và giải thuật ArcX4 của Bayes thơ ngây ngẫu nhiên (the Arcx4 of random multinomial naive Bayes ( Arcx4-rMNB)). Ở bước tiền xử lý, chúng tôi sử dụng phương pháp biểu diễn ảnh bằng các nét đặc trưng không đổi được thực hiện dựa trên đặc trưng cục bộ, không bị thay. | Tạp chí Khoa học Trường Đại học Cần Thơ Phần A Khoa học Tự nhiên Công nghệ và Môi trường 25 2013 13-21 Tạp chí Khoa học - Đại học Cần Thơ website sj. ctu. edu. vn KHOAHOC LỌC ẢNH VỚI MÔ HÌNH TÚI TỪ TRỰC QUAN VÀ THUẬT TOÁN ARCX4-RMNB Nguyễn Minh Trung1 Nguyễn Ngọc Hưng2 và Đỗ Thanh Nghị3 1 Bộ môn Tin học Ứng dụng Khoa Khoa học Tự nhiên Trường Đại học Cần Thơ 2 Trường Cao đẳng Cộng đồng Sóc Trăng 3 Khoa Công nghệ Thông tin và Truyền thông Trường Đại học Cần Thơ Thông tin chung Ngày nhận 14 09 2012 Ngày chấp nhận 25 03 2013 Title Images Filtering With Bag-of-Visual-Words andArcX4- Rmnb Từ khóa SIFT BoVW Arcx4-rMNB SVM Keywords SIFT BoVW Arcx4-rMNB SVM ABSTRACT In this paper we paper presents a novel approach to detect pornographic images based on the combination of the Scale-invariant feature transform method SIFT the bag-of-visual-words BoVW and the Arcx4 of random multinomial naive Bayes Arcx4-rMNB . At the preprocessing step we propose to use the Scale-invariant feature transform method SIFT which is locally based on the appearance of the object at particular interest points invariant to image scale rotation and also robust to changes in illumination noise occlusion. And then the representation of the image that we use for classification is the bag-of-visual-words BoVW which is constructed from the local descriptors and the counting of the occurrence of visual words in a histogram like fashion. The pre-processing step brings out datasets with a very large num-ber of dimensions. And then we propose a new algorithm called Arcx4 of random multinomial naive Bayes Arcx4-rMNB that is suited for classifying very-high-dimensional datasets. We do setup experiment with two real datasets to evaluate performances. Our approach has achieved an accuracy of for a small dataset and for other large one. TÓM TẮT Trong bài này chúng tôi giới thiệu một phương pháp mới phát hiện những ảnh khiêu dâm dựa trên sự kết hợp giữa phương pháp biểu diên ảnh bằng các nét .