Đang chuẩn bị liên kết để tải về tài liệu:
Sử dụng deep Neural Networks biểu diễn các thuộc tính cho bài toán phát hiện cảnh bạo lực trong video

Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ

Bài viết đề xuất sử dụng DNN để biểu diễn các thuộc tính của khái niệm bạo lực như cảnh chứa máu, vũ khí, rượt đuổi xe, đánh nhau, cảnh chết chóc được sử dụng cho bài toán phát hiện cảnh bạo lực trong video (Violent Screne Detection -VSD). | Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR 9 Cần Thơ ngày 4-5 8 2016 DOI 10.15625 vap.2016.00085 SỬ DỤNG DEEP NEURAL NETWORKS BIỂU DIỄN CÁC THUỘC TÍNH CHO BÀI TOÁN PHÁT HIỆN CẢNH BẠO LỰC TRONG VIDEO Đỗ Văn Tiến 1 Lâm Quang Vũ 2 Phan Lê Sang 3 Ngô Đức Thành 1 Lê Đình Duy 1 Dƣơng Anh Đức 1 1 Phòng Thí nghiệm Truyền thông Đa Phương tiện Trường Đại học Công nghệ Thông tin ĐHQG TP.HCM 2 Khoa Công nghệ thông tin Trường Đại học Khoa học Tự nhiên ĐHQG TP.HCM 3 Viện Tin học Quốc gia Nhật Bản NII tiendv@uit.edu.vn lqvu@fit.hcmus.edu.vn plsang@nii.ac.jp thanhnd ldduy ducda @uit.edu.vn TÓM TẮT Deep Neural Networks DNN là một thuật toán máy học trong đó sử dụng mạng neural nhân tạo Artificial Neural Networks nhiều tầng để học biểu diễn mô hình đối tượng. Với rất nhiều kết quả vượt trội so với các phương pháp trước đó DNN đang được cộng đồng nghiên cứu thế giới sử dụng trong nhiều lĩnh vực như xử lý ảnh xử lý âm thanh xử lý ngôn ngữ tự nhiên. Trong bài báo này chúng tôi đề xuất sử dụng DNN để biểu diễn các thuộc tính của khái niệm bạo lực như cảnh chứa máu vũ khí rượt đuổi xe đánh nhau cảnh chết chóc được sử dụng cho bài toán phát hiện cảnh bạo lực trong video Violent Screne Detection -VSD . Đây là bài toán có tính thực tiễn và ứng dụng cao làm tiền đề để xây dựng các công cụ phân tích và kiểm duyệt nội dung video trên các kênh thông tin đa phương tiện trước khi tới người xem. Để đánh giá phương pháp đề xuất chúng tôi xây dựng hệ thống trong đó sử dụng một số mô hình DNN phổ biến như Alexnet UvANet VGG để đánh giá độ chính xác trên tập dữ liệu chuẩn VSD1 2014. Kết quả thực nghiệm cho thấy độ chính xác khi sử dụng DNN là 48 12 cao hơn so với phương pháp tốt nhất không sử dụng DNN 13 . Bên cạnh đó bằng việc phân tích kết quả thực nghiệm chúng tôi sẽ đưa ra một số nhận xét trong việc lựa chọn thông tin từ các tầng phù hợp trong mô hình DNN cũng như cách thức biểu diễn video làm cơ sở cho các nhóm nghiên cứu có quan tâm đến .