Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Kinh Tế - Quản Lý
Luật học
Rút trích từ khóa từ văn bản pháp luật Tiếng Việt bằng thuật toán TextRank
tailieunhanh - Rút trích từ khóa từ văn bản pháp luật Tiếng Việt bằng thuật toán TextRank
Nghiên cứu này trình bày kết quả của việc rút trích từ khóa tự động từ văn bản pháp luật Tiếng Việt sử dụng thuật toán TextRank. TextRank là phương pháp rút trích từ khóa không giám sát từ văn bản dựa vào việc xếp hạng trên đồ thị. Văn bản sẽ được biểu diễn thành dạng đồ thị, với các từ là đỉnh và mối quan hệ lân cận giữa các từ là cạnh. Sau đó, các đỉnh trên đồ thị sẽ được xếp hạng dựa trên mối quan hệ với các đỉnh khác trong đồ thị. Mời các bạn cùng tham khảo! | RÚT TRÍCH TỪ KHÓA TỪ VĂN BẢN PHÁP LUẬT TIẾNG VIỆT BẰNG THUẬT TOÁN TEXTRANK Lê Thị Ngọc Thơ Khoa Công nghệ Thông tin trường Đại học Công nghệ TP. Hồ Chí Minh HUTECH TÓM TẮT Trong nghiên cứu này chúng tôi trình bày kết quả của việc rút trích từ khóa tự động từ văn bản pháp luật Tiếng Việt sử dụng thuật toán TextRank. TextRank là phương pháp rút trích từ khóa không giám sát từ văn bản dựa vào việc xếp hạng trên đồ thị. Văn bản sẽ được biểu diễn thành dạng đồ thị với các từ là đỉnh và mối quan hệ lân cận giữa các từ là cạnh. Sau đó các đỉnh trên đồ thị sẽ được xếp hạng dựa trên mối quan hệ với các đỉnh khác trong đồ thị. Các từ ở đỉnh tương ứng có trọng số cao sẽ được trích ra và kết hợp với nhau thành từ khóa. Chúng tôi thực nghiệm thuật toán TextRank trên một chương của Luật Bảo hiểm Xã hội Việt Nam. Kết quả cao nhất thu được là khi rút trích từ khóa tự động. Chúng tôi nhận thấy đặc điểm của từ khóa trong văn bản Tiếng Việt khá dài và chứa nhiều từ khác ngoài danh từ và tính từ. Do đó một phương pháp khác cần được đề xuất để cải tiến hiệu suất của việc rút trích cụm từ khóa từ văn bản pháp luật Tiếng Việt. Từ khóa Rút trích thông tin TextRank tiếng Việt từ khóa văn bản pháp luật. 1. GIỚI THIỆU Văn bản pháp luật thường được xem là dạng văn bản khó đọc vì đặc trưng vốn có nhiều thuật ngữ cụm từ và câu được viết rất chặt chẽ nhằm diễn đạt các quy định của pháp luật. Các thuật ngữ trong văn bản pháp luật thường dài và câu trong văn bản pháp luật thường tham chiếu đến nội dung ở câu khác trong cùng văn bản hoặc đến văn bản pháp luật khác. Trong nghiên cứu này chúng tôi áp dụng các phương pháp trong Xử lý Ngôn ngữ Tự nhiên XLNNTN vào văn bản pháp luật Tiếng Việt nhằm hướng tới việc hỗ trợ cho người đọc có thể nhanh chóng nắm bắt được thông tin trong văn bản pháp luật. Cụ thể là chúng tôi tiến hành rút trích từ khóa trong văn bản pháp luật tiếng Việt. Nói cách khác đề tài này nhằm mục đích tìm phương pháp trích lọc những nội dung khái quát trong một văn bản pháp luật
Thanh Hà
542
5
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Rút trích từ khóa từ văn bản pháp luật Tiếng Việt bằng thuật toán TextRank
5
70
3
Bài giảng Khai phá web - Bài 7: Trích rút thông tin
64
11
1
Phương pháp trích rút từ khóa tìm tập ứng cử trong bài toán phát hiện đạo văn
9
56
0
Tóm tắt luận văn Thạc sĩ: Nghiên cứu các phương pháp trích rút văn bản từ trang web và ứng dụng
26
105
0
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụng
49
87
1
Rút trích văn bản từ tập tin hình ảnh với Tesseract
7
78
1
Rút trích văn bản từ tập tin hình ảnh tesseract
7
119
3
Đề tài khoa học và công nghệ cấp cơ sở: Nghiên cứu xây dựng cơ sở dữ liệu từ điển bằng phương pháp trích rút từ kho ngữ liệu
37
55
3
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụng
25
72
0
Tóm tắt Luận án Tiến sĩ Ngữ văn: Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng Việt
26
41
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461887
55
Giới thiệu :Lập trình mã nguồn mở
14
22723
61
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10906
530
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10083
447
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9540
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8302
1127
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8248
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7867
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6713
253
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5795
1391
TỪ KHÓA LIÊN QUAN
Luật học
Rút trích từ khóa
Văn bản pháp luật tiếng Việt
Thuật toán TextRank
Phương pháp rút trích từ khóa
Rút trích từ khóa từ văn bản pháp luật Tiếng Việt
Trích rút từ khóa
Tập ứng cử
Phương pháp trích rút từ khóa
Bài toán phát hiện đạo văn
Độ đo tf
idf mức tài liệu
Tài liệu nghi ngờ bị sao chép
Bài giảng Xử lý ngôn ngữ tự nhiên
Xử lý ngôn ngữ tự nhiên
Natural language processing
Hệ hỏi đáp
Khai thác N Grams
Thuật toán lựa chọn từ khóa
Vòng lặp trích rút đoạn
TÀI LIỆU MỚI ĐĂNG
MySQL Basics for Visual Learners PHẦN 9
15
186
0
01-05-2024
BÀI GIẢNG VỀ - MẠCH ĐIỆN II - Chương I: Phân tích mạch trong miền thời gian
38
143
0
01-05-2024
MÔN HỌC VẬT LIỆU VÀ CÔNG NGHỆ KIM LOẠI - PHẦN I: KIM LOẠI HỌC
32
180
2
01-05-2024
Bài Tiểu Luận Chuyên Đề Tổ Chức Hoạt Động Nhận Thức Trong Dạy Học Vật Lý " Định Luật Ôm Cho Các Loại Đoạn Mạch Chứa Nguồn Điện"
10
153
3
01-05-2024
Christmas Meditations on the Twelve Holy Days
173
106
0
01-05-2024
Quy Trình Canh Tác Cây Bông Vải
8
110
0
01-05-2024
Báo cáo khoa học: " Principaux critères économiques de gestion des forêts : analyse critique et comparative"
29
89
0
01-05-2024
Báo cáo nghiên cứu khoa học " HÃY LÀM CHO HUẾ XANH HƠN VÀ ĐẸP HƠN "
6
119
0
01-05-2024
Báo cáo khoa học: "Modèle d’évolution des peuplements en futaie jardinée M Bruciamacchie"
10
78
0
01-05-2024
Giáo trình hình thành tỷ suất dinh lợi và các phương thức thanh toán nợ theo dư nợ ban đầu p3
5
91
1
01-05-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7867
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5795
1391
Ebook Chào con ba mẹ đã sẵn sàng
112
3772
1233
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5334
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8302
1127
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3518
644
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10906
530
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3695
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4071
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4136
480
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.