Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Fast and accurate query-based multi-document summarization"
tailieunhanh - Báo cáo khoa học: "Fast and accurate query-based multi-document summarization"
We present a fast query-based multi-document summarizer called FastSum based solely on word-frequency features of clusters, documents and topics. Summary sentences are ranked by a regression SVM. The summarizer does not use any expensive NLP techniques such as parsing, tagging of names or even part of speech information. | FastSum Fast and accurate query-based multi-document summarization Frank Schilder and Ravikumar Kondadadi Research Development Thomson Corp. 610 Opperman Drive Eagan MN 55123 USA Abstract We present a fast query-based multi-document summarizer called FastSum based solely on word-frequency features of clusters documents and topics. Summary sentences are ranked by a regression SVM. The summa-rizer does not use any expensive NLP techniques such as parsing tagging of names or even part of speech information. Still the achieved accuracy is comparable to the best systems presented in recent academic competitions . Document Understanding Conference DUC . Because of a detailed feature analysis using Least Angle Regression LARS FastSum can rely on a minimal set of features leading to fast processing times 1250 news documents in 60 seconds. 1 Introduction In this paper we propose a simple method for effectively generating query-based multi-document summaries without any complex processing steps. It only involves sentence splitting filtering candidate sentences and computing the word frequencies in the documents of a cluster topic description and the topic title. We use a machine learning technique called regression SVM as proposed by Li et al. 2007 . For the feature selection we use a new model selection technique called Least Angle Regression LARS Efron et al. 2004 . Even though machine learning approaches dominated the field of summarization systems in recent DUC competitions not much effort has been spent in finding simple but effective features. Exceptions are the SumBasic system that achieves reasonable results with only one feature . word frequency in document clusters Nenkova and Vanderwende 2005 . Our approach goes beyond SumBasic by proposing an even more powerful feature that proves to be the best predictor in all three recent DUC corpora. In order to prove that our feature is more predictive than other features we provide a .
Giang Nam
62
4
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "A Fast and Accurate Method for Approximate String Search"
10
63
0
Báo cáo khoa học: "A Fast, Accurate Deterministic Parser for Chinese"
8
77
0
Báo cáo khoa học: "Fast and accurate query-based multi-document summarization"
4
57
0
Báo cáo hóa học: " Research Article Fast and Accurate Video PQoS Estimation over Wireless Networks"
10
38
0
Báo cáo y học: "IA simple, fast, and accurate method of phylogenomic inference"
1
34
0
Báo cáo hóa học: " Fast and Accurate Ground Truth Generation for Skew-Tolerance Evaluation of Page Segmentation Algorithms"
10
53
1
NIPTeR: An R package for fast and accurate trisomy prediction in non-invasive prenatal testing
5
55
1
XBSeq2: A fast and accurate quantification of differential expression and differential polyadenylation
9
59
1
ContextMap 2: Fast and accurate context-based RNA-seq mapping
15
54
1
USI: A fast and accurate approach for conceptual document annotation
10
57
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462386
61
Giới thiệu :Lập trình mã nguồn mở
14
27348
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11389
543
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10589
468
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9871
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8914
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8539
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8114
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
8079
1836
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7326
268
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Fast and accurate
multi document summarization
báo cáo khoa học
báo cáo ngôn ngữ
xử lý ngôn ngữ tự nhiên
A Fast and Accurate Method
Approximate String Search
Ziqi Wang
ngôn ngữ tự nhiên
A Fast
Accurate Deterministic
Parser for Chinese
mô hình ngôn ngữ
báo cáo hóa học
công trình nghiên cứu về hóa học
tài liệu về hóa học
cách trình bày báo cáo
trình bày báo cáo
tài liệu báo cáo khoa học
báo cáo y học
kiến thức y học
nghiên cứu y học
BMC Bioinformatics
Trisomy prediction
Next generation sequencing
Various algorithms
Non invasive prenatal testing
Predict fetal trisomies
Differential expression analysis
RNA sequencing
RNA seq
Alternative polyadenylation
Sequencing of RNA
RNA seq data analysis
Non coding transcripts
Semantic annotations
Biomedical papers
Domain ontology
Biomedical domains
Adapter trimming
Approximate string matching
Local sequence alignment
Barcode demultiplexing
Amino acid replacement rate matrices
Maximum likelihood methods
Phylogenetic trees
Protein alignments
Large data sets
Rank product statistic
Post genomic data analysis
Molecule selection
Gamma approximations
Rapid advancements
Genome sequencing
Biological systems
Computational biologists
High throughput sequencing
BMC Genomics
Multi locus sequence typing
Database preprocessing
Allele typing
MiRNA disease association
Similarity kernel
Fast kernel learning
Sparse kernel
Laplacian regularized least squares
Human diseases
Circular RNA
Circular RNA detection
Genome scaffolding
Single molecule sequencing
Genome assembly
Tree diameter
Rogue taxon removal
Gene tree discordance
Tree Shrink
Genome Biology
Assembly graph
Organelle genome
Circular organelle genomes
Whole genome sequencing data
Identity by descent
Random projection
Phased haplotypes
Segments identical
Genome alignment
Long read sequencing
RaGOO identifies structural variants
Single cell
Deep learning
Machine learning
Neural network
Sketch data structures
Genomic distance
Sequencing datasets
Cardinality estimation methods
Differential splicing
Alternative splicing
Biological variability
TÀI LIỆU MỚI ĐĂNG
Báo cáo nghiên cứu khoa học " KẾT QUẢ NGHIÊN CỨU BƯỚC ĐẦU VỀ THIÊN ĐỊCH CHÂN KHỚP TRÊN CÂY THANH TRÀ Ở THỪA THIÊN HUẾ "
7
289
4
24-01-2025
THE ANTHROPOLOGY OF ONLINE COMMUNITIES BY Samuel M.Wilson and Leighton C. Peterson
19
232
4
24-01-2025
báo cáo hóa học:" Quality of data collection in a large HIV observational clinic database in sub-Saharan Africa: implications for clinical research and audit of care"
7
164
4
24-01-2025
Báo cáo nghiên cứu khoa học " Vai trò chính quyền địa phương trong phát triển kinh tế : khu chuyên doanh gốm sứ ( Trung Quốc ) và Bát Tràng ( Việt Nam )("
11
221
1
24-01-2025
Phạm trù Chủ nghĩa cá nhân của tư tưởng phương Tây trong sự lý giải của Phan Khôi _1
9
139
0
24-01-2025
NHÀ MẠC – NAM BẮC TRIỀU (1527-1592)_1
6
130
1
24-01-2025
Cách trẻ ăn trái cây có lợi nhất
2
150
1
24-01-2025
5 lý do khiến phụ nữ không thể giảm cân
6
154
0
24-01-2025
Giáo trình nghệ thuật thông tin part 1
14
151
0
24-01-2025
Giáo trình dinh dưỡng part 10
7
120
0
24-01-2025
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8114
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
8079
1836
Ebook Chào con ba mẹ đã sẵn sàng
112
4475
1381
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6464
1285
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8914
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3886
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3934
616
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4834
568
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11389
543
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4551
490