Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Fast and accurate query-based multi-document summarization"
tailieunhanh - Báo cáo khoa học: "Fast and accurate query-based multi-document summarization"
We present a fast query-based multi-document summarizer called FastSum based solely on word-frequency features of clusters, documents and topics. Summary sentences are ranked by a regression SVM. The summarizer does not use any expensive NLP techniques such as parsing, tagging of names or even part of speech information. | FastSum Fast and accurate query-based multi-document summarization Frank Schilder and Ravikumar Kondadadi Research Development Thomson Corp. 610 Opperman Drive Eagan MN 55123 USA Abstract We present a fast query-based multi-document summarizer called FastSum based solely on word-frequency features of clusters documents and topics. Summary sentences are ranked by a regression SVM. The summa-rizer does not use any expensive NLP techniques such as parsing tagging of names or even part of speech information. Still the achieved accuracy is comparable to the best systems presented in recent academic competitions . Document Understanding Conference DUC . Because of a detailed feature analysis using Least Angle Regression LARS FastSum can rely on a minimal set of features leading to fast processing times 1250 news documents in 60 seconds. 1 Introduction In this paper we propose a simple method for effectively generating query-based multi-document summaries without any complex processing steps. It only involves sentence splitting filtering candidate sentences and computing the word frequencies in the documents of a cluster topic description and the topic title. We use a machine learning technique called regression SVM as proposed by Li et al. 2007 . For the feature selection we use a new model selection technique called Least Angle Regression LARS Efron et al. 2004 . Even though machine learning approaches dominated the field of summarization systems in recent DUC competitions not much effort has been spent in finding simple but effective features. Exceptions are the SumBasic system that achieves reasonable results with only one feature . word frequency in document clusters Nenkova and Vanderwende 2005 . Our approach goes beyond SumBasic by proposing an even more powerful feature that proves to be the best predictor in all three recent DUC corpora. In order to prove that our feature is more predictive than other features we provide a .
Giang Nam
59
4
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "A Fast and Accurate Method for Approximate String Search"
10
63
0
Báo cáo khoa học: "A Fast, Accurate Deterministic Parser for Chinese"
8
77
0
Báo cáo khoa học: "Fast and accurate query-based multi-document summarization"
4
57
0
Báo cáo hóa học: " Research Article Fast and Accurate Video PQoS Estimation over Wireless Networks"
10
38
0
Báo cáo y học: "IA simple, fast, and accurate method of phylogenomic inference"
1
34
0
Báo cáo hóa học: " Fast and Accurate Ground Truth Generation for Skew-Tolerance Evaluation of Page Segmentation Algorithms"
10
53
1
NIPTeR: An R package for fast and accurate trisomy prediction in non-invasive prenatal testing
5
55
1
XBSeq2: A fast and accurate quantification of differential expression and differential polyadenylation
9
59
1
ContextMap 2: Fast and accurate context-based RNA-seq mapping
15
54
1
USI: A fast and accurate approach for conceptual document annotation
10
57
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462336
61
Giới thiệu :Lập trình mã nguồn mở
14
25946
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11336
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10544
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9836
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8885
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8500
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8098
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7710
1789
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7243
268
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Fast and accurate
multi document summarization
báo cáo khoa học
báo cáo ngôn ngữ
xử lý ngôn ngữ tự nhiên
A Fast and Accurate Method
Approximate String Search
Ziqi Wang
ngôn ngữ tự nhiên
A Fast
Accurate Deterministic
Parser for Chinese
mô hình ngôn ngữ
báo cáo hóa học
công trình nghiên cứu về hóa học
tài liệu về hóa học
cách trình bày báo cáo
trình bày báo cáo
tài liệu báo cáo khoa học
báo cáo y học
kiến thức y học
nghiên cứu y học
BMC Bioinformatics
Trisomy prediction
Next generation sequencing
Various algorithms
Non invasive prenatal testing
Predict fetal trisomies
Differential expression analysis
RNA sequencing
RNA seq
Alternative polyadenylation
Sequencing of RNA
RNA seq data analysis
Non coding transcripts
Semantic annotations
Biomedical papers
Domain ontology
Biomedical domains
Adapter trimming
Approximate string matching
Local sequence alignment
Barcode demultiplexing
Amino acid replacement rate matrices
Maximum likelihood methods
Phylogenetic trees
Protein alignments
Large data sets
Rank product statistic
Post genomic data analysis
Molecule selection
Gamma approximations
Rapid advancements
Genome sequencing
Biological systems
Computational biologists
High throughput sequencing
BMC Genomics
Multi locus sequence typing
Database preprocessing
Allele typing
MiRNA disease association
Similarity kernel
Fast kernel learning
Sparse kernel
Laplacian regularized least squares
Human diseases
Circular RNA
Circular RNA detection
Genome scaffolding
Single molecule sequencing
Genome assembly
Tree diameter
Rogue taxon removal
Gene tree discordance
Tree Shrink
Genome Biology
Assembly graph
Organelle genome
Circular organelle genomes
Whole genome sequencing data
Identity by descent
Random projection
Phased haplotypes
Segments identical
Genome alignment
Long read sequencing
RaGOO identifies structural variants
Single cell
Deep learning
Machine learning
Neural network
Sketch data structures
Genomic distance
Sequencing datasets
Cardinality estimation methods
Differential splicing
Alternative splicing
Biological variability
TÀI LIỆU MỚI ĐĂNG
Hướng dẫn chế độ dinh dưỡng cho người bệnh viêm khớp
5
167
2
24-12-2024
Báo cáo nghiên cứu khoa học " NÂNG QUAN HỆ KINH TẾ THƯƠNG MẠI VIỆT NAM - TRUNG QUỐC LÊN TẦM CAO THỜI ĐẠI "
8
171
1
24-12-2024
Báo cáo nghiên cứu khoa học " Đại hội XVI thông qua điều lệ Đảng cộng sản Trung Quốc những sửa đổi bổ sung mới "
4
161
1
24-12-2024
Báo cáo nghiên cứu khoa học " Sự nhất quán phát triển kinh tế thị trường XHCN trong xây dựng xã hội hài hoà của Trung Quốc và đổi mới của Việt Nam "
8
144
1
24-12-2024
Sáng kiến kinh nghiệm môn mỹ thuật
5
171
1
24-12-2024
Sinh thái học nông nghiệp : Sinh thái học và sự phát triển Nông nghiệp part 8
8
135
0
24-12-2024
English Grammar Tests-Elementary Level's archiveReal Life: Accessories and Clothing (1)
8
120
0
24-12-2024
NGUYÊN NHÂN HÌNH THÀNH VÀ VẮN HÓA XÃ HỘI NGUYÊN THỦY_1
8
147
1
24-12-2024
Báo cáo lâm nghiệp: "Les facteurs de productivité du Pin noir d’Autriche (Pinus nigra Arnold. ssp. nigricans Host. austriaca Hoss. Novak) dans les Alpes du Sud"
17
109
0
24-12-2024
Giáo trình nghệ thuật thông tin part 1
14
147
0
24-12-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8098
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7710
1789
Ebook Chào con ba mẹ đã sẵn sàng
112
4406
1371
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6275
1266
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8885
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3836
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3918
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4703
565
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11336
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4502
490