Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Giới thiệu
Đăng ký
Đăng nhập
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
Giới thiệu
Đăng ký
Đăng nhập
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Generating statistical language models from interpretation grammars in dialogue systems"
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: "Generating statistical language models from interpretation grammars in dialogue systems"
Thanh Hà
87
8
pdf
Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
In this paper, we explore statistical language modelling for a speech-enabled MP3 player application by generating a corpus from the interpretation grammar written for the application with the Grammatical Framework (GF) (Ranta, 2004). We create a statistical language model (SLM) directly from our interpretation grammar and compare recognition performance of this model against a speech recognition grammar compiled from the same GF interpretation grammar. The results show a relative Word Error Rate (WER) reduction of 37% for the SLM derived from the interpretation grammar while maintaining a low in-grammar WER comparable to that associated with the speech recognition grammar | Generating statistical language models from interpretation grammars in dialogue systems Rebecca Jonson Dept. of Linguistics Goteborg University and GSLT rj@ling.gu.se Abstract In this paper we explore statistical language modelling for a speech-enabled MP3 player application by generating a corpus from the interpretation grammar written for the application with the Grammatical Framework GF Ranta 2004 . We create a statistical language model SLM directly from our interpretation grammar and compare recognition performance of this model against a speech recognition grammar compiled from the same GF interpretation grammar. The results show a relative Word Error Rate WER reduction of 37 for the SLM derived from the interpretation grammar while maintaining a low in-grammar WER comparable to that associated with the speech recognition grammar. From this starting point we try to improve our artificially generated model by interpolating it with different corpora achieving great reduction in perplexity and 8 relative recognition improvement. 1 Introduction Ideally when building spoken dialogue systems we would like to use a corpus of transcribed dialogues corresponding to the specific task of the dialogue system in order to build a statistical language model SLM . However it is rarely the case that such a corpus exists in the early stage of the development of a dialogue system. Collecting such a corpus and transcribing it is very timeconsuming and delays the building of the actual dialogue system. An approach taken both in dialogue systems and dictation applications is to first write an interpretation grammar and from that generate an artificial corpus which is used as training corpus for the SLM Raux et al 2003 Pakhomov et al 2001 Fosler-Lussier Kuo 2001 . These models obtained from grammars are not as good as the ones built from real data as the estimates are artificial lacking a real distribution. However it is a quick way to get a dialogue system working with an SLM. .
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "A Class-Based Agreement Model for Generating Accurately Inflected Translations"
Báo cáo khoa học: "Generating Focused Topic-specific Sentiment Lexicons"
Báo cáo khoa học: "Generating Templates of Entity Summaries with an Entity-Aspect Model and Pattern Mining"
Báo cáo khoa học: "Generating image descriptions using dependency relational patterns"
Báo cáo khoa học: "Generating Fine-Grained Reviews of Songs From Album Reviews"
Báo cáo khoa học: "Automatically Generating Term-frequency-induced Taxonomies"
Báo cáo khoa học: "Generating Entailment Rules from FrameNet"
Báo cáo khoa học: "Automatically generating annotator rationales to improve sentiment classification"
Báo cáo khoa học: "Automatically Generating Wikipedia Articles: A Structure-Aware Approach"
Báo cáo khoa học: "In-Browser Summarisation: Generating Elaborative Summaries Biased Towards the Reading Context"
crossorigin="anonymous">
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.