Đang chuẩn bị liên kết để tải về tài liệu:
Collective Intelligence in Action phần 7

Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ

vì vậy chúng tôi đi trước và xây dựng các mô hình dự báo để chuẩn bị cho tương lai tốt hơn. Hướng John Jane Ed Amy Age 20 30 40 35 Giới Tính Nam Nữ Nam Nữ Số đăng nhập 5 2 3 4 Bảng 7.4 Việc dữ liệu liên quan hướng dẫn với các APIVí dụ của chúng tôi, chúng tôi thực hiện năm bước sau đây: | 232 Chapter 8 Building a text analysis toolkit Simpo PDF Merge and Split Unregistered Version - http www.simpopdf.com Listing 8.23 The interface for the EqualInverseDocFreqEstimator package com.alag.ci.textanalysis.lucene.impl import com.alag.ci.textanalysis.InverseDocFreqEstimator import com.alag.ci.textanalysis.Tag public class EqualInverseDocFreqEstimator implements InverseDocFreqEstimator public double estimateInverseDocFreq Tag tag return 1.0 _ Listing 8.24 contains the interface for TextAnalyzer the primary class to analyze text. Listing 8.24 The interface for the TextAnalyzer package com.alag.ci.textanalysis import java.io.IOException import java.util.List public interface TextAnalyzer public List Tag analyzeText String text throws IOException public TagMagnitudeVector createTagMagnitudeVector String text throws IOException The TextAnalyzer interface has two methods. The first analyzeText gives back the list of Tag objects obtained by analyzing the text. The second createTagMagnitude-Vector returns a TagMagnitudeVector representation for the text. It takes into account the term frequency and the inverse document frequency for each of the tags to compute the term vector. Listing 8.25 shows the first part of the code for the implementation of LuceneText-Analyzer which shows the constructor and the analyzeText method. Listing 8.25 The core of the LuceneTextAnalyzer class package com.alag.ci.textanalysis.lucene.impl import java.io. import java.util. import org.apache.lucene.analysis. import com.alag.ci.textanalysis. import com.alag.ci.textanalysis.termvector.impl. public class LuceneTextAnalyzer implements TextAnalyzer private TagCache tagCache null private InverseDocFreqEstimator inverseDocFreqEstimator null public LuceneTextAnalyzer TagCache tagCache InverseDocFreqEstimator inverseDocFreqEstimator this.tagCache tagCache this.inverseDocFreqEstimator inverseDocFreqEstimator Building the text analysis infrastructure 233 Simpo PDF Merge and Split Unregistered .