什么是全文检索全文检索的简介(实用3篇)

网友 分享 时间:

【导言】此例“什么是全文检索全文检索的简介(实用3篇)”的范文资料由阿拉题库网友为您分享整理,以供您学习参考之用,希望这篇资料对您有所帮助,喜欢就复制下载支持吧!

系统检索的介绍1

评量之准则

判断检索效果的两个指标:

查全率=被检出相关信息量/相关信息总量(%)

查准率=被检出相关信息量/被检出信息总量(%)

开放源代码之全文检索系统

Apache Solr

BaseX

Clusterpoint Server(freeware licence for a single-server)

DataparkSearch

Ferret

Ht-//Dig

Hyper Estraier

KinoSearch

Lemur/Indri

Lucene

mnoGoSearch

Sphinx

Swish-e

Xapian

ElasticSearch

全文检索的简介2

基本介绍

全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息,也就是说类似于给整本书的每个字词添加一个标签,也可以进行各种统计和分析。例如,它可以很快的回答“《红楼梦》一书中“林黛玉”一共出现多少次?”的问题。

与之相关的议题

语根处理 (stemming)

符素解析器 (token parser) 1-gram, 2-gram , n-gram

断词/分词 word segmentation

倒排索引 inverted index

算法、搜寻策略之模型

布尔式 boolean

统计模型 Probabilistic model

向量空间模型 vector base model

隐性语义模型 Latent semantic model

议题优化的概念3

和中文有关的议题

断词(分词)

语法解析

古籍议题

多语言混合

优化

剔除字(Stopwords)

词性标注

权威档(authority file)

知识体系,本体论(ontology)

超链接分析(page rank)技术

历史及未来之趋势

自由语句搜寻

基于自然语言的分词

48 1734356
");