什么是全文检索全文检索的简介(实用3篇)
【导言】此例“什么是全文检索全文检索的简介(实用3篇)”的范文资料由阿拉题库网友为您分享整理,以供您学习参考之用,希望这篇资料对您有所帮助,喜欢就复制下载支持吧!
系统检索的介绍1
评量之准则
判断检索效果的两个指标:
查全率=被检出相关信息量/相关信息总量(%)
查准率=被检出相关信息量/被检出信息总量(%)
开放源代码之全文检索系统
Apache Solr
BaseX
Clusterpoint Server(freeware licence for a single-server)
DataparkSearch
Ferret
Ht-//Dig
Hyper Estraier
KinoSearch
Lemur/Indri
Lucene
mnoGoSearch
Sphinx
Swish-e
Xapian
ElasticSearch
全文检索的简介2
基本介绍
全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息,也就是说类似于给整本书的每个字词添加一个标签,也可以进行各种统计和分析。例如,它可以很快的回答“《红楼梦》一书中“林黛玉”一共出现多少次?”的问题。
与之相关的议题
语根处理 (stemming)
符素解析器 (token parser) 1-gram, 2-gram , n-gram
断词/分词 word segmentation
倒排索引 inverted index
算法、搜寻策略之模型
布尔式 boolean
统计模型 Probabilistic model
向量空间模型 vector base model
隐性语义模型 Latent semantic model
议题优化的概念3
和中文有关的议题
断词(分词)
语法解析
古籍议题
多语言混合
优化
剔除字(Stopwords)
词性标注
权威档(authority file)
知识体系,本体论(ontology)
超链接分析(page rank)技术
历史及未来之趋势
自由语句搜寻
基于自然语言的分词