Apache Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。Apache Solr是一个独立的企业级搜索应用服务器,目前很多企业使用solr开源服务。原理大致是文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。
Apache Solr最新的版本是5.4.1,Ubuntu 15.10 ,12.04上安装的步骤如下:
1.下载Apache Solr 5.4.1
1 2 3 |
$cd ~ $wget http://apache.opencas.org/lucene/solr/5.4.1/solr-5.4.1.tgz |
2.解压缩服务安装脚本
1 |
$tar -zxvf solr-5.4.1.tgz solr-5.4.1/bin/install_solr_service.sh --strip-components=2 |
3.执行安装脚本
1 |
$sudo bash ./install_solr_service.sh solr-5.4.1.tgz |
4.检查服务是否正确安装
1 |
$sudo service solr status |
如果正确安装,会出现如下的提示信息:
1 2 3 4 5 |
● solr.service - LSB: Controls Apache Solr as a Service Loaded: loaded (/etc/init.d/solr) Active: active (exited) since 日 2016-01-24 20:51:13 CST; 22s ago Docs: man:systemd-sysv-generator(8) Process: 5035 ExecStart=/etc/init.d/solr start (code=exited, status=0/SUCCESS) |
4.创建Solr实例,可以创建多个实例,在这里我们只创建一个
1 |
$sudo su - solr -c "/opt/solr/bin/solr create -c solr_default -n data_driven_schema_configs" |
请注意实例的结果输出:
1 2 3 4 5 6 7 8 9 10 11 |
Copying configuration to new core instance directory: /var/solr/data/solr_default Creating new core 'solr_default' using command: http://localhost:8983/solr/admin/cores?action=CREATE&name=solr_default&instanceDir=solr_default { "responseHeader":{ "status":0, "QTime":754}, "core":"solr_default"} |
这意味着,访问实例的URL链接为http://localhost:8983/solr,而不是默认的8080端口,一般如果8080端口被Tomcat7占据的情况下,Apache Solr作为一个服务独立安装的时候,会随机选择一个没有占有的端口,注意这个情况。
4.配置刚刚创建的Solr实例
如上图,选择"Core Selector"
可以这这个页面中"Document Type"下拉框用来选择提交,文件,XML,JSON等等,"Submit Document"按钮,可以提交需要分析的内容。