首頁 > 軟體

CentOS 7下安裝Coreseek中文檢索引擎

2020-06-16 17:15:19

一、Coreseek介紹:

Coreseek 是一款中文全文檢索/搜尋軟體,以GPLv2許可協定開源發布,基於Sphinx研發並獨立發布,專攻中文搜尋和資訊處理領域,適用於行業/垂直搜尋、論壇/站內搜尋、資料庫搜尋、文件/文獻檢索、資訊檢索、資料探勘等應用場景,使用者可以免費下載使用。

coreseek版本資訊:
    Coreseek 3.2 穩定版
    Coreseek 4.1 測式版
    Coreseek 5 最新版

在這裡我們使用的是 coreseek 3.2 穩定版進行演示

二、CentOS 7下安裝:

1、先安裝環境:

yum install make gcc gcc++ gcc-c++ libtool autoconf automake imake mysql-devel libxml2-devel expat-devel

註: 檢測以上軟體是否安裝,如果沒有請確保安裝;否則無法正常安裝Coreseek-3.2.14

2、開始安裝:

cd /usr/local/src     #把安裝包放到此處

wget http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gz        #下載CoreSeek,這裡注意一下,這個路徑現在暫時已經用不了(至少我寫這篇部落格的時候用不了),但是畢竟這是官網,還是要放一下的。我的網路硬碟中有該軟體 http://url.cn/2I77CON ,大家可以先下載到本地,然後再用 Filezilla 等軟體上傳到伺服器即可。

tar -zxvf coreseek-3.2.14.tar.gz

cd coreseek-3.2.14  #解壓出來的資料夾

##############安裝 mmseg #################

cd mmseg-3.2.14

./bootstrap        #輸出的warning資訊可以忽略,如果出現error則需要解決,一般不會出現錯誤

./configure --prefix=/usr/local/mmseg3  #指定 mmseg 的安裝目錄

make && make install


#############安裝 csft-3.2.14 ###############

cd /usr/local/src/csft-3.2.14

#這裡我們要修改 src/sphinxexpr.cpp 檔案,將該檔案中的 1013、1047、1080 行的 ExprEval 改為 this->ExprEval(這裡的行數跟網上的教學說的行數不一樣,可能是版本的問題吧,但是如果你用的是我提供的版本,該行數是正確的),懂點 C++ 的同學也可以自己看看 ExprEval 錯在哪裡。

#改完上面所說的問題後:
sh buildconf.sh

./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql

make && make install

在安裝的過程中,只要不提示錯誤 error,那麼其他的如 warning 資訊都是可以忽略的。

至此我們已經成功的將中文檢索引擎安裝到我們伺服器上來了。

三、測試:

cd testpack

cat var/test/test.xml   #此時應該正確顯示中文

/usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc var/test/test.xml  #整篇文章進行分詞

/usr/local/coreseek/bin/indexer -c etc/csft.conf --all  #建立索引

/usr/local/coreseek/bin/search -c etc/csft.conf 網路搜尋    #搜尋鍵碼 網路搜尋

/usr/local/coreseek/bin/searchd -c etc/csft.conf    #正常開啟搜尋服務

/usr/local/coreseek/bin/searchd -c etc/csft.conf --stop #如要停止搜尋服務

/usr/local/coreseek/bin/indexer -c etc/csft.conf --all --rotate #如要已啟動服務,要更新索引

本文永久更新連結地址http://www.linuxidc.com/Linux/2017-05/143599.htm


IT145.com E-mail:sddin#qq.com