雑多に技術メモと他色々

主に自分用な技術メモが多くなる気がする。他色々が書かれるかどうかは不明。

WindowsのWSL(Ubuntu)環境にElasticSearchの日本語検索環境を整える

ElasticSearch使うことになったので。
とりあえずJavaがあればWindows環境でもインストールはかけられるが、
せっかくだしWSLのUbuntuにインストールして環境整える。

環境

  • Windows10 Professional
  • 上記にインストールしたWSLのUbuntu 18.04 LTS(2020/04時点)
  • ElasticSearch 7.x(2020/04時点の最新がインストールできるように)

ElasticSearchをインストールする

特にコマンド毎に明記してないが、全部root権限で叩く前提。

apt-getのバージョンアップ

apt-get udpate

とりあえずやっておかないとjdkが入らない。

jdkのインストール

apt install openjdk-11-jdk

ElasticSearchを動作させるのに必須。とりあえず11で。

ElasticSearchのインストール

wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | apt-key add -
echo "deb https://artifacts.elastic.co/packages/7.x/apt stable main" | tee -a /etc/apt/sources.list.d/elastic-7.x.list
apt update
apt install elasticsearch

日本語検索用のElasticSearchプラグイン

Japanese (kuromoji) Analysis Pluginのインストール
# インストール
/usr/share/elasticsearch/bin/elasticsearch-plugin install analysis-kuromoji
# 確認
/usr/share/elasticsearch/bin/elasticsearch-plugin list

日本語を形態素解析して全文検索するのに必要。入れない場合はN-gramで検索処理を行うことになる。
それなりに意味のある単語レベルで検索を引っ掛けたい場合は必須。

ICU Analysis Pluginのインストール
# インストール
/usr/share/elasticsearch/bin/elasticsearch-plugin install analysis-icu
# 確認
/usr/share/elasticsearch/bin/elasticsearch-plugin list

全角-半角の同一化検索など、トークンを正規化して検索するのに利用する。

ElasticSearch設定

以降はあとで続き書く。。。

ElasticSearch起動

ElasticSearchの基本的な動作確認をしてみる