사이띄개를 기초로 한 서양권 언어에서 사용되는 단어 분리기나, 중국어에 사용되는 N-Gram을 기초로 한 단어 분리기는 한글 텍스트를 제대로 처리하지 못합니다.

따라서 Recoll 버전 1.27은 한글 텍스트를 적절한 용어들로 분리하기 위해 외부 텍스트 분석기를 지원합니다.

초기에는 한국어에 대한 여러 형태소 분석기 (한나눔, 꼬꼬마, Komoran, Mecab, 트위터/Okt)를 지원하는 KoNLPy 파이썬 패키지를 기초로하여 구현하였습니다.

어떤 친절한 한국인 Recoll 사용자와 함께 한 실험에서 성능과 품질을 가장 최고치로 보여준 Mecab-ko 패키지를 선택하는 것으로 결론내렸습니다.

현재 Recoll 구현은 다른 분석기를 실험할 경우를 위하여 KoNLPy로 작업할 수 있는 기능도 유지해두었지만, 현재 기본 설정은 python-mecab-ko를 사용하는 것입니다. 이 python-mecab-ko는 mecab-ko와 직접 상호작용하며, KoNLPy에 대한 여러 의존성을 피합니다.

그러나 그 필수적인 모듈(mecab-ko)은 Recoll 기본 설치에 포함되지 않습니다. 한국어 지원을 위한 설치 과정은 운영체제마다 다르며, <리눅스>와 <윈도우>에 대하여는 아래에 추가로 설명해두었습니다.

윈도우에서 Mecab-ko와 python-mecab-ko 설치

Recoll 1.27.0 버전의 윈도우 에디션에서는 python-mecab-ko가 탑재되었습니다. 그러므로 Mecab-ko 패지키와 사전들을 설치하기만 하면 됩니다. 감사하게도, 누군가가 당신을 위해 패키지들을 만들어두었습니다.

시행과정

  • 다운받은 zip파일 모두를 `C:\Mecab`에 해제하십시오. 현재 이 경로는 반드시 지켜주셔야 합니다. 경로를 수정할 수 있을지에 관하여는 추후에 살펴보겠습니다.

  • 메모장 등 편집 프로그램을 사용하여 Recoll 색인 구성 파일을 여십시오 (기본적으로 'C:\Users\[나의 계정]\Appdata\Local\Recoll\recoll.conf에 위치해있습니다'). 그리고 다음 항목을 추가하십시오:

hangultagger = Mecab
  • 색인을 재구축 하십시오.

리눅스에서 Mecab-ko와 python-mecab-ko 설치

여기서 안내하는 설치방법은 Mecab을 '/usr/local’에 설치합니다. '/usr’로 대신 설치하기 위해서는 '--prefix=/usr' 인수를 'configure' 명령에 사용하십시오.

  • Mecab-ko를 빌드하기 위해 폴더를 만듭니다 :

cd
mkdir mecab
cd mecab
  • Mecab-ko 소프트웨어를 가져오고, 압축 해제하고, 빌드하고, 설치합니다 :

wget https://bitbucket.org/eunjeon/mecab-ko/downloads/mecab-0.996-ko-0.9.1.tar.gz
tar xvzf mecab-0.996-ko-0.9.1.tar.gz
cd mecab-0.996-ko-0.9.1
./configure
make
make check
sudo make install
  • Mecab-ko 사전을 가져오고, 압축 해제하고, 빌드합니다.

cd ..    # 이 명령의 결과로 mecab의 최상위 폴더에 도착해있습니다.
wget https://bitbucket.org/eunjeon/mecab-ko-dic/downloads/mecab-ko-dic-1.6.1-20140814.tar.gz
tar xvzf mecab-ko-dic-1.6.1-20140814.tar.gz
cd mecab-ko-dic-1.6.1-20140814
./configure
# 만일 automake 파일 버전에 관련한 오류가 발생한다면,
# 부트스트랩을 다시 구성하고 configure를 다시 실행하십시오.
# 이 때, autoconf와 automake가 설치되어있어야 합니다.
# sh autogen.sh
# ./configure
make
# mecab에게 사전이 존재하는 장소를 알려줍니다.
sudo sh -c 'echo "dicdir=/usr/local/lib/mecab/dic/mecab-ko-dic" > /usr/local/etc/mecabrc'
sudo make install
# 만일 mecab을 /usr/local 에 설치하였다면, python-mecab-ko 빌드를 위해
# 다음 과정은 필수로 거치셔야 합니다.
sudo ln -s /usr/local/bin/mecab-config /usr/bin/mecab-config
  • python-mecab-ko를 설치합니다.

sudo python3 -m pip install python-mecab-ko

이제 다 되었습니다…​ 새로운 한글 용어들을 얻기 위해 색인을 재구축하십시오.