decompound_mode
- none: 복합명사로 분리하지 않는다.
- discard: 복합명사로 분리하고 원본 데이터는 삭제한다. (잠실역 → 잠실, 역)
- mixed: 복합명사로 분리하고 원본 데이터는 유지한다. (잠실, 역, 잠실역)
user_dictionary
- user_dictionary 를 설정하면 하나의 명사로 처리가 된다.
- 즉, 삼성전자는 discard인 경우 (삼성, 전자)로 분리되고 mixed인 경우 (삼성전자, 삼성, 전자) 로 분리가 되지만 user_dictionary에 “삼성전자”를 적어두면 삼성전자는 discard이든 mixed이든 (삼성전자)만 된다.
예시1
decompound_mode = mixed
/nori_analyzer
삼성전자 삼성 전자
예시2
decompound_mode = mixed