
Implements a morphological analyzer with functionality similar to MeCab, supporting binary dictionary loading and offering various packages for ease of integration.
Pure Kotlin の 形態素解析機 の実装です。 Pure Kotlin で実装されているため、KMP(Kotlin multiplatform) で利用可能です。
現在、以下のプラットフォームで CI を回していて、動いています。
MeCab のバイナリー辞書を利用可能です。
工藤 拓氏の 実践・自然言語処理シリーズ2 形態素解析の理論と実装 を参考に実装していて、基本的な挙動は MeCab と同じになるようにしています。
以下の artifact があります。
maven central にリリースされているので、maven or gradle で依存に追加すれば利用できます。
https://central.sonatype.com/namespace/io.github.tokuhirom.momiji
mecab-ipadic の辞書を利用することを推奨します。辞書のバンドルは momiji-ipadic artifact に含まれています。 gradle で依存にいれるだけで使えるので、一番カンタンに使えます。
UniDic は ファイルサイズが 1GB を超えるため、artifact としての配布はしていません。momiji-binary-dict を利用してロードしてください。
./gradlew buildDict build
Pure Kotlin の 形態素解析機 の実装です。 Pure Kotlin で実装されているため、KMP(Kotlin multiplatform) で利用可能です。
現在、以下のプラットフォームで CI を回していて、動いています。
MeCab のバイナリー辞書を利用可能です。
工藤 拓氏の 実践・自然言語処理シリーズ2 形態素解析の理論と実装 を参考に実装していて、基本的な挙動は MeCab と同じになるようにしています。
以下の artifact があります。
maven central にリリースされているので、maven or gradle で依存に追加すれば利用できます。
https://central.sonatype.com/namespace/io.github.tokuhirom.momiji
mecab-ipadic の辞書を利用することを推奨します。辞書のバンドルは momiji-ipadic artifact に含まれています。 gradle で依存にいれるだけで使えるので、一番カンタンに使えます。
UniDic は ファイルサイズが 1GB を超えるため、artifact としての配布はしていません。momiji-binary-dict を利用してロードしてください。
./gradlew buildDict build