言語に依存しない形態素解析ツールキットの開発

言語に依存しない形態素解析ツールキットの開発 (1998)

形態素解析処理において,日本語などのわかち書きされない言語と英語などのわかち書きされる言語では,形態素辞書検索のタイミングや辞書検索単位が異なる。これらを同じ枠組で扱うことにより,辞書検索部の多言語化を行った。また,これに関連し,形態素解析処理のモジュール分割を行い,多言語形態素解析ツールキットとして実装した。実験として日本語,英語,中国語,韓国語での実装を行った。

http://nais.to/~yto/doc/pub/#talks
http://nais.to/~yto/doc/pub/nlk199811.pdf