Chao ... †
Avec l'aide de @ragion, nous avons enfin publié le module de pré-traitement de NEologd neologd-java en Java!
https://github.com/neologd/mecab-ipadic-neologd/wiki/Regexp.ja
Il y a une limite à rendre les données du dictionnaire redondantes et à absorber différentes notations. Lors de la génération des données du dictionnaire, tout le traitement de normalisation décrit ci-dessous est appliqué, donc si le traitement de normalisation suivant est appliqué au texte à analyser, il sera plus facile de faire correspondre les mots du dictionnaire.
Comme vous pouvez le voir sur la page ci-dessus, il est important d'effectuer une normalisation (pré-traitement) avant l'analyse avec MeCab. Par conséquent, j'ai créé neologd-java, un module de pré-traitement pour NEologd en Java.
Puisqu'il est enregistré dans Maven Central, ajoutez ce qui suit à pom.xml.
    <dependency>
      <groupId>io.github.ikegami-yukino</groupId>
      <artifactId>neologdn</artifactId>
      <version>0.0.1</version>
    </dependency>
Et
package yukinoi.neologdn_example;
import io.github.ikegamiyukino.neologdn.NeologdNormalizer;
/**
 * neologdn-example
 *
 */
public class App
{
    public static void main(String[] args)
    {
        NeologdNormalizer normalizer = new NeologdNormalizer();
        String text = "Livre de lecture supplémentaire PRML";
        String normalizedText = normalizer.normalize(text);
        System.out.println(normalizedText);
    }
}
Utilisez comme.
Il est développé dans le référentiel GitHub suivant. https://github.com/ikegami-yukino/neologdn-java
Contributions are welcome!
Recommended Posts