Prétraitement NEologd en Java neologdn-java

Chao ... †

Avec l'aide de @ragion, nous avons enfin publié le module de pré-traitement de NEologd neologd-java en Java!

Qu'est-ce que c'est?

https://github.com/neologd/mecab-ipadic-neologd/wiki/Regexp.ja

Il y a une limite à rendre les données du dictionnaire redondantes et à absorber différentes notations. Lors de la génération des données du dictionnaire, tout le traitement de normalisation décrit ci-dessous est appliqué, donc si le traitement de normalisation suivant est appliqué au texte à analyser, il sera plus facile de faire correspondre les mots du dictionnaire.

Comme vous pouvez le voir sur la page ci-dessus, il est important d'effectuer une normalisation (pré-traitement) avant l'analyse avec MeCab. Par conséquent, j'ai créé neologd-java, un module de pré-traitement pour NEologd en Java.

Comment l'utilisez-vous?

Pour Maven

Puisqu'il est enregistré dans Maven Central, ajoutez ce qui suit à pom.xml.

    <dependency>
      <groupId>io.github.ikegami-yukino</groupId>
      <artifactId>neologdn</artifactId>
      <version>0.0.1</version>
    </dependency>

Et

package yukinoi.neologdn_example;
import io.github.ikegamiyukino.neologdn.NeologdNormalizer;


/**
 * neologdn-example
 *
 */
public class App
{
    public static void main(String[] args)
    {
        NeologdNormalizer normalizer = new NeologdNormalizer();
        String text = "Livre de lecture supplémentaire PRML";
        String normalizedText = normalizer.normalize(text);
        System.out.println(normalizedText);
    }
}

Utilisez comme.

Je veux contribuer!

Il est développé dans le référentiel GitHub suivant. https://github.com/ikegami-yukino/neologdn-java

Contributions are welcome!

Recommended Posts

Prétraitement NEologd en Java neologdn-java

Partition en Java

Changements dans Java 11

Janken à Java

Taux circonférentiel à Java

FizzBuzz en Java

Implémentation de l'interpréteur par Java

Faites un blackjack avec Java

Application Janken en Java

Programmation par contraintes en Java

Mettez java8 dans centos7

NVL-ish guy en Java

"Hello World" en Java

Interface appelable en Java

Commentaires dans la source Java

Fonctions Azure en Java

Formater XML en Java

Simple htmlspecialchars en Java

Implémentation Boyer-Moore en Java

Hello World en Java

Utiliser OpenCV avec Java

Mémorandum WebApi avec Java

Détermination de type en Java

Exécuter des commandes en Java (ping)

Divers threads en java

Implémentation du tri de tas (en java)

API Zabbix en Java

Art ASCII à Java

Comparer des listes en Java

POST JSON en Java

Exprimer l'échec en Java

Créer JSON en Java

Manipulation de la date dans Java 8

Nouveautés de Java 8

Utiliser PreparedStatement en Java

Nouveautés de Java 9,10,11

Exécution parallèle en Java

Essayez d'utiliser RocksDB avec Java

Lire des fichiers binaires en Java 1

Évitez l'erreur que Yuma a donnée en Java

Obtenir des informations EXIF en Java

[Neta] Sleep Sort en Java

Modifier ini en Java: ini4j

L'histoire de Java dans ce monde

Segfo Java en 6 lignes

Essayez de développer Spresense avec Java (1)

Essayez le type fonctionnel en Java! ①

J'ai fait une roulette à Java.

Implémentation de l'authentification en deux étapes en Java

Ecrire des rappels de vol en Java

Importer des données Excel avec Java 2

Changer le codage Java dans Windows

API Java Stream en 5 minutes

Problème de ne pas trouver javax.annotation.Généré en Java 11

Lire l'entrée standard en Java

Implémenter l'authentification de base en Java

Le type grep-ish de Perl en Java

Rechercher un sous-ensemble en Java