――Les données audio utilisées cette fois sont un enregistrement de ma réunion de recherche (un séminaire d'études supérieures) avec les AirPods. Le nombre de participants à la réunion est de 3 à 5. Veuillez noter que l'audio contient des informations personnelles et ne peut être divulgué.
--En plus d'Amazon, Google, IBM et Microsoft, la précision de reconnaissance de Kaldi (apprise avec CSJ, JNS, S-JNAS, CEJC) est également répertoriée.
        GCP
        WER: 0.3344722854973424
        CER: 0.2765527007889945
        AWS
        WER: 0.36209150326797385
        CER: 0.2218905472636816
        Azure
        WER: 0.28109824430332464
        CER: 0.21596337579617833
        Watson
        WER: 0.4107744107744108
        CER: 0.29126794258373206
        Kaldi
        WER: 0.616504854368932
        CER: 0.47915630285543725
 
――Je publierai un des résultats de reconnaissance pour le moment
Bonne réponse:Puisqu'il est possible de calculer la proximité, en utilisant ceci, le son de frappe est exprimé comme une matrice de distance pour chaque matériau, et la densité est exprimée comme ceci, de sorte que cette carte bidimensionnelle puisse être utilisée. J'ai essayé de le remplacer, mais c'est incroyable de faire quelque chose
Google:La proximité peut être calculée, donc même si vous l'utilisez, vous pouvez remplacer le son frappant par une matrice de distance pour chaque matériau et la remplacer par cette carte bidimensionnelle qui est devenue comme ça. Mais c'est incroyable de faire quelque chose
Amazon:Puisqu'il est possible de calculer la proximité, même si cela est utilisé, le son frappant est représenté par un nœud comme celui-ci dans la matrice de distance pour chaque matériau, donc cet être humain Le remplacer par une carte est une évidence!Je l'ai essayé, mais c'est incroyable de faire quelque chose
Microsoft:Je l'ai utilisé parce que je peux calculer la proximité, mais j'ai utilisé cette carte bidimensionnelle parce qu'il y avait un moyen d'exprimer le son frappant pour chaque matériau dans une matrice de distance avec le même sentiment qu'avant. J'ai essayé de le remplacer par un, mais c'est incroyable de faire quelque chose
IBM:Puisqu'il est possible de calculer le contrôle, même s'il est utilisé, on ne peut pas dire que le son de frappe est représenté par une matrice pour chaque matériau sur l'horloge, comme c'était le cas ci-dessus. Remplacez-le par la carte humaine ici. J'ai essayé de le faire pour le moment, mais c'est incroyable de faire quelque chose
Kaldi:Comme il est possible de calculer la proximité pendant 5 jours, il n'est pas nécessaire de l'utiliser, de sorte que le son de frappe est supprimé pour chaque matériau. J'ai été passif une fois, surtout pour le remplacer, mais c'est pratique de faire quelque chose.
        Recommended Posts