|
ngram_stemmer
ngram_stemmer (word_list, size, equality)
|
Hinzugefügt in advas.0.0.3
Reduziert word_list unter Verwendung der N-gram-Stemming-Methode.
In: |
word_list |
eine Wortliste |
|
size |
die Länge der N-grams |
|
equality |
Float-Wert, der den Grad der Gleichheit angibt |
Out: |
|
eine Wortliste, bereits zusammengefaßt falls möglich |
Die Gleichheit ist ein Wert zwischen 0 und 1. Je höher der Wert, umso größer muß der Wert der Übereinstimmung zwischen zwei Worten sein, damit diese zu einem Wort zusammengefaßt werden. Ein empfohlener Wert liegt zwischen 0.8 und 0.9.
|
|