Natuurlike Taalverwerking (NLP) is rekenaarlinguistiek vir kunsmatige intelligensie toepassings.
Stemmers, of in die geval die Snowball stemmer, is 'n belangrike boublok wat woordstamme vind in die soektog na mening in teks.
Ek het begin met die ontwikkeling van 'n Afrikaanse stemmer wat julle hier kan uitprobeer:
Afrikaanse stemmer riglyne:
Ek moes 'n hele metodologie ontwikkel vir die skep van 'n matriks regex teksverwerkings.
Ek benodig toetsdata (stelle woorde wat almal dieselfde stem behoort te hê). Wanneer die stemmer in 'n goeie staat is sal ek die beskikbaar maak vir die NLTK oopbron sagteware.
Ek benodig omvattende toetsdata van stelle woorde ,- waar elke stel reduseer na dieselfde stamwoord. Twee voorbeelde van stelle toetsdata:
Kris van der Merwe
krisvan 2023-02-13 07h53