Opdatering van 2018 Hunspel Afrikaanse spelwoorde

Hunspell is 'n speltoetser wat onder ander gebruik word in libreoffice en weblesers. Dit is 'n aansienlike projek om 'n woordeboek of spelreëls saam te stel. 'n Perfekte taal-definisie is onmoontlik. Afgesien van die hoeveelheid werk is daar baie onduidelikhede, teenstrydighede, uitsonderings en tale verander deurgaans.

PuzzleFoundry ondersteun Afrikaans en het stelsels vir prosessering van woorde. Tydens ontwikkeling het ek opgemerk dat die Afrikaanse speltoetser aandag benodig. Ek het aanvanklik e-pos aan Dwayne Bailey gestuur, en intussen die Afrikaanse spelling data begin opruim. Dit het mettertyd ontaard in 'n volskaalse poging en die uiteindelike resultaat is 'n totale herwerk van die Afrikaanse speltoets data.

Daar was meer as 50,000 korreksies gemaak aan die Hunspell speltoets data.

Dit sluit verwyderings, korreksies en byvoegings in. Heelwat van die byvoegings was tegniese woorde. Plant en diername is ook bygewerk.

Van die korreksies was verkeerde spellings, ander was nonsens woorde, woorde uit ander tale, ander was seldsame eiename of eiename in kleinletters (laerkas).

Dit verg meer moeite om foutiewe inskrywings te vind as om nuwe woorde by te voeg. Hier was voorbeelde van woorde wat verkeerd gespel is: lêe, stampmieleis, vaahheid, oggendskot, provaatskole, willekerig, gepelde en speltoes (Sommige foute is snaaks!).

Dit was moeilik om te besluit oor geldigheid van Afrikaanse woorde Daar is heelwat marginale woorde in Hunspel. Sommige van die woorde is Nederlands. Woorde soos "slawerarbeid" bestaan in die speltoetser maar slawearbeid is 'n beter woord. Daar is vele arbitrêre woorde in die speltoetser wat lei tot foute. Die woord "voile" en "talie" (beide met 'n "I" gespel) bestaan in die speltoetser. Gevolglik het sommige Afrikaanse bronne sinne waar "volle" (met 'n "L") as "voile", en "talle as "talie" verkeerd gespel is.
Daar is duisende nonsens woorde in die speltoetser. Sommige van die woorde lyk geldig, maar is betekenisloos (baie van hierdie gevalle is sintetiese saamstel-woorde). Voorbeelde van nonsens woorde is mikstokman, boudjiegedeelte, byvoetwol, metaalsilhoeëtte, mikstokspioen, onderhoudsprogrammeringsondersteuning en warmhakskeentjies.

Baie ongeldige woorde is verwyder, maar heelwat marginale woorde in Hunspell gelos. Dit is ook moontlik dat ek 'n paar geldige woorde verwyder het.

Daar was ook baie eiename wat in kleinletters geskryf is wat ook spelfoute veroorsaak want party eiename lyk soos woorde (daar is egter eiename wat 'n woord kan wees soos "rietkuil"). Ek het heelwat tyd spandeer om kleinletter en hoofletters te korrigeer. Op die stadium is die werk nog in-proses en die konsekwente gebruik van hoofletters en kleinletters sal verbeter in 'n volgende iterasie.

Die 2009/2018 spel-woorde bevat te veel eiename soos skole, straatname, inkoopsentrums, plaasname, verblyf-oorde en voorstede. Speltoetsers kan nie alle eiename bevat nie, en te veel eiename kan lei tot spelfoute. Die opgedateerde speltoetser bevat Suid-Afrikaanse stede, dorpe en 'n klompie historiese of algemene eiename.

Standaard verbuigings is bygevoeg. Die 2018 speltoets bevat "agterbaks", maar nie "agterbaksheid" nie. Die werkwoord "bloos" bestaan, maar die naamwoord "blosing" bestaan nie. In PuzzleFoundry is "blosing" handig as 'n tesouris woord vir die Duitse woorde "Schamröte" en "Erröten".

'n Paar van ons mooier Afrikaanse woorde ontbreek ook, soos skietgee. Daar is ook 'n algemene tendens om Nederlandse woorde op te neem selfs waar die woorde nie in Afrikaans gebruik word nie, byvoorbeeld: "vroegmette", "vrybiljet" en "luguber". Ek vermoed daar is nog daar is nog sulke Nederlandse woorde wat ek nie opgespoor het nie. Ek het ook Engelse woorde soos "new" verwyder. Ek het leenwoorde vanuit ander tale bygevoeg waar die woorde in algemene gebruik is (Voorbeelde is "domicile" en "caveat" uit Latyn en "Hamba Kahle" van Zoeloe).

Daar is ook algemene woorde wat al lank in Afrikaans bestaan maar nog nie opgeneem is nie, 'n voorbeeld is "gatvol".

Die aantal Afrikaanse spelling korpus in PuzzleFoundry bestaan uit sowat 150,000 woorde. Die Afrikaanse woordeboek in PuzzleFoundry bestaan uit sowat 50,000 trefwoorde. Die 50,000 woorde is basies onverbuigde woorde wat kruisverwys is met Arikaanse woorde en woorde uit ander tale (tesourusse).

Arikaanse woorde is gekonsolideer en geproduseer deur 'n PuzzleFoundry bondellopie. Die nuwe spelling woord-lêer is effe meer kompak.

Hierdie is 'n werk-in-proses en daar is definitief uitstaande foute en areas wat korreksies benodig. Ek moet miskien net stel dat ek nie 'n taalkundige is nie, maar 'n Ingenieur en Wiskundige. So laat my asseblief weet waar ek verkeerd gegaan het. Ek ontvang graag korreksies. Dit is ook moontlik om die (Afrikaanse) woordeboeke direk te redigeer deur die Puzzlefoundry web-koppelvlak. Laat my asseblief weet as u toegang verlang om woordeboeke te wysig.

Daar word nog heelwat verbeterings nodig en ek wil graag die verbeterings in toekomstige opdaterings verskaf.

Vanaf Artikels oor Woordeboeke

krisvan 2019-03-08 00h17

PuzzleMan