Noodzakelijk/Essential

Forbiddenword has to have highest priority

Een woord dat expliciet is gemarkeerd als fout, maar met via samenstellingsmechanisme wordt gegene­reerd, wordt wel als fout gezien, maar toch als alternatief aangeboden. Correctie hiervan is essentieel.

info: http://sourceforge.net/tracker/?func=detail&aid=2970239&group_id=143754&atid=756395

Test cases:
  • make a compound using part 1, part 2 and part 3; forbid the compound, test by entering this compound minus 1 letter, check if word is suggested (should not be)
  • forbid a word that as affix flags; check if all affixed forms are forbidden and are not suggested. (should not be)
  • suggest a forbidden word using REP; check if it is suggested (should not be)
Deze fout is succesvol gecorrigeerd, blijkens de 1e testversie (.13)
Succesfully corrected

Keepcase

Er is een optie om af te dwingen dat een woord precies zo moet worden geschreven als het is opgenomen, bijvoorbeeld dvd niet als DVD. Woorden die zo gemarkeerd zijn, verliezen die markering helaas als er wordt samengesteld, zodat DVD-schrijver wel wordt geaccepteerd.

info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395

Testcases:
  • create compound parts tv- and -tv, using the keepcase flags
  • Test if word-TV and TV-word are accepted. They should not be.
Afgedaan. Succesfully implemented 

Belangrijk/Important

wilde suggesties/wild suggestions

Als alternatieven worden soms heel vreemde samenstellingen aangeboden, die ook nog erg veel ver­schillen met het foutieve woord. Dit kan beperkt worden door gegenereerde samenstellingen op 'verschil'
met het foutieve woord te beoordelen, gerelateerd aan de lengte van het woord. Dit resulteert in minder
verbazingwekkende en onzinnige woorden in de suggesties.

info: http://sourceforge.net/tracker/?func=detail&aid=2970237&group_id=143754&atid=756395

Solved by improving the general suggestion mechanism, but also by adding max difference for dictionary words and max compound suggestions.
However, this still allows for wild compounding suggestions, though limited in number.
In discussion.

Checkcompoundpattern should work for all compounding parts

Er is een mechanisme aanwezig dat voorkomt dat twee opeenvolgende delen aan elkaar worden ge­plakt. Zoals bijvoorbeeld woon+werk. Dit mechanisme kan allerlei fouten efficiënt voorkomen. Helaas werkt
het niet op alle delen van samenstellingen, maar alleen op de laatste twee, wat niet goed genoeg is voor
het Nederlands. Met deze aanpassing wordt het tegenhouden van foutieve samenstellingen robuuster.

info: http://sourceforge.net/tracker/?func=detail&aid=2970240&group_id=143754&atid=756395

Test cases:
  • make compounds woon, werk and verkeer (first, middel last). Add checkcompoundpattern woon werk (oon wer?). woonwerkverkeer schould be seen as wrong.
  • same parts, but replace checkcompoundpattern with erk verkee; result should be identical
Succesvol gecorrigeerd.
Corrected.

Checkcompoundpattern with flags

Hetzelfde mechanisme zou ook voor woordsoorten moeten kunnen werken, bijvoorbeeld functie+functie,
met vlaggen. Ook die werkt niet. Met deze aanpassing wordt het tegenhouden van foutieve samenstellin­
gen robuuster.

info: http://sourceforge.net/tracker/?func=detail&aid=2970242&group_id=143754&atid=756395

Test cases:
  • create compound parts prins and bisschop, both with same flag (e.g. Xf beside compounding flags). Add checkcompoundpattern /Xf /Xf. Then, prinsbisschop should be noticed as invalid word.
Works. For just stem-collision or with derivatives too. zoutsuikertest now suggested zout-suikertest. Perfect.

Interfering compounding mechanisms

Hunspell kent 2 samenstellingsmechanismen. De ene is meer geschikt voor regelmatige woorden als
getallen, de andere meer voor normale samenstellingen. Deze twee mechanismen verstoren elkaar echter.
Bij verbetering wordt het mogelijk om alle uitgeschreven getallen correct te ondersteunen en samenstellingen als 'dikkemannentest' succesvol te ondersteunen.

info: http://sourceforge.net/tracker/?func=detail&aid=2999225&group_id=143754&atid=756395

Werkt prima. Dus de uitgechreven getallen kunnen weer allemal succesvol worden ondersteund

Force start with capital

Een mogelijkheid om bij een samenstellend deel aan te geven dat het samengestelde woord met een
hoofdletter geschreven dient te worden. Dat maakt het mogelijk om bij straat, plein e.d. de juiste suggestie
te doen zonder alle straatnamen op te nemen.
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395 en
http://sourceforge.net/tracker/?func=detail&aid=1689683&group_id=143754&atid=756398

Afgedaan. Succesfully implemented.

add word border to REP pattern

Voor bepaalde letterreeksen kan een waarschijnlijke vervanger worden opgegeven, bijvoorbeeld enzo
=> en zo. Helaas wordt dan die spatie aangeboden bij elk woord waar enzo in zit (helaas dus ook bij boekenzolder), en niet bekend is. Het verzoek is om in de vervangingsregel de woordgrenzen aan te kunnen
geven, [enzo]=>[en zo]. Dit voorkomt Engelse ziekte.

info: http://sourceforge.net/tracker/?func=detail&aid=3000055&group_id=143754&atid=756395

Deze fout is succesvol gecorrigeerd, blijkens de 1e testversie (.13)
Corrected.

REP with >1 space

Hetzelfde mechanisme faalt met meer dan een spatie. Bepaalde foutief aan elkaar geschreven woord ­
groepen kunnen daarom niet succesvol opgesplitst worden aangeboden.
Meer info: http://sourceforge.net/tracker/?func=detail&aid=3018929&group_id=143754&atid=756395 en
https://sourceforge.net/tracker/?func=detail&aid=3008434&group_id=143754&atid=756398

Deze fout is succesvol gecorrigeerd, blijkens de 1e testversie (.13)
Corrected

REP with special chars

Hetzelfde mechanisme kan niet omgaan met leestekens zoals de apostrof, zodat suggesties sturen op
dat punt onmogelijk is.

info: http://sourceforge.net/tracker/?func=detail&aid=3018930&group_id=143754&atid=756395

In de nieuwe versie is dit gebrek niet meer aanwezig, mogelijk door het betere suggestie-mechanisme.

Wenselijk

Confusing words

Het zou mooi zijn als de mogelijkheid bestond om een woord dat op zich correct is, maar waarschijnlijk
fout (kunne, verassen) zo te kunnen markeren. Hierdoor zou het mogelijk worden om ze in de applicaties
niet rood, maar oranje te markeren. Dat vraagt echter ook aanpassing aan de applicaties.
Meer info: http://sourceforge.net/tracker/?func=detail&aid=1808861&group_id=143754&atid=756398

Open