Project

General

Profile

Wijzigingen in Hunspell die voor ons worden gemaakt » History » Version 8

Ruud Baars, 23-09-2010 15:25

1 8 Ruud Baars
h2. Noodzakelijk
2 1 Ruud Baars
3 8 Ruud Baars
1. Forbiddenword has to have highest priority
4 1 Ruud Baars
5 8 Ruud Baars
Een woord dat expliciet is gemarkeerd als fout, maar met via samenstellingsmechanisme wordt gegene­reerd, wordt wel als fout gezien, maar toch als alternatief aangeboden. Correctie hiervan is essentieel.
6 1 Ruud Baars
7 8 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2970239&group_id=143754&atid=756395
8 5 Bart Knubben
9 8 Ruud Baars
Test cases:
10
* make a compound using part 1, part 2 and part 3; forbid the compound, test by entering this compound minus 1 letter, check if word is suggested
11
* forbid a word that as affix flags; check if all affixed forms are forbidden and are not suggested.
12
* suggest a forbidden word using REP; check if it is suggested
13 3 Bart Knubben
14
15 8 Ruud Baars
2. Er is een optie om af te dwingen dat een woord precies zo moet worden geschreven als het is opgenomen, bijvoorbeeld dvd niet als DVD. Woorden die zo gemarkeerd zijn, verliezen die markering helaas als er wordt samengesteld, zodat DVD-schrijver wel wordt geaccepteerd.
16 1 Ruud Baars
17 8 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395
18 4 Bart Knubben
19 6 Bart Knubben
h.2 Belangrijk
20 3 Bart Knubben
21
3. Als alternatieven worden soms heel vreemde samenstellingen aangeboden, die ook nog erg veel ver­
22
schillen met het foutieve woord. Dit kan beperkt worden door gegenereerde samenstellingen op 'verschil'
23 1 Ruud Baars
met het foutieve woord te beoordelen, gerelateerd aan de lengte van het woord. Dit resulteert in minder
24 3 Bart Knubben
verbazingwekkende en onzinnige woorden in de suggesties.
25 4 Bart Knubben
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2970237&group_id=143754&atid=756395
26 3 Bart Knubben
27
4. Er is een mechanisme aanwezig dat voorkomt dat twee opeenvolgende delen aan elkaar worden ge­
28
plakt. Zoals bijvoorbeeld woon+werk. Dit mechanisme kan allerlei fouten efficiënt voorkomen. Helaas werkt
29 1 Ruud Baars
het niet op alle delen van samenstellingen, maar alleen op de laatste twee, wat niet goed genoeg is voor
30 3 Bart Knubben
het Nederlands. Met deze aanpassing wordt het tegenhouden van foutieve samenstellingen robuuster.
31 4 Bart Knubben
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2970240&group_id=143754&atid=756395
32 3 Bart Knubben
33
5. Hetzelfde mechanisme zou ook voor woordsoorten moeten kunnen werken, bijvoorbeeld functie+functie,
34 1 Ruud Baars
met vlaggen. Ook die werkt niet. Met deze aanpassing wordt het tegenhouden van foutieve samenstellin­
35 3 Bart Knubben
gen robuuster.
36 4 Bart Knubben
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2970242&group_id=143754&atid=756395
37 3 Bart Knubben
38
6. Hunspell kent 2 samenstellingsmechanismen. De ene is meer geschikt voor regelmatige woorden als
39
getallen, de andere meer voor normale samenstellingen. Deze twee mechanismen verstoren elkaar echter.
40 1 Ruud Baars
Bij verbetering wordt het mogelijk om alle uitgeschreven getallen correct te ondersteunen en samenstellin ­
41 3 Bart Knubben
gen als 'dikkemannentest' succesvol te ondersteunen.
42 4 Bart Knubben
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2999225&group_id=143754&atid=756395
43 3 Bart Knubben
44
7. Een mogelijkheid om bij een samenstellend deel aan te geven dat het samengestelde woord met een
45
hoofdletter geschreven dient te worden. Dat maakt het mogelijk om bij straat, plein e.d. de juiste suggestie
46 1 Ruud Baars
te doen zonder alle straatnamen op te nemen.
47 3 Bart Knubben
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395 en
48 4 Bart Knubben
http://sourceforge.net/tracker/?func=detail&aid=1689683&group_id=143754&atid=756398
49 3 Bart Knubben
50
8. Voor bepaalde letterreeksen kan een waarschijnlijke vervanger worden opgegeven, bijvoorbeeld enzo
51
=> en zo. Helaas wordt dan die spatie aangeboden bij elk woord waar enzo in zit (helaas dus ook bij boe ­
52 1 Ruud Baars
kenzolder), en niet bekend is. Het verzoek is om in de vervangingsregel de woordgrenzen aan te kunnen
53 3 Bart Knubben
geven, [enzo]=>[en zo]. Dit voorkomt Engelse ziekte.
54 4 Bart Knubben
Meer info: http://sourceforge.net/tracker/?func=detail&aid=3000055&group_id=143754&atid=756395
55 3 Bart Knubben
56 1 Ruud Baars
9. Hetzelfde mechanisme faalt met meer dan een spatie. Bepaalde foutief aan elkaar geschreven woord ­
57 3 Bart Knubben
groepen kunnen daarom niet succesvol opgesplitst worden aangeboden.
58
Meer info: http://sourceforge.net/tracker/?func=detail&aid=3018929&group_id=143754&atid=756395 en
59 4 Bart Knubben
https://sourceforge.net/tracker/?func=detail&aid=3008434&group_id=143754&atid=756398
60 1 Ruud Baars
                                                                                               
61 3 Bart Knubben
10. Hetzelfde mechanisme kan niet omgaan met leestekens zoals de apostrof, zodat suggesties sturen op
62
dat punt onmogelijk is.
63
Meer info: http://sourceforge.net/tracker/?func=detail&aid=3018930&group_id=143754&atid=756395
64 4 Bart Knubben
65 6 Bart Knubben
h2. Wenselijk
66 3 Bart Knubben
67
11. Het zou mooi zijn als de mogelijkheid bestond om een woord dat op zich correct is, maar waarschijnlijk
68
fout (kunne, verassen) zo te kunnen markeren. Hierdoor zou het mogelijk worden om ze in de applicaties
69
niet rood, maar oranje te markeren. Dat vraagt echter ook aanpassing aan de applicaties.
70 1 Ruud Baars
Meer info: http://sourceforge.net/tracker/?func=detail&aid=1808861&group_id=143754&atid=756398