Project

General

Profile

Wijzigingen in Hunspell die voor ons worden gemaakt » History » Version 9

Ruud Baars, 23-09-2010 15:39

1 9 Ruud Baars
h1. Noodzakelijk/Essential
2 1 Ruud Baars
3 9 Ruud Baars
h2. Forbiddenword has to have highest priority
4 1 Ruud Baars
5 8 Ruud Baars
Een woord dat expliciet is gemarkeerd als fout, maar met via samenstellingsmechanisme wordt gegene­reerd, wordt wel als fout gezien, maar toch als alternatief aangeboden. Correctie hiervan is essentieel.
6 1 Ruud Baars
7 8 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2970239&group_id=143754&atid=756395
8 5 Bart Knubben
9 8 Ruud Baars
Test cases:
10 9 Ruud Baars
* make a compound using part 1, part 2 and part 3; forbid the compound, test by entering this compound minus 1 letter, check if word is suggested (should not be)
11
* forbid a word that as affix flags; check if all affixed forms are forbidden and are not suggested. (should not be)
12
* suggest a forbidden word using REP; check if it is suggested (should not be)
13 8 Ruud Baars
14 1 Ruud Baars
15 9 Ruud Baars
h2. Keepcase
16 1 Ruud Baars
17 9 Ruud Baars
Er is een optie om af te dwingen dat een woord precies zo moet worden geschreven als het is opgenomen, bijvoorbeeld dvd niet als DVD. Woorden die zo gemarkeerd zijn, verliezen die markering helaas als er wordt samengesteld, zodat DVD-schrijver wel wordt geaccepteerd.
18
19 1 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395
20
21 9 Ruud Baars
Testcases:
22
* create compound parts tv- and -tv, using the keepcase flags
23
* Test if word-TV and TV-word are accepted. They should not be.
24 1 Ruud Baars
25 9 Ruud Baars
h1. Belangrijk/Important
26
27
h2. wilde suggesties/wild suggestions
28
29
Als alternatieven worden soms heel vreemde samenstellingen aangeboden, die ook nog erg veel ver­
30 1 Ruud Baars
schillen met het foutieve woord. Dit kan beperkt worden door gegenereerde samenstellingen op 'verschil'
31
met het foutieve woord te beoordelen, gerelateerd aan de lengte van het woord. Dit resulteert in minder
32
verbazingwekkende en onzinnige woorden in de suggesties.
33
34 9 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2970237&group_id=143754&atid=756395
35
36
h2. Checkcompoundpattern should work for all compounding parts
37
38
Er is een mechanisme aanwezig dat voorkomt dat twee opeenvolgende delen aan elkaar worden ge­plakt. Zoals bijvoorbeeld woon+werk. Dit mechanisme kan allerlei fouten efficiënt voorkomen. Helaas werkt
39 1 Ruud Baars
het niet op alle delen van samenstellingen, maar alleen op de laatste twee, wat niet goed genoeg is voor
40
het Nederlands. Met deze aanpassing wordt het tegenhouden van foutieve samenstellingen robuuster.
41
42 9 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2970240&group_id=143754&atid=756395
43
44
Test cases:
45
* make compounds woon, werk and verkeer (first, middel last). Add checkcompoundpattern woon werk (oon wer?). woonwerkverkeer schould be seen as wrong.
46
* same parts, but replace checkcompoundpattern with erk verkee; result should be identical
47
48
h2. Checkcompoundpattern with flags
49
50
Hetzelfde mechanisme zou ook voor woordsoorten moeten kunnen werken, bijvoorbeeld functie+functie,
51 1 Ruud Baars
met vlaggen. Ook die werkt niet. Met deze aanpassing wordt het tegenhouden van foutieve samenstellin­
52
gen robuuster.
53
54 9 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2970242&group_id=143754&atid=756395
55
56
Test cases:
57
* create compound parts prins and bisschop, both with same flag (e.g. Xf beside compounding flags). Add checkcompoundpattern /Xf /Xf. Then, prinsbisschop should be noticed as invalid word.
58
59
h2. Interfering compounding mechanisms
60
61
Hunspell kent 2 samenstellingsmechanismen. De ene is meer geschikt voor regelmatige woorden als
62 1 Ruud Baars
getallen, de andere meer voor normale samenstellingen. Deze twee mechanismen verstoren elkaar echter.
63
Bij verbetering wordt het mogelijk om alle uitgeschreven getallen correct te ondersteunen en samenstellin ­
64
gen als 'dikkemannentest' succesvol te ondersteunen.
65
66 9 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2999225&group_id=143754&atid=756395
67
68
h2. Force start with capital
69
70
Een mogelijkheid om bij een samenstellend deel aan te geven dat het samengestelde woord met een
71 1 Ruud Baars
hoofdletter geschreven dient te worden. Dat maakt het mogelijk om bij straat, plein e.d. de juiste suggestie
72
te doen zonder alle straatnamen op te nemen.
73
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395 en
74
http://sourceforge.net/tracker/?func=detail&aid=1689683&group_id=143754&atid=756398
75
76 9 Ruud Baars
h2. add word border to REP pattern
77
78
Voor bepaalde letterreeksen kan een waarschijnlijke vervanger worden opgegeven, bijvoorbeeld enzo
79 1 Ruud Baars
=> en zo. Helaas wordt dan die spatie aangeboden bij elk woord waar enzo in zit (helaas dus ook bij boe ­
80
kenzolder), en niet bekend is. Het verzoek is om in de vervangingsregel de woordgrenzen aan te kunnen
81 3 Bart Knubben
geven, [enzo]=>[en zo]. Dit voorkomt Engelse ziekte.
82
83 9 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=3000055&group_id=143754&atid=756395
84
85
h2. REP with >1 space
86
87
Hetzelfde mechanisme faalt met meer dan een spatie. Bepaalde foutief aan elkaar geschreven woord ­
88 3 Bart Knubben
groepen kunnen daarom niet succesvol opgesplitst worden aangeboden.
89 1 Ruud Baars
Meer info: http://sourceforge.net/tracker/?func=detail&aid=3018929&group_id=143754&atid=756395 en
90 3 Bart Knubben
https://sourceforge.net/tracker/?func=detail&aid=3008434&group_id=143754&atid=756398
91 4 Bart Knubben
                                                
92 9 Ruud Baars
93
h2. REP with special chars
94
95
Hetzelfde mechanisme kan niet omgaan met leestekens zoals de apostrof, zodat suggesties sturen op
96 4 Bart Knubben
dat punt onmogelijk is.
97 1 Ruud Baars
98 9 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=3018930&group_id=143754&atid=756395
99 3 Bart Knubben
100 9 Ruud Baars
h1. Wenselijk
101
102
h2. Confusing words
103
104
Het zou mooi zijn als de mogelijkheid bestond om een woord dat op zich correct is, maar waarschijnlijk
105 3 Bart Knubben
fout (kunne, verassen) zo te kunnen markeren. Hierdoor zou het mogelijk worden om ze in de applicaties
106
niet rood, maar oranje te markeren. Dat vraagt echter ook aanpassing aan de applicaties.
107 1 Ruud Baars
Meer info: http://sourceforge.net/tracker/?func=detail&aid=1808861&group_id=143754&atid=756398