Project

General

Profile

Wijzigingen in Hunspell die voor ons worden gemaakt » History » Version 22

Ruud Baars, 22-01-2011 20:21

1 9 Ruud Baars
h1. Noodzakelijk/Essential
2 1 Ruud Baars
3 9 Ruud Baars
h2. Forbiddenword has to have highest priority
4 1 Ruud Baars
5 8 Ruud Baars
Een woord dat expliciet is gemarkeerd als fout, maar met via samenstellingsmechanisme wordt gegene­reerd, wordt wel als fout gezien, maar toch als alternatief aangeboden. Correctie hiervan is essentieel.
6 1 Ruud Baars
7 8 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2970239&group_id=143754&atid=756395
8 5 Bart Knubben
9 8 Ruud Baars
Test cases:
10 9 Ruud Baars
* make a compound using part 1, part 2 and part 3; forbid the compound, test by entering this compound minus 1 letter, check if word is suggested (should not be)
11
* forbid a word that as affix flags; check if all affixed forms are forbidden and are not suggested. (should not be)
12
* suggest a forbidden word using REP; check if it is suggested (should not be)
13 8 Ruud Baars
14 10 Ruud Baars
<pre>
15
Deze fout is succesvol gecorrigeerd, blijkens de 1e testversie (.13)
16 11 Ruud Baars
Succesfully corrected
17 10 Ruud Baars
</pre>
18 1 Ruud Baars
19 9 Ruud Baars
h2. Keepcase
20 1 Ruud Baars
21 9 Ruud Baars
Er is een optie om af te dwingen dat een woord precies zo moet worden geschreven als het is opgenomen, bijvoorbeeld dvd niet als DVD. Woorden die zo gemarkeerd zijn, verliezen die markering helaas als er wordt samengesteld, zodat DVD-schrijver wel wordt geaccepteerd.
22
23 1 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395
24
25 9 Ruud Baars
Testcases:
26
* create compound parts tv- and -tv, using the keepcase flags
27
* Test if word-TV and TV-word are accepted. They should not be.
28 1 Ruud Baars
29 12 Ruud Baars
<pre>
30 19 Ruud Baars
Afgedaan. Succesfully implemented 
31 12 Ruud Baars
</pre>
32
33 9 Ruud Baars
h1. Belangrijk/Important
34
35
h2. wilde suggesties/wild suggestions
36
37 16 Ruud Baars
Als alternatieven worden soms heel vreemde samenstellingen aangeboden, die ook nog erg veel ver­schillen met het foutieve woord. Dit kan beperkt worden door gegenereerde samenstellingen op 'verschil'
38 1 Ruud Baars
met het foutieve woord te beoordelen, gerelateerd aan de lengte van het woord. Dit resulteert in minder
39
verbazingwekkende en onzinnige woorden in de suggesties.
40
41 9 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=2970237&group_id=143754&atid=756395
42
43 12 Ruud Baars
<pre>
44 22 Ruud Baars
Solved by improving the general suggestion mechanism, but also by adding max difference for dictionary words and max compound suggestions.
45
However, this still allows for wild compounding suggestions, though limited in number.
46
In discussion.
47 12 Ruud Baars
</pre>
48
49 9 Ruud Baars
h2. Checkcompoundpattern should work for all compounding parts
50
51
Er is een mechanisme aanwezig dat voorkomt dat twee opeenvolgende delen aan elkaar worden ge­plakt. Zoals bijvoorbeeld woon+werk. Dit mechanisme kan allerlei fouten efficiënt voorkomen. Helaas werkt
52 1 Ruud Baars
het niet op alle delen van samenstellingen, maar alleen op de laatste twee, wat niet goed genoeg is voor
53
het Nederlands. Met deze aanpassing wordt het tegenhouden van foutieve samenstellingen robuuster.
54 9 Ruud Baars
55
info: http://sourceforge.net/tracker/?func=detail&aid=2970240&group_id=143754&atid=756395
56
57
Test cases:
58
* make compounds woon, werk and verkeer (first, middel last). Add checkcompoundpattern woon werk (oon wer?). woonwerkverkeer schould be seen as wrong.
59
* same parts, but replace checkcompoundpattern with erk verkee; result should be identical
60 11 Ruud Baars
61 1 Ruud Baars
<pre>
62 12 Ruud Baars
Succesvol gecorrigeerd.
63
Corrected.
64 11 Ruud Baars
</pre>
65
66 9 Ruud Baars
h2. Checkcompoundpattern with flags
67
68 1 Ruud Baars
Hetzelfde mechanisme zou ook voor woordsoorten moeten kunnen werken, bijvoorbeeld functie+functie,
69
met vlaggen. Ook die werkt niet. Met deze aanpassing wordt het tegenhouden van foutieve samenstellin­
70
gen robuuster.
71 9 Ruud Baars
72
info: http://sourceforge.net/tracker/?func=detail&aid=2970242&group_id=143754&atid=756395
73
74
Test cases:
75
* create compound parts prins and bisschop, both with same flag (e.g. Xf beside compounding flags). Add checkcompoundpattern /Xf /Xf. Then, prinsbisschop should be noticed as invalid word.
76 1 Ruud Baars
77 11 Ruud Baars
<pre>
78 13 Ruud Baars
Works. For just stem-collision or with derivatives too. zoutsuikertest now suggested zout-suikertest. Perfect.
79 11 Ruud Baars
</pre>
80
81 9 Ruud Baars
h2. Interfering compounding mechanisms
82
83 1 Ruud Baars
Hunspell kent 2 samenstellingsmechanismen. De ene is meer geschikt voor regelmatige woorden als
84
getallen, de andere meer voor normale samenstellingen. Deze twee mechanismen verstoren elkaar echter.
85 16 Ruud Baars
Bij verbetering wordt het mogelijk om alle uitgeschreven getallen correct te ondersteunen en samenstellingen als 'dikkemannentest' succesvol te ondersteunen.
86 1 Ruud Baars
87
info: http://sourceforge.net/tracker/?func=detail&aid=2999225&group_id=143754&atid=756395
88 12 Ruud Baars
<pre>
89 15 Ruud Baars
Werkt prima. Dus de uitgechreven getallen kunnen weer allemal succesvol worden ondersteund
90 12 Ruud Baars
</pre>
91 9 Ruud Baars
92
h2. Force start with capital
93
94
Een mogelijkheid om bij een samenstellend deel aan te geven dat het samengestelde woord met een
95 1 Ruud Baars
hoofdletter geschreven dient te worden. Dat maakt het mogelijk om bij straat, plein e.d. de juiste suggestie
96
te doen zonder alle straatnamen op te nemen.
97
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395 en
98
http://sourceforge.net/tracker/?func=detail&aid=1689683&group_id=143754&atid=756398
99
100 12 Ruud Baars
<pre>
101 20 Ruud Baars
Afgedaan. Succesfully implemented.
102 12 Ruud Baars
</pre>
103 1 Ruud Baars
104 12 Ruud Baars
h2. add word border to REP pattern
105 9 Ruud Baars
106 1 Ruud Baars
Voor bepaalde letterreeksen kan een waarschijnlijke vervanger worden opgegeven, bijvoorbeeld enzo
107 16 Ruud Baars
=> en zo. Helaas wordt dan die spatie aangeboden bij elk woord waar enzo in zit (helaas dus ook bij boekenzolder), en niet bekend is. Het verzoek is om in de vervangingsregel de woordgrenzen aan te kunnen
108 3 Bart Knubben
geven, [enzo]=>[en zo]. Dit voorkomt Engelse ziekte.
109
110 9 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=3000055&group_id=143754&atid=756395
111
112 10 Ruud Baars
<pre>
113
Deze fout is succesvol gecorrigeerd, blijkens de 1e testversie (.13)
114 11 Ruud Baars
Corrected.
115 10 Ruud Baars
</pre>
116
117 9 Ruud Baars
h2. REP with >1 space
118
119 3 Bart Knubben
Hetzelfde mechanisme faalt met meer dan een spatie. Bepaalde foutief aan elkaar geschreven woord ­
120 1 Ruud Baars
groepen kunnen daarom niet succesvol opgesplitst worden aangeboden.
121 3 Bart Knubben
Meer info: http://sourceforge.net/tracker/?func=detail&aid=3018929&group_id=143754&atid=756395 en
122 4 Bart Knubben
https://sourceforge.net/tracker/?func=detail&aid=3008434&group_id=143754&atid=756398
123 10 Ruud Baars
                                                                                               
124
<pre>
125 11 Ruud Baars
Deze fout is succesvol gecorrigeerd, blijkens de 1e testversie (.13)
126 10 Ruud Baars
Corrected
127 9 Ruud Baars
</pre>
128
129
h2. REP with special chars
130
131 4 Bart Knubben
Hetzelfde mechanisme kan niet omgaan met leestekens zoals de apostrof, zodat suggesties sturen op
132 1 Ruud Baars
dat punt onmogelijk is.
133 9 Ruud Baars
134 1 Ruud Baars
info: http://sourceforge.net/tracker/?func=detail&aid=3018930&group_id=143754&atid=756395
135
136 12 Ruud Baars
<pre>
137 21 Ruud Baars
In de nieuwe versie is dit gebrek niet meer aanwezig, mogelijk door het betere suggestie-mechanisme.
138 10 Ruud Baars
</pre>
139 3 Bart Knubben
140 9 Ruud Baars
h1. Wenselijk
141
142
h2. Confusing words
143
144
Het zou mooi zijn als de mogelijkheid bestond om een woord dat op zich correct is, maar waarschijnlijk
145 1 Ruud Baars
fout (kunne, verassen) zo te kunnen markeren. Hierdoor zou het mogelijk worden om ze in de applicaties
146
niet rood, maar oranje te markeren. Dat vraagt echter ook aanpassing aan de applicaties.
147
Meer info: http://sourceforge.net/tracker/?func=detail&aid=1808861&group_id=143754&atid=756398
148 12 Ruud Baars
149
<pre>
150
Open
151
</pre>