Project

General

Profile

Wijzigingen in Hunspell die voor ons worden gemaakt » History » Version 3

Bart Knubben, 22-09-2010 21:11

1 1 Ruud Baars
h1. Wijzigingen in Hunspell die voor ons worden gemaakt
2
3
h2. Bug: checkcompoundfpattern does not detect flag-flag conflict. 
4
5
CHECKCOMPOUNDPATTERN /A /B should prevent words with flag A to be combined with flag B, but it does not.
6
7
h2. Bug: checkcompoundpattern does not work for compounding with more then 2 parts in all compounding methods
8
9
h2. Bug: a word forbidden by the flag FORBIDDENWORD sometimes still gets suggested by compounding.
10
11
h2. Feature request: Limit the wildness of offered alternatives by setting a max character distance (levenshtein?) and length. e.g.:
12
13
    MAXDIFF (number)
14
    MAXDIFF(min length) {max length} {max diff)
15
16
h2. Feature request: Introduction of the flag for probably wrong (words actually correct, but more likely to be a mistake):
17
18 2 Ruud Baars
    PROBABLEERROR
19 1 Ruud Baars
20
Though applications are not able to report this, this flag makes it possible to start preparing for it; a feature request to the applicattions will then follow.
21
22
By the way, this will also result in an API change.
23
24
h2. Feature request: Have a flag on the last compounding part specifying the word has to start with uppercase. 
25
26
(To force words ending with street to be uppercased)
27
28
h2. Bug: the 2 compounding mechanisms interfere.
29
30
h2. Bug: Keepcase not used in compounds
31
32
h2. Bug: option -G reports words which are not input (bad for testing)
33
34
h2. Feature request: add word border indicator to REP
35
36
h2. Bug: REP with >1 _ fails
37
38
h2. Bug: REP with non-letters in replacement fails
39 3 Bart Knubben
40
-----------------------------------
41
Noodzakelijk
42
1. Een woord dat expliciet is gemarkeerd als fout, maar met via samenstellingsmechanisme wordt gegene­
43
reerd, wordt wel als fout gezien, maar toch als alternatief aangeboden. Correctie hiervan is essentieel.
44
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2970239&group_id=143754&atid=756395
45
2. Er is een optie om af te dwingen dat een woord precies zo moet worden geschreven als het is opgeno ­
46
men, bijvoorbeeld dvd niet als DVD. Woorden die zo gemarkeerd zijn, verliezen die markering helaas als
47
er wordt samengesteld, zodat DVD-schrijver wel wordt geaccepteerd.
48
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395
49
Belangrijk
50
3. Als alternatieven worden soms heel vreemde samenstellingen aangeboden, die ook nog erg veel ver­
51
schillen met het foutieve woord. Dit kan beperkt worden door gegenereerde samenstellingen op 'verschil'
52
met het foutieve woord te beoordelen, gerelateerd aan de lengte van het woord. Dit resulteert in minder
53
verbazingwekkende en onzinnige woorden in de suggesties.
54
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2970237&group_id=143754&atid=756395
55
4. Er is een mechanisme aanwezig dat voorkomt dat twee opeenvolgende delen aan elkaar worden ge­
56
plakt. Zoals bijvoorbeeld woon+werk. Dit mechanisme kan allerlei fouten efficiënt voorkomen. Helaas werkt
57
het niet op alle delen van samenstellingen, maar alleen op de laatste twee, wat niet goed genoeg is voor
58
het Nederlands. Met deze aanpassing wordt het tegenhouden van foutieve samenstellingen robuuster.
59
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2970240&group_id=143754&atid=756395
60
5. Hetzelfde mechanisme zou ook voor woordsoorten moeten kunnen werken, bijvoorbeeld functie+functie,
61
met vlaggen. Ook die werkt niet. Met deze aanpassing wordt het tegenhouden van foutieve samenstellin­
62
gen robuuster.
63
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2970242&group_id=143754&atid=756395
64
6. Hunspell kent 2 samenstellingsmechanismen. De ene is meer geschikt voor regelmatige woorden als
65
getallen, de andere meer voor normale samenstellingen. Deze twee mechanismen verstoren elkaar echter.
66
Bij verbetering wordt het mogelijk om alle uitgeschreven getallen correct te ondersteunen en samenstellin ­
67
gen als 'dikkemannentest' succesvol te ondersteunen.
68
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2999225&group_id=143754&atid=756395
69
7. Een mogelijkheid om bij een samenstellend deel aan te geven dat het samengestelde woord met een
70
hoofdletter geschreven dient te worden. Dat maakt het mogelijk om bij straat, plein e.d. de juiste suggestie
71
te doen zonder alle straatnamen op te nemen.
72
Meer info: http://sourceforge.net/tracker/?func=detail&aid=2999224&group_id=143754&atid=756395 en
73
http://sourceforge.net/tracker/?func=detail&aid=1689683&group_id=143754&atid=756398
74
8. Voor bepaalde letterreeksen kan een waarschijnlijke vervanger worden opgegeven, bijvoorbeeld enzo
75
=> en zo. Helaas wordt dan die spatie aangeboden bij elk woord waar enzo in zit (helaas dus ook bij boe ­
76
kenzolder), en niet bekend is. Het verzoek is om in de vervangingsregel de woordgrenzen aan te kunnen
77
geven, [enzo]=>[en zo]. Dit voorkomt Engelse ziekte.
78
Meer info: http://sourceforge.net/tracker/?func=detail&aid=3000055&group_id=143754&atid=756395
79
9. Hetzelfde mechanisme faalt met meer dan een spatie. Bepaalde foutief aan elkaar geschreven woord ­
80
groepen kunnen daarom niet succesvol opgesplitst worden aangeboden.
81
Meer info: http://sourceforge.net/tracker/?func=detail&aid=3018929&group_id=143754&atid=756395 en
82
https://sourceforge.net/tracker/?func=detail&aid=3008434&group_id=143754&atid=756398
83
                                                                                               Pagina 4/4
84
10. Hetzelfde mechanisme kan niet omgaan met leestekens zoals de apostrof, zodat suggesties sturen op
85
dat punt onmogelijk is.
86
Meer info: http://sourceforge.net/tracker/?func=detail&aid=3018930&group_id=143754&atid=756395
87
88
Wenselijk
89
11. Het zou mooi zijn als de mogelijkheid bestond om een woord dat op zich correct is, maar waarschijnlijk
90
fout (kunne, verassen) zo te kunnen markeren. Hierdoor zou het mogelijk worden om ze in de applicaties
91
niet rood, maar oranje te markeren. Dat vraagt echter ook aanpassing aan de applicaties.
92
Meer info: http://sourceforge.net/tracker/?func=detail&aid=1808861&group_id=143754&atid=756398