Project

General

Profile

Start

Added by Ruud Baars over 8 years ago

Open source breekt af met patroonherkenning.
De beperkingen van de mechanismen zijn echter fors. Daarom willen we kijken hoe we meer uit de bestaande mogelijkheden kunnen halen of nieuwe mogelijkheden moeten creëren.


Replies (1)

RE: Start - Added by Bob vd Loo over 8 years ago

Lui,

Ik kom net tot de ontdekking dat de registratie van de woordgrenzen minder
ver is dan ik dacht, en minder kwaliteit heeft.

Ik moet daar de komende tijd dus een en ander aan doen om de invoer goed
te krijgen.

Taco, ik stel voor dat we kijken wat de mogelijkheden van een aangepaste
(of niet) patgen zijn met alleen de ings- en heids-woorden, specifiek met
belasting(s)- en leiding(s)- Die zijn lastig vanwege de tussen-s die wel
bij belasting komt als het om kracht gaat maar niet als het om geld gaat,
en leiding omdat het een s krijgt als het gaat om het leiden, maar niet
bij een pijp.

Harde afbrekers die regelmatig zijn zijn er ook: ings=s en heids=s en
eit=s bijvoorbeeld.

Op het woordniveau (dus voor de woordgrenzen) lijk het me raadzaam om en
rand waarin niet afgebroken wordt van 6 karakters aan te houden.

Verder denk ik, omdat de tussen-s formeel vrij is, om eigenlijk alleen
afbreekposities aan te geven aan het begin van een woord.
Dus 1test is een patroon, maar voor een langer woord als attest wordt het
dan:
1at2test
Door het zo te doen, maakt het niet uit of het een belastings-test is of
een belasting-test; het gaat in beide gevallen goed.
Maar dan hebben we het niet meer over de standaard patgen....

Wat ook zou kunnen, is de generator voeren met niet alleen de woorden uit
de woordenlijst, maar ook alle andere herkenbare samenstellingen. Die zijn
wel uit de oogst te vissen met programmatuur.

Goed, eerst maar eens zien wat we met belastings en leidings kunnen.

m.v.g.
Ruud

    (1-1/1)