Woordsoorten¶
Grafische weergave van woordsoorten
Werkwoordsvormen¶
| VBi | wij-vorm | wij lopen |
| VB1 | ik-vorm | ik loop |
| VB3 | hij-vorm | hij loopt |
| VBp | vtd | gelopen |
| PPn | lopend | |
| PPe | lopende | |
| VBh | wij-vorm vt | liepen |
| VBh1 | ik-vorm | loop |
| VBh3 | hij-vorm | loopt |
voor vormen als 'verzoeke' en 'neme' is nog geen markering gemaakt.
Ook voor uitzonderingen als 'jij kunt' (VB2) is geen markering gemaakt.
Persoonsvormen¶
| PO1 | ik |
| PO2 | jij |
| PO3 | hij, zij, u |
| POi | wij, zij |
Zelfstandige naamwoorden¶
| NN1 | Zelfstandig naamwoord, enkelvoud, de of het, basiswoord. | |
| NN1h | (het) huis | NN1h, basiswoord |
| NN1m | man | basiswoord |
| NN1f | vrouw | basiswoord |
| NN1d | (de-woord) | basiswoord, geslacht onduidelijk |
| NN2 | huizen | flexvorm (geen onderscheid in geslacht gemaakt nog) |
| NN1r | huisje | flexvorm (geen onderscheid in geslacht gemaakt nog) |
| NN2r | huisjes | flexvorm |
Bijvoeglijke naamwoorden¶
| AJn | bijvoeglijk | rood | basiswoord |
| AJe | met een e | rode | flexvorm |
| AJi | met een s (achter iets) | roods | |
| AJcn | vergrotend | roder | flexvorm |
| AJci | vergrotend | iets, roders | flexvorm |
| AJce | vergrotend met e | rodere | flexvorm |
| AJsn | overtreffend | roodst | flexvorm |
| AJse | overtreffend met e | roodste | flexvorm |
Zet on- voor een bijvoeglijk naamwoord, en er is een nieuw ontstaan. Is dat nu een flexvorm of een basiswoord?
Eigennamen¶
Eigennamen van personen¶
Namen van personen zijn lastig. Niet alleen zijn ze cultureel bepaald, er wordt ook met titels gegooid en voornamen verworden tot initialen. Initialen kunnen individuele letters, zijn, maar ook bijvoorbeeld Th. voor Theo.
Alle mogelijkheden voor het name-phrase zijn in een afzonderlijk overzicht opgenomen.
Je zou nog kunnen discussieren of de tussenvoegsels al dan niet deel uitmaken van de achternaam. Theoretisch leuk, maar niet zinvol voor de techniek, omdat de software de zin in stukken hakt bij spaties en leestekens.
Eigennamen van instituten¶
Telwoorden en rangtelwoorden¶
Zie de afzonderlijke overzichten met alle uitgeschreven telwoorden (NM) en rangtelwoorden (NMr).
Dan zijn er natuurlijk nog niet niet uitgeschreven getallen. Die zijn gemakkelijk geautmatiseerd herkenbaaar, zolang de juiste formaten maar worden gebruikt. Juist zijn (als reguliere expressie weergegeven):
- [0-9]{1,3}([.][0-9]{3,3}){0,}([,][0-9]{1,}){0,} of
- [0-9]{1,}([,][0-9]{1,}){0,}
Oftewel: als decimaalteken de komma, en eventueel als scheidingsteken voor de duizendtallen, en dan om de 3.
Datumgroepen¶
Dat is nog een lastige groep. Het meest gebruikelijk zijn:
15 januari
15 jan (is dit een terechte afkorting?
15 januari 1985
maandag 15 januari 1985
320 v. Chr.
Nog meer?
Tijden¶
Eenheden¶
In een zijn kan staan: 15 dingen. Dat is normaal, een telwoord groter dan 1 en een meervoudsvorm.
Er zijn echter woorden, waarbij dat anders loopt: eenheden. De weerstand is 15 ohm bij 10 volt.
Ziehier een overzicht met eenheden.
Speciale soorten woorden en hun relaties¶
(Hiervoor moet nog een codering worden bedacht)
Land : Italië
Land : Frankrijk
Volk : Fransen
Persoon van volk : m: Fransman (mv: Fransmannen), f: Française (Françaises)
Taal : Frans