Project

General

Profile

Woordsoorten

Grafische weergave van woordsoorten

Werkwoordsvormen

VBi wij-vorm wij lopen
VB1 ik-vorm ik loop
VB3 hij-vorm hij loopt
VBp vtd gelopen
PPn lopend
PPe lopende
VBh wij-vorm vt liepen
VBh1 ik-vorm loop
VBh3 hij-vorm loopt

voor vormen als 'verzoeke' en 'neme' is nog geen markering gemaakt.
Ook voor uitzonderingen als 'jij kunt' (VB2) is geen markering gemaakt.

Persoonsvormen

PO1 ik
PO2 jij
PO3 hij, zij, u
POi wij, zij

Zelfstandige naamwoorden

NN1 Zelfstandig naamwoord, enkelvoud, de of het, basiswoord.
NN1h (het) huis NN1h, basiswoord
NN1m man basiswoord
NN1f vrouw basiswoord
NN1d (de-woord) basiswoord, geslacht onduidelijk
NN2 huizen flexvorm (geen onderscheid in geslacht gemaakt nog)
NN1r huisje flexvorm (geen onderscheid in geslacht gemaakt nog)
NN2r huisjes flexvorm

Bijvoeglijke naamwoorden

AJn bijvoeglijk rood basiswoord
AJe met een e rode flexvorm
AJi met een s (achter iets) roods
AJcn vergrotend roder flexvorm
AJci vergrotend iets, roders flexvorm
AJce vergrotend met e rodere flexvorm
AJsn overtreffend roodst flexvorm
AJse overtreffend met e roodste flexvorm

Zet on- voor een bijvoeglijk naamwoord, en er is een nieuw ontstaan. Is dat nu een flexvorm of een basiswoord?

Eigennamen

Eigennamen van personen

Namen van personen zijn lastig. Niet alleen zijn ze cultureel bepaald, er wordt ook met titels gegooid en voornamen verworden tot initialen. Initialen kunnen individuele letters, zijn, maar ook bijvoorbeeld Th. voor Theo.

Alle mogelijkheden voor het name-phrase zijn in een afzonderlijk overzicht opgenomen.

Je zou nog kunnen discussieren of de tussenvoegsels al dan niet deel uitmaken van de achternaam. Theoretisch leuk, maar niet zinvol voor de techniek, omdat de software de zin in stukken hakt bij spaties en leestekens.

Eigennamen van instituten

Telwoorden en rangtelwoorden

Zie de afzonderlijke overzichten met alle uitgeschreven telwoorden (NM) en rangtelwoorden (NMr).

Dan zijn er natuurlijk nog niet niet uitgeschreven getallen. Die zijn gemakkelijk geautmatiseerd herkenbaaar, zolang de juiste formaten maar worden gebruikt. Juist zijn (als reguliere expressie weergegeven):

  • [0-9]{1,3}([.][0-9]{3,3}){0,}([,][0-9]{1,}){0,} of
  • [0-9]{1,}([,][0-9]{1,}){0,}

Oftewel: als decimaalteken de komma, en eventueel als scheidingsteken voor de duizendtallen, en dan om de 3.

Datumgroepen

Dat is nog een lastige groep. Het meest gebruikelijk zijn:

15 januari
15 jan (is dit een terechte afkorting?
15 januari 1985
maandag 15 januari 1985
320 v. Chr.

Nog meer?

Tijden

Eenheden

In een zijn kan staan: 15 dingen. Dat is normaal, een telwoord groter dan 1 en een meervoudsvorm.
Er zijn echter woorden, waarbij dat anders loopt: eenheden. De weerstand is 15 ohm bij 10 volt.

Ziehier een overzicht met eenheden.

Speciale soorten woorden en hun relaties

(Hiervoor moet nog een codering worden bedacht)

Land : Italië

Land : Frankrijk
Volk : Fransen
Persoon van volk : m: Fransman (mv: Fransmannen), f: Française (Françaises)
Taal : Frans