Project

General

Profile

Het OpenTaal-beleid

Open en Gratis
Alles wat OpenTaal maakt en produceert is open en gratis te gebruiken. Daarom is voor een zeer vrij licentiemodel gekozen, waarbij alleen bronvermelding noodzakelijk is.

Spellingcontrole

We volgen de grote standaarden, zoals die van de Taalunie, en van de 'witte spelling'.

Dat er alleen een 'groene' spellingcontrole is, is het gevolg van de goede samenwerking met de Taalunie, terwijl een publicatie van een witte woordenlijst wordt geremd door juridische en commerciële beperkingen.

De criteria voor het opnemen of weglaten van een woord zijn:

  • opnemen als de relatieve frequentie van voorkomen van het woord in geschreven taal overtuigend is.
  • weglaten als het woord frequent een typefout is van een woord dat vaker voorkomt (voorbeeld: mar, si)
  • het moet gangbare schrijftaal zijn.
    Verder per categorie:
  • Plaatsnamen
    • Nederlandse plaatsnamen : opnemen
    • buitenlandse plaatsnamen
      • opnemen als het een Nederlandse vorm is van een locatie (Londen, niet London)
  • organisaties
    • verenigingen: Opnemen mits minstens 1 hoofdletter in eigennaam
    • overheidsorganen : Opnemen mits minstens 1 hoofdletter in eigennaam (kans op niet volgen donorprincipe is groot)
    • commerciële bedrijven : Opnemen, mits minstens 1 hoofdletter in eigennaam (kans op weglaten hoofdletters is groot)
    • ideële instellingen : opnemen (Mits 1 of meer hoofdletters in eigennaam)
  • Merken
    • populaire, sterke merken opnemen (bijvoorbeeld gangbare automerken) (Opel, BMW)
  • producten
    • populaire producten opnemen mits minstens 1 hoofdletter in elk deel van de naam (Opel Corsa)
  • Persoonsnamen
    • De meest gangbare in het NL taalgebied gebruikelijk voor- en achternamen worden opgenomen (dat zijn dus ook namen die geen Nederlandse oorsprong hebben als Sven, Mo et cetera). De gebruiksfrequentie is daarbij leidend. Controle in telefoongidsen en open registers indien beschikbaar.

Uitgangspunt is het voorkomen van verkeerde schrijfwijzen van het woord.

Frequentie

(Deze informatie voorlopig hier geparkeerd.) Er is een script om een histogram met woordfrequenties te exporteren. Dit dient een keer goed gedocumenteerd te worden en bij elke uitgave van de woordenlijst hier te worden geüpload: http://trac.enlightenment.org/e/ticket/566