Project

General

Profile

Log

Deze informatie moet eigenlijk als nieuws-item gepost worden en niet in de wiki

2008

11 september.
Bob en Ruud zijn begonnen aan het maken van een virtuele machine als oogster, die een groot deel van de load van de server afneemt.

22 augustus. Ruud
  • Deze week gewerkt aan de herkenning van buitenlandse woorden op basis van letterfrequenties. Eerst versie gemaakt en aan het testen.
  • Ook bezig met het handmatig nalopen van alle woordsplitsingen van woorden uit het groene boekje, om meer greep te krijgen op de tussen-s.
    17 augustus, Ruud
  • De woordenlijst 1886 (dank aan Jeroen Hellingman) met unmunch omgezet en in de database ingelezen.
  • De oorspronkelijke woordenlijst 1_00G nog een keer ingelezen en de waarden nog eens tegen de tabellen gecontroleerd.
  • De beoordelingsfunctie op de startpagina van de mogelijkheid om aan te geven wat fout is van wat weggehaald. Was kennelijk te ingewikkeld, want er werden steeds fouten gemaakt.
14 augustus, Ruud
  • De afgelopen dagen druk geweest met het tellen van letterfrequenties voor talen.
  • Jan heeft een begin gemaakt met het vullen van woordcategorie├źn
  • Reinout heeft een bestaande optie bekeken.
  • Bob is bezig met het analyseren van woordfrequenties per jaar. Dat kan een beeld geven van het in zwang raken en in onbruik raken van woorden. Denk aan 'fortuynisme'...
10 augustus, Ruud
  • vraag uitgezet op maling list om mee te helpen met de letterfrequentie-analyse.
  • hele woordentabel omgezet in tekstformaat en in stukken aan an het bieden aan de omspeller, om zo eventueel fouten er uit te halen, voordat we een en ander gaan aanbieden.
9 augustus, Ruud
  • ingestorte tabel words gerepareerd. Dat instorten van tabellen gebeurt me iets te vaak naar mijn zin. Database wordt waarschijnlijk zwaar belast.
  • opnieuw gestart met analyse van frequentei van lettercombinaties in woorden per taal. Zelf de telling van het Nederlands gestart.
  • Na het tegenkomen van een maateenheid alle eenheden van Wikipedia geplukt en alle grootte-indicatore ook, en die samen ge├źxpandeerd tot een totaallijst. Deze in de woordentabel gestopt om te laten tellen (want niet allemaal gebruikelijk)
  • Functie op startpagina aangepast zodat ook de combinatie verkeerd-goed wordt vastgelegd. De tabel waarin dat staat (corrections) is deel al gevuld met de resultaten van de omspeller van de NTU, en wordt nu aangevuld met de gebruikersinput. De bron staat er ook bij vermeld.
dagelijks, Ruud
  • Controle van opentaalbank/cron_logs om oude bestanden te verwijderen.
  • De laaste logs even bekijken of alle functies nog goed werken.