Project

General

Profile

Feature #2126

Language-detectbestand maken op corpora uit SONAR

Added by Pander M over 6 years ago. Updated over 6 years ago.

Status:
New
Priority:
Low
Assignee:
Category:
Taalherkenning
Target version:
Start date:
Due date:
% Done:

0%

Estimated time:

Description

Language-detectbestand maken op corpora uit SONAR, zie [[https://code.google.com/p/language-detection/wiki/Tools]] en submit upstream.

History

#1 Updated by Pander M over 6 years ago

Doe dit ook voor short messages (sm)

#2 Updated by Bob vd Loo over 6 years ago

Mogelijk dat de licentie dit niet zo makkelijk toe laat, tenzij de resultaten alleen intern worden gebruikt.

"Nieuwe Producten" mogen alleen gebruikt worden door de gebruikers voor wie de licentie voor SoNaR is afgegeven.
NTU zal toestemming moeten geven om het product breder te mogen inzetten.

Wij gaan hiermee in gesprek met het NTU.
Meer info volgt.

#3 Updated by Pander M over 6 years ago

Bob vd Loo schreef:

Mogelijk dat de licentie dit niet zo makkelijk toe laat, tenzij de resultaten alleen intern worden gebruikt.

"Nieuwe Producten" mogen alleen gebruikt worden door de gebruikers voor wie de licentie voor SoNaR is afgegeven.
NTU zal toestemming moeten geven om het product breder te mogen inzetten.

Wij gaan hiermee in gesprek met het NTU.
Meer info volgt.

Het statische model voor taalherkenning gebruikt alleen statistische gegevens over de tekst in de vorm van kans dat bepaalde lettercombinaties voorkomen. Het maken van dit model is een onomkeerbaar proces en de originele tekst is niet uit het model af te leiden. Dit kan als argument gebruikt worden om, in ieder geval voor Stichting OpenTaal, dit soort afgeleide producten buiten de licentie te laten vallen.

#4 Updated by Pander M over 6 years ago

  • Category changed from WordsHarvester to Taalherkenning

Also available in: Atom PDF