Програми за етикетирање текста на српском језику
Abstract
Овај текст даје упоредни преглед постојећих језичких алата, односно програма за етикетирање, заснованих пре свега на методама машинског учења, уз конкретне тестове и резултате различитих програма над текстом на српском језику. У ту сврху су коришћени већ припремљени етикетирани корпуси и десетострука унакрсна провера (10-fold cross-validation), и посебно развијен поступак аутоматизованог тестирања реализованог unix скриптовима (bash, perl, awk) – TnT је показао најбоље перформансе, док су се Tree Tagger и SVMTool показали успешнијим у неким специјалним случајевима. Могућност упаривања различитих метода и програма за етикетирање, као и интеграција са другим окружењима за ОПЈ отварају могућност даљих испитивања оваквих решења.
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.