Програми за етикетирање текста на српском језику

  • Зоран Поповић Hemofarm, STADA

Abstract

Овај текст даје упоредни преглед постојећих језичких алата, односно програма за етикетирање, заснованих пре свега на методама машинског учења, уз конкретне тестове и резултате различитих програма над текстом на српском језику. У ту сврху су коришћени већ припремљени етикетирани корпуси и десетострука унакрсна провера (10-fold cross-validation), и посебно развијен поступак аутоматизованог тестирања реализованог unix скриптовима (bash, perl, awk) – TnT је показао најбоље перформансе, док су се Tree Tagger и SVMTool показали успешнијим у неким специјалним случајевима. Могућност упаривања различитих метода и програма за етикетирање, као и интеграција са другим окружењима за ОПЈ отварају могућност даљих испитивања оваквих решења.

Published
2024-03-07
How to Cite
ПОПОВИЋ, Зоран. Програми за етикетирање текста на српском језику. Infotheca - Journal for Digital Humanities, [S.l.], v. 11, n. 2a, p. 19-36, mar. 2024. ISSN 2217-9461. Available at: <https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/article/view/475>. Date accessed: 20 nov. 2024.