Програми за етикетирање текста на српском језику

Зоран Поповић Hemofarm, STADA

Abstract

Овај текст даје упоредни преглед постојећих језичких алата, односно програма за етикетирање, заснованих пре свега на методама машинског учења, уз конкретне тестове и резултате различитих програма над текстом на српском језику. У ту сврху су коришћени већ припремљени етикетирани корпуси и десетострука унакрсна провера (10-fold cross-validation), и посебно развијен поступак аутоматизованог тестирања реализованог unix скриптовима (bash, perl, awk) – TnT је показао најбоље перформансе, док су се Tree Tagger и SVMTool показали успешнијим у неким специјалним случајевима. Могућност упаривања различитих метода и програма за етикетирање, као и интеграција са другим окружењима за ОПЈ отварају могућност даљих испитивања оваквих решења.

2010_2_sr_02.pdf

Published

2024-03-07

How to Cite

ПОПОВИЋ, Зоран. Програми за етикетирање текста на српском језику. Infotheca - Journal for Digital Humanities, [S.l.], v. 11, n. 2a, p. 19-36, mar. 2024. ISSN 2217-9461. Available at: <https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/article/view/475>. Date accessed: 29 july 2026.

Citation Formats

Issue

Vol 11 No 2a (2010): Инфотека - часопис за библиотекарство и информатику

Section

Articles

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

		Faculty of Philology, University of Belgrade
		University Library „Svetozar Marković“
		Association of Libraries of the Universities of Serbia

Програми за етикетирање текста на српском језику

Abstract

Publisher