Израда синтетичког евалуативног скупа података за Српски SentiWordNet користећи велике језичке моделе

Саша Петалинкар University of Belgrade

Abstract

Ово истраживање представља израду синтетичког скупа за евалуацију Српског SentiWordNet-а, користећи велике језичке моделе (ВЈМ), с посебним нагласком на Мистрал модел. У светлу недостатка ресурса за анализу сентимента на српском језику, циљ истраживања је премошћавање овог јаза генерисањем скупа за евалуацију и унапређење алата за анализу сентимента на српском. Вредности поларитета сентимента из енглеског SentiWordNet-а аутоматски су мапиране на Српски Ворднет путем међујезичког индекса (ILI). Како би се ове вредности прецизније прилагодиле српском језику, креиран је посебан скуп за евалуацију. Иницијално је одабрано 500 синсетова из Српског Ворднета, на основу њихове усклађености са senti-pol-sr лексиконом и мапираним вредностима из SentiWordNet-а. Ови синсетови су класификовани према поларитету сентимента коришћењем Мистрал модела. Избалансирани подскуп од 75 синсетова насумично је издвојен, додатно профињен финијом градацијом сентимента и ручно прегледан. Резултати показују високу поузданост модела, са приближно 93,3% одговора који задовољавају постављене критеријуме прихватљивости, чиме се истиче ефикасност ВЈМ-ова попут Мистрала у аутоматизацији анализе сентимента за језике са мање развијеним ресурсима.

pdf (Cрпски)

Published

2025-03-17

How to Cite

ПЕТАЛИНКАР, Саша. Израда синтетичког евалуативног скупа података за Српски SentiWordNet користећи велике језичке моделе. Infotheca - Journal for Digital Humanities, [S.l.], v. 24, n. 1, p. 53-70, mar. 2025. ISSN 2217-9461. Available at: <https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/article/view/2024.24.1.3_sr>. Date accessed: 14 feb. 2026.

Citation Formats

Issue

Vol 24 No 1 (2024): Инфотека - часопис за дигиталну хуманистику

Section

Articles

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

		Faculty of Philology, University of Belgrade
		University Library „Svetozar Marković“
		Association of Libraries of the Universities of Serbia

Израда синтетичког евалуативног скупа података за Српски SentiWordNet користећи велике језичке моделе

Abstract

Publisher