Год. 14, бр. 2, децембар 2013.
Јелена Граовац
Универзитет у Београду,
Математички факултет, Катедра за рачунарство и информатику
КЛАСИФИКАЦИЈА ТЕКСТА ЗАСНОВАНА НА СРПСКОМ WORDNET-У
УДК: 811.163.41'322.2
Кључне речи: класификација докумената, wordnet, српски wordnet, морфолошки речник за српски језик.
Апстракт: У овом раду је приказана метода за класификацију текста на српском језику заснована на српском wordnet-у. Метода је вођена хипотезом да се укључивањем морфолошких, синтаксичких и семантичких информација садржаних у лексичким ресурсима може унапредити процес класификације текстова на српском језику, као једном од морфолошки богатијих језика. Коришћен је Ебарт-3 корпус који представља скуп новинских члана ка на српском језику подељених у три класе: економија, политика и спорт. Метода користи паметан одабир концепата из српског wordnet-a као представника сваке од класа, а сам одабир се врши на основу вредности уведене мере за тежину која квантификује значај концепта за дату класу. Проблем флексије у српском језику је решен коришћењем морфолошког речника за српски језик. Ради евалуације приказане методе коришћени су микропросечни и макропросечни показатељи прецизност, одзив и ф-мера.Добијени резултати су показали да се паметним избором концепата добијају бољи резултати него оришћењем свих концепата придружених доменима који одговарају класама, мада су домени дефинисани у wordnet-у, поред осталог, и због његове успешнијепримене на задатке класификације текста.
НАУЧНИ РАДОВИ
ЈЕЛЕНА ГРАОВАЦ
КЛАСИФИКАЦИЈА ТЕКСТА ЗАСНОВАНА НА СРПСКОМ WORDNET-У
Д. РАСЕЛ БЕЈЛИ, (ПРЕВЕЛА: ЈЕЛЕНА МИТРОВИЋ)
СТВАРАЊЕ ДИГИТАЛНЕ ИСТОРИЈЕ – СТУДИЈА СЛУЧАЈА: ПРОЈЕКАТ ДОРОВА ПОБУНА
СТРУЧНИ РАД
НЕВЕНА ПЕТРОВИЋ, АЛЕКСАНДАР НИКОЛИЋ, АГРОН БАКИУ
ПРИКАЗ МУЛТИМЕДИЈАЛНОГ ПРОЈЕКТА „КАКО СУ НАС ЗАСМЕЈАВАЛИ: РАДИВОЈЕ ЛОЛА ЂУКИЋ И НОВАК НОВАК(ОВИЋ)“
ПРИКАЗИ
ОЛИВЕРА НАСТИЋ
„FUTURE LIBRARY UNCONFERENCE 2013“ АТИНA, 9–10. ДЕЦЕМБAР 2013. ГОДИНЕ
АЛЕКСАНДРА АЏИЋ
БИБЛИОТЕЧКО-ИНФОРМАЦИОНИ СИСТЕМ НИБИС – ДЕСЕТ ГОДИНА У СЛУЖБИ БИБЛИОТЕКАРА