Год. 16, бр. ½, август 2016.

 

Јована Ковачевић, Јелена Граовац
Математички факултет,
Катедра за рачунарство и информатику

 

 Н-ГРАМСКИ ЗАСНОВАНА КЛАСИФИКАЦИЈА ТЕКСТА НА СРПСКОМ ЈЕЗИКУ ПРИМЕНОМ МЕТОДЕ СТРУКТУРАЛНИХ ПОДРЖАВАЈУЋИХ ВЕКТОРА

 

УДК: 811.163.41'322.2
Кључне речи: хијерархијска класификација текста, метода подржавајућих вектора, Ебарт корпус
Cажетак: У раду су представљени резултати класификације хијерархијски организованог корпуса докумената на српском језику коришћењем методе подржавајућих вектора (МПВ, енгл. SupportVectorMachine, SVM). Примењене су две технике класификације изведене из методе МПВ са структурним излазом: вишекласна равна (енгл. flat) и хијерархијска класификација. Модел заједничке репрезентације документа и клaсе или хијерархије класа којима документ припада, специфичан за овај облик МПВ методе, базиран је на н-грамима бајтова различите дужине. Коришћене су четири tf-idfстатистике које одређују  значајност н-грама за одређени документ. Описане технике и статистике тестиране су на хијерархијски структуираном подскупу Ебарт корпуса новинских текстова. Добијени резултати за оба типа класификатора на нивоу целог корпуса су приближни, док на нивоу појединачних класа хијерархијски тип класификатора показује боље резултате за већину класа са малим бројем текстова. 
 


 

 

                                                                                              


НАУЧНИ РАДОВИ

 

Јована Ковачевић, Јелена Граовац

Н-ГРАМСКИ ЗАСНОВАНА КЛАСИФИКАЦИЈА ТЕКСТА НА СРПСКОМ ЈЕЗИКУ ПРИМЕНОМ МЕТОДЕ СТРУКТУРАЛНИХ ПОДРЖАВАЈУЋИХ ВЕКТОРА

Миљана Младеновић

ОНТОЛОШКО ПРЕПОЗНАВАЊЕ РЕТОРИЧКИХ ФИГУРА

Тања Ивановић

ЛЕКСИЧКА АНАЛИЗА ДВОЧЛАНИХ ТЕРМИНОЛОШКИХ СИНТАГМИ ЕЛЕКТРОДИСТРИБУТИВНОГ СИСТЕМА

Милена Милинковић

 

СТРУЧНИ РАДОВИ

 

Гордана Недељков

ЕЛЕКТРОНСКЕ КЊИГЕ И НОВА ДИМЕНЗИЈА ЧИТАЊА

Милена Обрадовић, Александра Арсенијевић, Михаило Шкорић

ИЗРАДА МУЛТИМЕДИЈАЛНОГ ДОКУМЕНТА “YU РОК СЦЕНА”

 

ПРИКАЗИ

Владан Девеџић, Милан Крстић

РАЧУНАРСТВО У ДРУШТВЕНИМ НАУКАМА

Јелена Митровић

ПРИКАЗ ЕУРОЛАН 2015 ЛЕТЊЕ ШКОЛЕ ИЗ РАЧУНАРСКЕ ЛИНГВИСТИКЕ