Класификација докумената из медицинског домена екстраховањем таксономиских концепата из MeSH онтологије
Abstract
Рад је настао као одговор на задатак класификације медицинских докумената, постављен током летње школе Keyword Search in Big Linked Data, одржане у оквиру Keystone COST акције 2017. године на Технолошком универзитету у Бечу. У њему се приказују резултати специфичног приступа класификацији, који се заснива на креирању минималних сурогата тескта. Као основа класификације коришћена је MeSH онтологија заснована на Medical Subject Headings тезаурусу. У текстовима, претходно класификованим помоћу таксономије ове онтологије, најпре се проналазе појмови од значаја, а потом се замењују таксономским референцама. Тако екстраховане референце, користе за класификацију унутар MeSH таксономије помоћу простог алгоритма, а резултати се евалуирају у односу на ручно класификоване документе.