Обогаћивање ренесансних текстова властитим именима
Abstract
Циљ пројекта Реном је да обогати ренесансне текстове властитим именима. Ови текстови представљају два изазова: велику разноврсност услед различитог записивања речи; претрпаност великим бројем XML-TEI етикета које су уведене да би се сачувао тачан изглед оригиналног издања. Haш задатак се састојао од додавања етикета именованих ентитета овом формату за имена која нису већ била обележена и за контекст са њихове леве стране, а понекад и са десне стране. У ту сврху побољшали смо бесплатан програм у отвореног кода CasSys да бисмо анализирали текстове са Unitex-овим каскадама графова и направили смо посебне речнике и каскаде. Евалуација је показала да је стопа грешке била 6,1%. Ренесансни текстови обогаћени на овај начин користе се на веб-сајту који обједињује хуманистичке науке и туризам тако што омогућавају навигацију по мапама преко имена која се на њима налазе.
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.