Обогаћивање ренесансних текстова властитим именима

  • Дени Морел Université François-Rabelais de Tours, Laboratoire d'informatique, EA 6300
  • Натали Фрибургер Université François-Rabelais de Tours, Laboratoire d'informatique, EA 6300
  • Ирис Ескол Таравела Université d'Orléans, Laboratoire ligérien de linguistique, UMR 7270

Abstract

Циљ пројекта Реном је да обогати ренесансне текстове властитим именима. Ови текстови представљају два изазова: велику разноврсност услед различитог записивања речи; претрпаност великим бројем XML-TEI етикета које су уведене да би се сачувао тачан изглед оригиналног издања. Haш задатак се састојао од додавања етикета именованих ентитета овом формату за имена која нису већ била обележена и за контекст са њихове леве стране, а понекад и са десне стране. У ту сврху побољшали смо бесплатан програм у отвореног кода CasSys да бисмо анализирали текстове са Unitex-овим каскадама графова и направили смо посебне речнике и каскаде. Евалуација је показала да је стопа грешке била 6,1%. Ренесансни текстови обогаћени на овај начин користе се на веб-сајту који обједињује хуманистичке науке и туризам тако што омогућавају навигацију по мапама преко имена која се на њима налазе.

Published
2024-02-29
How to Cite
МОРЕЛ, Дени; ФРИБУРГЕР, Натали; ТАРАВЕЛА, Ирис Ескол. Обогаћивање ренесансних текстова властитим именима. Infotheca - Journal for Digital Humanities, [S.l.], v. 15, n. 1a, p. 30-41, feb. 2024. ISSN 2217-9461. Available at: <https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/article/view/326>. Date accessed: 20 nov. 2024.