Креирање и анализа корпуса текстова jугословенских рок песама од 1967-2003.
Abstract
У раду се са теориjског и практичног аспекта анализира процес образовања и обраде корпуса текстова jугословенских рок песама од 1967-2003. За преузимање грађе и XML анотирање коришћене су Паjтон библиотеке lyricsmaster и yattag. Корпус jе прошао фазу препроцесирања, а XSL трансформациjом су генерисани основни статистички подаци. У апликациjама „Слово Маjстор” и LeXimir спроведена jе и аутоматска рестаурациjа диjакритика (а у другоj апликациjи и фреквенциjска анализа). Проналажење друштвено-политичких тема jе вршено у софтверу Unitex, док су преовлађуjуће теме визуализоване у TreeCloud апликациjи.