11 Aug ReLDI-NormTagNER-sr 2.1
ReLDI-NormTagNER-sr 2.1 je ručno anotirani korpus tvitova na srpskom. Ovaj korpus je zamišljen kao zlatni standard za obuku i testiranje sistema za tokenizaciju, razdvajanje rečenica, normalizaciju, morfosintaksičku obradu, lematizaciju i prepoznavanje imenovanih entiteta u nestandardnom jeziku. Svim tvitovima su automatski dodeljene oznake nivoa standardnosti (T = tehnički standard, L = lingvistički standard).
Miličević, M. and N. Ljubešić (2016). Tviterasi, tviteraši or twitteraši? Producing and analysing a normalised dataset of Croatian and Serbian tweets. Slovenščina 2.0 4(2) link