ReLDI-NormTagNER-sr 2.1

ReLDI-Norm­Tag­NER-sr 2.1 je ruč­no ano­ti­ra­ni kor­pus tvi­to­va na srp­skom. Ovaj kor­pus je zami­šljen kao zlat­ni stan­dard za obu­ku i testi­ra­nje siste­ma za toke­ni­za­ci­ju, raz­dva­ja­nje reče­ni­ca, nor­ma­li­za­ci­ju, mor­fo­sin­tak­sič­ku obra­du, lema­ti­za­ci­ju i pre­po­zna­va­nje ime­no­va­nih enti­te­ta u nestan­dard­nom jezi­ku. Svim tvi­to­vi­ma su auto­mat­ski dode­lje­ne ozna­ke nivoa stan­dard­no­sti (T = teh­nič­ki stan­dard, L = lin­gvi­stič­ki stan­dard).

Auto­ri
Niko­la Lju­be­šić, Tomaž Erja­vec, Vuk Bata­no­vić, Maja Mili­če­vić, Tanja Samar­džić
Dostup­nost
Puna ver­zi­ja kor­pu­sa se može pre­u­ze­ti iz repo­zi­to­ri­ju­ma CLARIN.SI.
Publi­ka­ci­ja
Izra­da kor­pu­sa je (deli­mič­no) opi­sa­na u sle­de­ćem radu:
Mili­če­vić, M. and N. Lju­be­šić (2016). Tvi­te­ra­si, tvi­te­ra­ši or twit­te­ra­ši? Pro­du­cing and ana­lysing a nor­ma­li­sed data­set of Cro­a­ti­an and Ser­bi­an twe­ets. Slo­ven­šči­na 2.0 4(2) link


Licenca i citiranje

Resurs na ovoj stranici dostupan je pod licencom Creative Commons Attribution 4.0 International License (Autorstvo). Preuzimanjem se obavezujete na pridržavanje uslova licence.

Creative Commons License

Prilikom upotrebe resursa obavezno je citiranje radova navedenih uz njega i stranice ReLDI repozitorijuma.