Paket u Python-u koji podržava većinu južnoslovenskih jezika i sadrži tokenizator, modul za morfosintaktičko obeležavanje, lematizator, dependencijalni parser, kao i modul za prepoznavanje imenovanih entiteta. Za  hrvatski i srpski jezik dostupni su modeli za obradu kako standardnog tako i nestandardnog jezika koji se javlja na internetu. Tačnost modula za morfosintaktično obeležavanje je procenjena na ~94%, dok je tačnost lematizacije ~99%. Dependencijalno parsiranje postiže LAS (labeled attachment score) od ~0.9, dok prepoznavanje imenovanih entiteta postiže micro-F1 od ~0.9. Autor Nikola Ljubešić Publications Eksperimenti koji su...

Skup podataka SentiComments.SR sadrži sledeća tri korpusa: Glavni SentiComments.SR korpus, koji se sastoji iz 3490 komentara iz filmskog domena Filmski verifikacioni korpus, koji se sastoji iz 464 komentara iz filmskog domena Književni verifikacioni korpus, koji se sastoji iz 173 komentara iz književnog domena Glavni SentiComments.SR korpus je izgrađen korišćenjem komentara posetilaca sa sajta kakavfilm.com, koji sadrži filmske recenzije na srpskom jeziku. Građa za filmski verifikacioni koprus je dobijena sa dva druga sajta na srpskom sa recenzijama filmova - gledajme.rs i happynovisad.com....

ReLDI će 26. februara 2021. učestvovati u konferenciji Internationalisms in Slavic as a window into the architecture of grammar - InterSlavic 2020/2021, koju organizuje Univerzitet u Gracu. Apstrakt i prezentacija dostupni su ovde, a ukoliko želite da se pridružite nama i ostatku konferencije, uputstvo za registraciju naći ćete ovde....

Slovenački CLARIN centar CLASSLA nedavno je objavio novi BERT model koji uključuje hrvatski i srpski jezik. Model je dostupan na platformi HuggingFace, kao i njegova verzija prilagođena zadatku prepoznavanja imenovanih entiteta (v. ovde). U izradi modela učestvovao je Nikola Ljubešić....

ReLDI centar je nedavno ostvario saradnju sa Istraživačkim centrom Slovenačke akademije nauka i umetnosti na izradi korpusa vesti i komentara na temu jezika, na srpskom, hrvatskom i slovenačkom jeziku. Koordinator rada na korpusima bio je Vuk Batanović, a korpusi su dostupni ovde....

ReLDI resursi predstavljeni su 24. oktobra 2020. na konferenciji Primena slobodnog softvera i otvorenog hardvera na Elektrotehničkom fakultetu u Beogradu. Prezentaciju koju je držao Vuk Batanović i ostale materijale možete videti ovde....

Trogodišnje strateško partnerstvo UPSKILLS - UPgrading the SKIlls of Linguistics and Language Students, u kome učestvuju Tanja Samardžić i Maja Miličević Petrović, odobreno je za finansiranje u okviru programa Erasmus+, uz dodatno finansiranje švajcarske fondacije Movetia. Koordinator partnerstva je Univerzitet na Malti. U okviru partnerstva biće izrađeni nastavni materijali namenjeni studentima jezika i lingvistike na teme poput programiranja, istraživačkih metoda i kvantitativne analize....

Dvogodišnji projekat Advancing Novel Textual Similarity-based Solutions in Software Development - AVANTES odobren je za finansiranje u okviru programa posvećenog veštačkoj inteligenciji Fonda za nauku Republike Srbije. U projektu učestvuju članovi ReLDI-ja Vuk Batanović, Maja Miličević Petrović i Tanja Samardžić. Projekat je posvećen proučavanju odnosa između semantike programskog koda i značenja komentara u kodu pisanih na prirodnim jezicima. Rešenja za probleme kategorizacije komentara, određivanja semantičke sličnosti tekstova različitih dužina i semantičke pretrage će biti razvijena kako za srpski tako i...

ReLDI je 6. maja 2020. učestvovao u prvoj CLASSLA (online) radionici. Više informacija (i nekoliko slika) možete pronaći ovde....

Nedavno osnovani CLARIN centar za južnoslovenske jezike (CLARIN knowledge centre for South Slavic languages - CLASSLA) i ReLDI postigli su dogovor o bližoj saradnji. Iako CLASSLA ima širi spektar delovanja (sve južnoslovenske jezike) i aktivan je pre svega kao deo zajednice CLARIN ERIC, ReLDI ostaje značajan partner i pokretač bazičnih aktivnosti u Hrvatskoj, Srbiji i šire, čime se podstiče razvoj jezičkih tehnologija i poboljšava metodologija lingvističkih istraživanja....

Projekat Movetia priveden je kraju nakon uspešne (i zabavne!) letnje škole održane u Istraživačkoj stanici Petnica 1-13. jula 2019. Više informacija i fotografije možete videti ovde....

Članica ReLDI mreže Marija Runić (Univerzitet u Banjoj Luci) dobitnica je stipendije Fulbright (research grant) za akademsku 2019/20 sa istraživačkim projektom iz oblasti lingvistike i obrazovanja pod nazivom 'It's High Time: Linguistics in High Schools'. Istraživanje će se sprovoditi na univerzitetu Western Washington u Bellinghamu u saradnji sa prof. Kristin Denham. Tokom boravka na WWU Marija Runić će držati predmet 'Language and Society: Language(s) of the Balkans' na Odsjeku za lingvistiku, u okviru koga će američkim studentima predstaviti jezičku situaciju...

Jezična akomodacija na Twitteru: Primjer Srbije Slavistična revija, 67(1), 87-106. Nikola Ljubešić, Maja Miličević Petrović, Tanja Samardžić Novi rad članova ReLDI-ja o srpskom, napisan na hrvatskom i objavljen u slovenačkom časopisu - potpuno oslikava duh našeg naučnog pristupa pitanjima jezika.  ...

Autor Sabina Halupka-Rešetar Sadržaj i opis Upitnik za ispitivanje modifikacije molbi u engleskom kao jeziku struke Preuzimanje instrumenta Upitnik za ispitivanje modifikacije molbi u engleskom kao jeziku struke Radovi Halupka-Rešetar, Sabina (2014). Request modification in the pragmatic production of intermediate ESP learners. ESP Today 2: 29-47. [Link] Citiranje ove stranice Halupka-Rešetar, Sabina (2019). Survey on request modification. ReLDI - Regional Linguistic Data Initiative platform. http://reldi.spur.uzh.ch/hr-sr/instrumenti-halupka-rešetar2014b....

Autor Sabina Halupka-Rešetar Sadržaj i opis Upitnik za ispitivanje pragmatičke kompetencije u engleskom kao stranom jeziku (iskazivanje komplimenata) Preuzimanje instrumenta Upitnik za ispitivanje pragmatičke kompetencije u engleskom kao stranom jeziku (iskazivanje komplimenata) Radovi Halupka-Rešetar, Sabina (2014). Compliment responses - a study of the pragmatic competence of advanced EFL students in Serbia. In T. Prćić et al. (Eds) Engleski jezik i anglofone književnosti u teoriji i praksi: Zbornik radova u čast Draginji Pervaz (pp. 173-191). Novi Sad: Filozofski fakultet. [Link] Citiranje ove stranice Halupka-Rešetar, Sabina (2019). Questionnaire on EFL pragmatic competence...

Članovi ReLDI mreže okupili su se 21. decembra 2018. u Zagrebu, na sastanku koji je održan na Institutu za hrvatski jezik i jezikoslovlje. Članovi mreže i njihovi gosti predstavili su svoje ideje za buduće projekte, čemu je usledila diskusija o različitim mogućnostima za regionalnu saradnju. Zahvaljujemo se svima na učestvovanju, a posebnu zahvalnost dugujemo lokalnoj organizatorki Kristini Štrkalj Despot, kao i gostoljubivom Institutu za hrvatski jezik i jezikoslovlje.   ...

Srpski korpus kratkih novinskih tekstova za određivanje semantičke sličnosti (STS.news.sr) sastoji se od 1192 para rečenica na srpskom, ili oko 64 hiljade tokena, prikupljenih iz novinskih izvora na internetu i napisanih na latinici. Svakom paru rečenica su ručno dodeljivane granulirane ocene semantičke sličnosti na skali od 0 do 5. Finalne ocene su dobijene kao prosek individualnih ocena pet anotatora. Parovi rečenica u ovom skupu podataka su preuzeti iz Srpskog korpusa parafraza (paraphrase.sr). Metodologija njihove anotacije je uglavnom pratila onu koja je...

Sledeći sastanak ReLDI mreže održaće se u Zagrebu 21. decembra 2018. Ukoliko biste želeli da prisustvujete, javite nam se preko kontakt obrasca....

Švajcarska agencija za razmene Movetia odobrila je projekat Revisiting research training in linguistics: theory, logic, method (projekat br. 2018-CH-IP-0012). U projektu učestvuju Tanja Samardžić i Maja Miličević u saradnji sa Genovevom Puskas sa Univerziteta u Ženevi. Cilj ovog projekta jeste da se sadržaj sličan temama ReLDI seminara uključi u nastavu na osnovnim studijama na Univerzitetima u Cirihu, Beogradu i Ženevi. Više podataka može se videti u objavi na stranicama Univerziteta u Cirihu....

Srpski korpus parafraza (paraphrase.sr) sastoji se od 1194 parova rečenica prikupljenih iz novinskih izvora na internetu. Svakom paru rečenica je ručno dodeljena binarna ocena sličnosti koja govori da li su rečenice u paru dovoljno semantički slične da bi se mogle smatrati bliskim parafrazama. Korpus sadrži 553 para rečenica za koje je procenjeno da su semantički ekvivalentne (46,31% od ukupnog broja), i 641 par semantički različitih rečenica (53,69% od ukupnog broja). Autor Vuk Batanović Dostupnost Korpus i njegova dokumentacija se mogu pronaći na paraphrase.sr GitHub...

Četiri ReLDI e-tečaja su otvorena i može im se pristupiti preko platforme Open edX @ Zurich. Više informacija dostupno je putem stranice posvećene e-učenju....

U periodu od 15.8. do 1.10.2017. biće otvorena četiri e-tečaja na platformi Open edX @ Zurich. Detaljnijim informacijama može se pristupiti preko stranice posvećene e-učenju....

ReLDI-NormTagNER-hr 2.1 je ručno anotirani korpus tvitova na hrvatskom. Ovaj korpus je zamišljen kao zlatni standard za obuku i testiranje sistema za tokenizaciju, razdvajanje rečenica, normalizaciju, morfosintaksičku obradu, lematizaciju i prepoznavanje imenovanih entiteta u nestandardnom jeziku. Svim tvitovima su automatski dodeljene oznake nivoa standardnosti (T = tehnički standard, L = lingvistički standard). Autori Nikola Ljubešić, Tomaž Erjavec, Vuk Batanović, Maja Miličević, Tanja Samardžić Dostupnost Puna verzija korpusa se može preuzeti iz repozitorijuma CLARIN.SI. Publikacija Izrada korpusa je (delimično) opisana u sledećem radu: Miličević, M. and N. Ljubešić...

ReLDI-NormTagNER-sr 2.1 je ručno anotirani korpus tvitova na srpskom. Ovaj korpus je zamišljen kao zlatni standard za obuku i testiranje sistema za tokenizaciju, razdvajanje rečenica, normalizaciju, morfosintaksičku obradu, lematizaciju i prepoznavanje imenovanih entiteta u nestandardnom jeziku. Svim tvitovima su automatski dodeljene oznake nivoa standardnosti (T = tehnički standard, L = lingvistički standard). Autori Nikola Ljubešić, Tomaž Erjavec, Vuk Batanović, Maja Miličević, Tanja Samardžić Dostupnost Puna verzija korpusa se može preuzeti iz repozitorijuma CLARIN.SI. Publikacija Izrada korpusa je (delimično) opisana u sledećem radu: Miličević, M. and N. Ljubešić...

Postovi o ReLDI-ju objavljeni su na blogu URPP Language and Space (autorka: Tanja Samardžić), i blogu infrasturukture CLARIN (autori: Ana Slavec i Jakob Lenardič)....

Peti ReLDI seminar održan je od 21. do 23. juna 2017. u Ljubljani. Na seminaru je bilo približno 50 učesnika, iz svih država-republika bivše SFRJ. Program i materijali dostupni su na stranici seminara. Hvala svim organizatorima koji su omogućili održavanje ovog dodatnog seminara, a posebno projektu JANES, koji se završava kada i ReLDI i sa kojim je uz Melanholike zajednički obeleženo nekoliko godina uspešnih aktivnosti. ...

Četvrti ReLDI seminar ukupno, a drugi u Zagrebu, održan je od 23. do 26. februara 2017. Program seminara i materijali dostupni su na stranici seminara. Na istoj stranici može se naći i lista učesnika sa kratkim biografijama. ...

U saradnji sa slovenačkim projektom JANES organizujemo dodatni ReLDI seminar, koji će se održati 21-23. juna 2017. u Ljubljani. Više informacija dostupno je na stranici seminara....

Drugi ReLDI seminar održan je od 26. do 29. januara 2017. u Beogradu. Program seminara i materijali dostupni su na stranici seminara. Lista učesnika sa kratkim biografijama sledi uskoro. ...

Adriano Ferraresi (Univerzitet u Bolonji) i Maja Miličević održali su 28. oktobra 2016. u Forliju seminar posvećen statističkoj analizi u (korpusnoj) lingvistici "Count your frequencies wisely! An introduction to concepts and methods in quantitative (corpus) linguistics". Glavni organizator seminara bio je Odsek za prevođenje Univerziteta u Bolonji....

Nikola Ljubešić je 29. septembra 2016. predstavio dva rada nastala u okviru ReLDI-ja na konferenciji "Language Technologies & Digital Humanities 2016" u Ljubljani: (1) Easily Accessible Language Technologies for Slovene, Croatian and Serbian (autori: Nikola Ljubešić, Tomaž Erjavec, Darja Fišer, Tanja Samardžić, Maja Miličević, Filip Klubička, Filip Petkovski); (2) Analysing spatial distribution of linguistic variables in geoencoded tweets from Croatia, Bosnia, Montenegro and Serbia (autori: Nikola Ljubešić, Tanja Samardžić, Maja Miličević)....

Drugi ReLDI seminar održan je od 27. do 30. juna 2016. u Zagrebu. Lista učesnika sa kratkim biografijama biće uskoro dostupna na stranici seminara, gde se već nalaze prezentacije i drugi materijali....

Ovaj paket uključuje četiri ranije objavljena algoritma za svođenje reči na srpskom i hrvatskom na njihov osnovni oblik, reimplementirana u programskom jeziku Java: Pohlepni i optimalni stemer za srpski zasnovan na obuhvatanju sufiksa, autori Vlado Kešelj i Danko Šipka Dorada pomenutog pohlepnog stemera, autor Nikola Milošević "Jednostavan stemer za hrvatski v0.1", autori Nikola Ljubešić i Ivan Pandžić Svi stemeri očekuju da je ulazni tekst kodiran u UTF-8 formatu. Izlazni tekstovi su takođe kodirani kao UTF-8. Autor Vuk Batanović Dostupnost Paket i detaljna dokumentacija mogu se...

Kolekcija filmskih recenzija na srpskom sastoji se od tri različita skupa podataka na srpskom koji su sastavljeni za zadatak analize sentimenta: Prikupljene filmske recenzije na srpskom (ISLRN 252-457-966-231-5) – neizbalansiran skup od 4725 filmskih recenzija na srpskom. SerbMR-2C – Skup filmskih recenzija na srpskom (2 klase) (ISLRN 016-049-192-514-1) – dvoklasan izbalansiran skup koji sadrži 1682 filmske recenzije sa označenim sentimentom (841 pozitivnu i 841 negativnu). SerbMR-3C – Skup filmskih recenzija na srpskom (3 klase) (ISLRN 229-533-271-984-0) – troklasan izbalansiran skup...

Ovde je opisana stara verzija alata čija je novija i unapređena varijanta trenutno dostupna u okviru NLP paketa, ali ne i u obliku veb servisa. Alat za automatsko označavanje na razini morfosintakse. Ima mogućnost označavanja hrvatskog i srpskog jezika, budući da sadrži modele za oba jezika. Označivač se temelji na algoritmu CRF (eng. conditional random forest) koji je treniran na ručno označenom korpusu hrvatskog jezika veličine 500.000 pojavnica u kombinaciji sa hrLex/srLex leksikonima za svaki od jezika. Skup morfosintaktičkih oznaka korištenih u korpusu...

Ovaj tekst je isečak iz doktorske disertacije T. Samardžić u prevodu Jelene Bošnjak i Ane Bjelogrlić. Pregled pojmova u tehničkom delu se najvećim delom oslanja na dva izvora, Baayen (2008) i Upton i Cook (1996). 3.3.1 Sumarne tabele U sve tri studije slučaja u ovoj disertaciji, opservacije (podaci) se pohranjuju kao dve vrste varijabli (promenljivih). Pravimo razliku između opservacija instanci, koje se odnose na karakteristike upotrebe glagola na nivou tokena, i opservacija tipova, koje se odnose na svojstva glagola kao zasebnih odrednica...

Ovde je opisana stara verzija alata čija je novija i unapređena varijanta trenutno dostupna u okviru NLP paketa, ali ne i u obliku veb servisa. Alat za automatsku tokenizaciju (razdvajanje teksta u riječi i rečenice) hrvatskog i srpskog jezika. Alat je izrađen koristeći reprezentativne podatke i može se koristiti na standardnom i nestandardnom jeziku. Autori Nikola Ljubešić, Tomaž Erjavec Dostupnost Tokenizator je slobodno dostupan u tri oblika: Za lokalnu uporabu, programski kod i modeli alata mogu se preuzeti sa sljedećeg GitHub repozitorija. Tokenizator se može...

Praktični zadatak okuplja niz aktivnosti tokom celog seminara koje imaju za cilj da polaznike usmere ka primeni znanja i veština stečenih na seminaru. Zadatak se radi po grupama (6 grupa) u toku vremena predviđenog za praktičan rad: Termin 1: Polaznici će osmisliti mini-studiju, definišući sledeće elemente: Pojava Pitanje Hipoteza/e Uzorak Metod Vrsta podataka Varijable Nacrt Zaključak Termin 2: Polaznici će ekscerpirati iz korpusa podatke koji će im koristiti u rešavanju zadatka. Termin 3: Polaznici će ispitati postavljene hipoteze uz pomoć jednostavnog statističkog...

Autori Vladan Pavlović, Miloš Jovanović Sadržaj i opis Upitnik za istraživanje stavova o odnosu jezika i nacionalnog identiteta Preuzimanje instrumenta Upitnik za istraživanje stavova o odnosu jezika i nacionalnog identiteta Radovi Pavlović, Vladan i Miloš Jovanović (2013). Stavovi studenata Univerziteta u Nišu o odnosu jezičkog i nacionalnog identiteta. Teme 38/2. 701-717. [Link] Pavlović, Vladan and Miloš Jovanović (2013). 'Language Nationalism' vs 'Language Cosmopolitanism': Divisions in the Attitudes towards the Relation between Language and National Identity''. In I. Spasić and P. Cvetičanin (Eds) Us and Them – Symbolic Divisions...

Autor Tanja Stipeć Sadržaj i opis Zadatak odabira slike Preuzimanje instrumenta Zadatak odabira slike Radovi Kraš, Tihana i Tanja Stipeć (2013). Interpretation of ambiguous subject pronouns in Croatian by people with Down syndrome and typically developing children. U S. Baiz, N. Goldman i R. Hawkes (Ur.), Proceedings of the 37th annual Boston University Conference on Language Development (str. 178–190). Somerville, MA: Cascadilla Press. Kraš, Tihana, Helena Rubčić i Tanja Stipeć (2015). Subject pronoun interpretation in Croatian: Comparing monolinguals with simultaneous bilinguals. U Cergol Kovačević, K. i Udier, S....

Autor Mile Vuković Sadržaj i opis Test čitanja reči za govornike srpskog jezika Preuzimanje instrumenta Test čitanja reči za govornike srpskog jezika Test čitanja reči za govornike srpskog jezika - obrazac Radovi Vuković, Mile (2015). Tretman afazija. 2. dopunjeno izdanje. Beograd: Univerzitet u Beogradu – Fakultet za specijalnu edukaciju i rehabilitaciju. Vuković, Mile, Irena Vuković, i Nick Miller (u štampi). Acquired dyslexia in Serbian speakers with Broca’s and Wernicke’s aphasia. Journal of Communication Disorders. [Link] Citiranje ove stranice Vuković, Mile (2016). Test čitanja reči. Platforma ReLDI - Regional Linguistic Data Initiative....

Počeli smo sa distribucijom resursa i alata razvijenih ili dorađenih u okviru projekta ReLDI. Detalji o pristupu i uslovima korišćenja za sada su dostupni na engleskoj verziji sajta....

Prvi ReLDI seminar održan je od 2. do 5. juna u Beogradu. Lista učesnika sa kratkim biografijama biće uskoro dostupna na stranici seminara, gde se već nalaze prezentacije i drugi materijali. [gallery ids="320"]...

Praktični zadatak ima za cilj da polaznike usmeri ka praktičnim primenama znanja i veština stečenih na seminaru. Zadatak se radi po grupama (6 grupa) u toku vremena predviđenog za praktičan rad: Termin 1: oko 1h pred kraj drugog dana seminara Termin 2: oko 2h pred kraj trećeg dana seminara Termin 3: četvrti dan seminara U Terminu 1 polaznici će ekscerpirati iz korpusa podatke koji će im koristiti u rešavanju zadatka. U Terminu 2 polaznici će osmisliti i delimično isprobati empirijsku studiju....

Ovaj tekst je prevedeno i prilagođeno originalno uputstvo, koje je dostupno na stranici Sketch Engine. Kako dobiti konkordance Prvo kliknite na polje "Home". Na početnoj stranici odaberite korpus koji želite da pretražujete. Unesite željeni upit u polje za pretragu. Upitom se mogu tražiti jedna ili više reči u nizu. Upitom unetim u polje pod nazivom "Simple Query" pretražuju se reči i leme (kod lematizovanih korpusa). Kod nekih korpusa, u zavisnosti od toga kako su podešene...

Autor Mile Vuković Sadržaj i opis Skrining test za afazije za govornike srpskog jezika Preuzimanje instrumenta Skrining test za afazije za govornike srpskog jezika Radovi Vuković, Mile, Bojana Drljan, i Irena Vuković (2014). Validacija skrining testa za afazije govornika srpskog jezika. Specijalna edukacija i rehabilitacija 1. 73-86. [Link] Citiranje ove stranice Vuković, Mile (2016). Skrining test za afazije za govornike srpskog jezika. Platforma ReLDI - Regional Linguistic Data Initiative. http://reldi.spur.uzh.ch/hr-sr/instrumenti-vukovic2010/....

Ovde je opisana stara verzija alata čija je novija i unapređena varijanta trenutno dostupna u okviru NLP paketa, ali ne i u obliku veb servisa. Alat za automatsku lematizaciju (svođenje površinskog oblika riječi na njen kanonski, odnosno rječnički oblik). Alat pretražuje leksikone hrLex/srLex, a za lematizaciju nepoznatih riječi koristi prediktivni model koji je treniran na dostupnim korpusima i leksikonima. Autori Nikola Ljubešić Dostupnost Lematizator je slobodno dostupan u tri oblika: Za lokalnu uporabu, programski kod i modeli alata mogu se preuzeti sa sljedećeg GitHub repozitorija. ...

SETimes.SR je referentni trening korpus srpskih tekstova prikupljenih iz SETimes paralelnog korpusa novinskih članaka. On sadrži 163 dokumenta, podeljena na 3891 rečenicu, odnosno 86 726 tokena. Korpus je ručno označen na nivou: Segmentacije na tokene, rečenice, i dokumente Morfosintaktičkih oznaka Lema Sintaksnih dependencija Imenovanih entiteta Skup morfosintaktičkih oznaka korišćenih u korpusu u skladu je sa smernicama revidiranog MULTEXT-East V5 skupa oznaka za bosanski, hrvatski i srpski, a dostupan je ovde. Sintaksne dependencije su označene prema specifikaciji Universal Dependency v2 (UDv2). Oznake imenovanih entiteta su date...

hr500k je referentni trening korpus hrvatskih tekstova koji sadrži 900 dokumenata podijeljenih u 24 794 rečenice, ili 506 457 pojavnice. On predstavlja proširenje prethodnih označenih korpusa hrvatskog jezika, poput SETimes.HR i SETimes.HR+. Korpus je ručno označen na razinama: Segmentacije na pojavnice, rečenice, i dokumente Morfosintaktičke oznake Leme Ovisnosne sintakse Semantičkih uloga Imenovanih entiteta Cijeli korpus je označen na razininama leme i morfosintaktičke oznake. Skup morfosintaktičkih oznaka korištenih u korpusu u skladu je sa smjernicama revidiranog MULTEXT-East V5 skupa oznaka za hrvatski i srpski,...

srLex je flektivni leksikon srpskog jezika. Veličina leksikona jest 169,328 lema, odnosno 6,905,941 površinskih oblika. Svaka natuknica u leksikonu sastoji se od osmorki u obliku (površinski oblik, lema, MSD, MSD odlike, UPOS, morfološke odlike, apsolutna frekvencija, frekvencija na milijun pojavnica). Frekvencije su procijenjene na temelju srWaCa, srpskog mrežnog korpusa. Skup morfosintaktičkih oznaka korištenih u korpusu u skladu je sa smjernicama MULTEXT-East V6 skupa oznaka za srpsko-hrvatski makrojezik, a dostupan je ovdje. Autori Nikola Ljubešić Dostupnost srLex se kao tekstualna datoteka za lokalnu uporabu može preuzeti ovdje. srLexu se također može pristupiti,...

hrLex je flektivni leksikon hrvatskog jezika. Veličina leksikona jest 164,206 lema, odnosno 6,427,709 površinskih oblika. Svaka natuknica u leksikonu sastoji se od osmorki u obliku (površinski oblik, lema, MSD, MSD odlike, UPOS, morfološke odlike, apsolutna frekvencija, frekvencija na milijun pojavnica). Frekvencije su procijenjene na temelju hrWaCa, hrvatskog mrežnog korpusa. Skup morfosintaktičkih oznaka korištenih u korpusu u skladu je sa smjernicama MULTEXT-East V6 skupa oznaka za srpsko-hrvatski makrojezik, a dostupan je ovdje. Autori Nikola Ljubešić Dostupnost hrLex se kao tekstualna datoteka za lokalnu uporabu može preuzeti ovdje. hrLexu se također može pristupiti,...

srWaC je mrežni korpus prikupljen sa .rs internetske domene. Inačica 1.1 sadrži 555 milijuna pojavnica. Korpus je automatski redijakritiziran, lematiziran te označen na morfosintaktičkoj razini. Razina ovisnosne sintakse bit će dodana u verziji 1.2. Skup morfosintaktičkih oznaka korištenih u korpusu u skladu je sa smjernicama revidiranog MULTEXT-East V5 skupa oznaka za hrvatski i srpski, a dostupan je ovdje. Autori Nikola Ljubešić, Filip Klubička Dostupnost Za lokalnu uporabu, tekstualna inačica srWaCa može se preuzeti ovdje. srWaCu se također može pristupiti, te ga se može pretraživati online, koristeći...

hrWaC je mrežni korpus prikupljen sa .hr internetske domene. Inačica 2.1 sadrži 1.4 milijarde pojavnica. Korpus je automatski redijakritiziran, lematiziran te označen na morfosintaktičkoj razini. Razina ovisnosne sintakse bit će dodana u verziji 2.2. Skup morfosintaktičkih oznaka korištenih u korpusu u skladu je sa smjernicama revidiranog MULTEXT-East V5 skupa oznaka za hrvatski i srpski, a dostupan je ovdje. Autori Nikola Ljubešić, Filip Klubička Dostupnost Za lokalnu uporabu, tekstualna inačica hrWaCa može se preuzeti ovdje. hrWaCu se također može pristupiti, te ga se može pretraživati online, koristeći...

Alat za automatsku redijakritizaciju teksta kojem potencijalno nedostaju dijakritici (npr. transformira kuca u kuća ako je potrebno). Točnost alata jest 99.5% na standardnom jeziku i 99.2% na nestandardnom jeziku. Autori Nikola Ljubešić, Tomaž Erjavec, Darja Fišer Dostupnost Alat je slobodno dostupan u dva oblika: Za lokalnu uporabu, programski kod i modeli alata mogu se preuzeti sa sljedećeg GitHub repozitorija. Alatu i internetskom servisu može se pristupiti i preko naše programske knjižice za Python, koja se može preuzeti sa CLARIN.SI GitHub repozitorija. Upustva za instalaciju...

Počela je prijava za drugi ReLDI seminar na Filozofskom fakultetu u Zagrebu od 27. do 30. juna 2016. Detaljnije informacije i obrazac prijave se nalaze na stranici seminara.Edit Edit date and time...

Autor Tihana Kraš Sadržaj i opis Rečenice iz zadatka odabira slike Preuzimanje instrumenta Rečenice iz zadatka odabira slike Radovi Kraš, Tihana (2008). Anaphora resolution in Croatian: Psycholinguistic evidence from native speakers. U M. Tadić, M. Dimitrova-Vulchanova i S. Koeva (prir.), Proceedings of the Sixth International Conference Formal Approaches to South Slavic and Balkan Languages. Zagreb: Croatian Language Technologies Society – Faculty of Humanities and Social Sciences. 67-72. [Link] Citiranje ove stranice Kraš, Tihana (2016). Zadatak odabira slike za ispitivanje (ne)izrečenih subjektnih zamjenica u hrvatskom jeziku. Platforma ReLDI - Regional...

Autor Maja Miličević Sadržaj i opis 1. Sociodemografski upitnik 2. Offline zadatak procene prihvatljivosti 3. Online zadatak procene prihvatljivosti Preuzimanje instrumenta Sociodemografski upitnik Uputstvo za offline zadatak Offline zadatak - ListaA1 Offline zadatak - ListaB1 Offline zadatak - ListaC1 Offline zadatak - ListaD1 Uputstvo za online zadatak Online zadatak - ListaA (E-Prime .es2 dokument) Online zadatak - ListaB (E-Prime .es2 dokument) Online zadatak - ListaC (E-Prime .es2 dokument) Online zadatak - ListaD (E-Prime .es2 dokument) Radovi Miličević, Maja (2012). The possessive dative in Serbian as a valency phenomenon: a preliminary empirical study. U V. Ružić, M. Alanović i G....

Autor Maja Miličević Sadržaj i opis 1. Sociodemografski upitnik 2. Test nivoa znanja (cloze test) 3. Zadatak procene slike 4. Zadatak procene prihvatljivosti Preuzimanje instrumenta Sociodemografski upitnik Test nivoa znanja (cloze test) Zadatak procene slike Slike za zadatak procene slike Zadatak procene prihvatljivosti Ceo test (verzija za izvorne govornike, randomizacija A) Ceo test (verzija za izvorne govornike, randomizacija B) Rezultati istraživanja Rezultati svih zadataka Radovi Miličević, Maja (2007). The Acquisition of Reflexives and Reciprocals in L2 Italian, Serbian and English. Doktorska disertacija. Kembridž: Univerzitet u Kembridžu. [Link] Citiranje ove stranice Miličević, Maja (2016). Test za ispitivanje usvojenosti refleksivnih i recipročnih...

Autor Jelena Grubor Sadržaj i opis 1. Skala stavova prema (neologizmima) anglicizmima u srpskom jeziku 2. Skala procene korišćenja (neologizama) anglicizama 3. Registar leksičkih parova Preuzimanje instrumenta Grubor 2011 - Baterija za ispitivanje stavova prema anglicizmima u srpskom jeziku Radovi Grubor, Jelena (2011). Stav govornika srpskog jezika prema (neologizmima) anglicizmima u srpskom jeziku. Prilozi proučavanju jezika 42: 65–79. Citiranje ove stranice Grubor, Jelena (2016). Baterija testova za ispitivanje stavova prema anglicizmima u srpskom jeziku. Platforma ReLDI - Regional Linguistic Data Initiative. http://reldi.spur.uzh.ch/hr-sr/instrumenti-grubor2011/....

Autor Jelena Grubor Sadržaj i opis I: Baterija testova za utvrđivanje stavova prema učenju engleskog jezika 0. Sociodemografski upitnik 1a. Upitnik o istoriji učenja engleskog jezika 1b. Skala procene konteksta učenja engleskog jezika 2. Skala stavova prema učenju engleskog jezika 3. Skala socijalne distance (Bogardusova skala) 4. Skala aspiracija 5. Skala procene za utvrđivanje vannastavnog inputa II: Baterija testova za utvrđivanje stavova roditelja prema učenju engleskog jezika 1. Sociodemografski upitnik 2. Skala procene poznavanja jezika 3. Skala stavova prema učenju engleskog jezika Preuzimanje instrumenta Grubor 2012 - Baterija testova za utvrđivanje stavova prema učenju engleskog jezika Radovi Grubor,...

Počela je prijava za prvi ReLDI seminar na Filološkom fakultetu u Beogradu od 2. do 5. juna 2016. Detaljnije informacije i obrazac prijave se nalaze na stranici seminara....