Alat za redijakritizaciju

Alat za auto­mat­sku redi­ja­kri­ti­za­ci­ju tek­sta kojem poten­ci­jal­no nedo­sta­ju dija­kri­ti­ci (npr. trans­for­mi­ra kuca u kuća ako je potreb­no). Toč­nost ala­ta jest 99.5% na stan­dard­nom jezi­ku i 99.2% na nestan­dard­nom jezi­ku.

Auto­ri
Niko­la Lju­be­šić, Tomaž Erja­vec, Dar­ja Fišer
Dostup­nost
Alat je slo­bod­no dostu­pan u dva obli­ka:
  1. Za lokal­nu upo­ra­bu, pro­gram­ski kod i mode­li ala­ta mogu se pre­u­ze­ti sa slje­de­ćeg Git­Hub repo­zi­to­ri­ja.
  2. Ala­tu i inter­net­skom ser­vi­su može se pri­stu­pi­ti i pre­ko naše pro­gram­ske knji­ži­ce za Pyt­hon, koja se može pre­u­ze­ti sa CLARIN.SI Git­Hub repo­zi­to­ri­ja. Upu­stva za insta­la­ci­ju ReLDI pro­gram­ske knji­ži­ce sa Git­Hu­ba nala­ze se ovdje (na srp­skom). Alter­na­tiv­ni i naj­lak­ši način za insta­la­ci­ju jest kori­ste­ći PyPI iz komand­ne lini­je. (Detalj­ni­je upu­te tako­đer na Git­Hu­bu.)

Za obra­du veće koli­či­ne poda­ta­ka pre­po­ru­ču­je se dru­ga opci­ja, odno­sno kori­šte­nje ReLDI pro­gram­ske knji­ži­ce za Pyt­hon.

Publi­ka­ci­je
Niko­la Lju­be­šić, Tomaž Erja­vec, and Dar­ja Fišer (2016). Cor­pus-based dia­cri­tic resto­ra­ti­on for south sla­vic lan­gu­a­ges. Pro­ce­e­dings of the Tenth Inter­na­ti­o­nal Con­fe­ren­ce on Lan­gu­a­ge Reso­ur­ces and Eva­lu­a­ti­on (LREC’16). Por­to­rož, Slo­ve­nia. [Link] [.bib]


Licenca i citiranje

Sof­tver na ovoj stra­ni­ci dostu­pan je pod licen­com Apac­he Licen­se 2.0. Pre­u­zi­ma­njem se oba­ve­zu­je­te na pri­dr­ža­va­nje uslo­va licen­ce.

Pri­li­kom upo­tre­be sof­tve­ra oba­ve­zno je citi­ra­nje rado­va nave­de­nih uz nje­ga i stra­ni­ce ReLDI repo­zi­to­ri­ju­ma.