23 Feb NLP paket za hrvatski i srpski jezik
Paket u Python-u koji podržava većinu južnoslovenskih jezika i sadrži tokenizator, modul za morfosintaktičko obeležavanje, lematizator, dependencijalni parser, kao i modul za prepoznavanje imenovanih entiteta. Za hrvatski i srpski jezik dostupni su modeli za obradu kako standardnog tako i nestandardnog jezika koji se javlja na internetu. Tačnost modula za morfosintaktično obeležavanje je procenjena na ~94%, dok je tačnost lematizacije ~99%. Dependencijalno parsiranje postiže LAS (labeled attachment score) od ~0.9, dok prepoznavanje imenovanih entiteta postiže micro-F1 od ~0.9. Autor Nikola Ljubešić Publications Eksperimenti koji su...