FER English
 
PROJEKTI
   

Project
Acronym: SenseHive 
Name: SenseHive: Dinamički modeli za postepenu izgradnju leksičko-semantičkih resursa potpomognuti radom mnoštva 
Project status: From: 2015-10-01 To: 2018-09-30 (Completed)
Contract number:  
Action line:  
Type (Programme): HRZZ 
Instrument:  
Project cost: -
Project funding: -
Project coordinator
Organisation Name:  
Organisation adress:  
Organisation country:  
Contact person name:  
Contact person email:  
Croatian partner
Contact person names:  
Contact organisation unit:  
Contact person tel:  
Croatian partner
Organisation name:  
Organisation address:  
Contact person name: doc. dr. sc. Jan Šnajder
Contact person tel:
  Contact person fax:  
Contact person e-mail:  
Partners
Organisation nameCountry
Short description of project
Leksičko-semantički resursi igraju bitnu ulogu u obradi prirodnoga jezika i srodnih primjena poput pretraživanja informacija. Nažalost, njihova je izgradnja izuzetno skupa te je rijetko vođena praktičnim potrebama, što kod jezika sa slabije razvijenim resursima predstavlja naročit problem. Moguće rješenje jest izgradnja leksičko-semantičkih resursa potpomognuta radom mnoštva (engl. crowdsourcing). Premda se rad mnoštva pokazao izvedivim i znatno povoljnijim pristupom, još uvijek ne postoji cjelovita metodologija koja bi omogućila postepenu izgradnju vrlo velikih leksičko-semantičkih resursa. Cilj ovoga projekta jest upotpuniti ovu prazninu i istražiti računalne modele i metode za postepenu i učinkovitu izgradnju leksičko-semantičkih resursa potpomognutu radom mnoštva. Istraživanje će objediniti modele za dinamičan rad mnoštva, modele semantike temeljene na korpusu (distribucijske modele i tematske modele) te aktivno strojno učenje, te polučiti cjelovit i jezično neovisan radni okvir, tzv. SenseHive. SenseHive objedinjuje prilagodiv prikaz značenja i leksičko-semantičkih veza riječi temeljen na grafovima (SenseGraph) i postupke za njegovu postepenu izgradnju. Značenja riječi dinamički se razdjeljuju i stapaju na temelju analize ljudskih ocjena dobivenih nad podatcima ekstrahiranima iz korpusa. U prvoj fazi projekta izgradit ćemo prototip i upotrijebiti ga za ciljane eksperimente na podatcima na hrvatskom, slovenskom i engleskom jeziku s ciljem odgovaranja na relevantna istraživačka pitanja. Kao dokaz koncepta, u drugoj ćemo fazi primijeniti SenseHive za izgradnju leksičko-semantičkog resursa za hrvatski jezik umjerene veličine, proširivanjem i obogaćivanjem postojećih leksičko-semantičkih resursa. Predloženo će istraživanje unaprijediti stanje znanosti u području računalne semantike i poluatomatske izgradnje jezičnih resursa te rezultirati konkretnim leksičko-semantičkim resursom za hrvatski jezik od velike praktične vrijednosti.  
Short description of the task performed by Croatian partner
 


   

TRAŽILICA