HLTen (Human Language Technologies) arloan hainbat eta hainbat gauza iker daitezke, egunero ikerketa taldeek ikerketa berriak hasten dituzte gizartearen jakintza eta bide berriak zabaltzeko. Azken urteotan hainbat gai jorratu dituzte, hona hemen horietatik batzuk:
- Makina bidezko itzulpena
- Diskurtsoaren parteen etiketazioa
- Morfologia eta fonologiaren indukzioa
- Lexikografia konputazionala
- TSABL: Euskal Hizkuntzaren Atlas Sintaktikoaren sorrera
- REMIXEE: Euskeraz emozioen errekonozimendu mixtoa
- Linguistika konputazionala etaHizkuntza Teknologiak bizitza errealean
- Ahotsaren errekonozimendu eta sintesia
- Anbiguitate lexikoaren resoluzioa
- Ahozko hizkuntzaren ulermenean markoak erabiltzea
Ikus daitekeenez gai asko jorratu eta ikertzen dituzte egun hizkuntza teknologietan adituek. Ni hauetako hirutan sakonduko naiz:
- MAKINA BIDEZKO ITZULPENA: linguistika konputazionalaren arloan (eta honetatik kanpo ere) makina bidezko itzulpenean ikertzen ari dira. Itzulpen hauek nahiko kaskarrak izaten dira zaila delako gramatika eta sintaxi arauak programatzea. Honi buruz ikertzen duten taldeek hitzez hitz egindako itzulpena gaitzetsi eta lengoaiaren arauak errespetatzen dituzten itzulpenak sortu nahi dituzte. Honetarako itzulpenean parte hartzen duten hizkuntzen ikerketa sakona egin behar da, gero programa informatikoari jakinduria hori trasmetitzeko.
- AHOTSAREN ERREKONOZIMENDU ETA SINTESIA: inteligentzia artifizialaren parte bat da eta honen bidez gizakiak makinekin ahozko komunikazioa bideratu nahi da. Ahotsaren gorabeherak ikertu behar dira eta gero makinei gorabehera horiek nola detektau irakatsi behar zaie. Ordenagailuak hizkuntza ulertzeaz gain anbiguitateak saihestu behar ditu, baita sinonimoak manaiatu ere. Arlo honetan ikertzen dutenek gizaki eta makinen arteko harremana gizakien artekoa bezalakoa izatea edo izatera hurbiltzea nahi dute.
- ANBIGUITATE LEXIKOAREN RESOLUZIOA: anbiguitate lexikoa konpontzea oso gauza garrantzitsua da hizkuntzalarientzat. Anbiguitate hau hainbat eratara konpon daiteke, baina errazena kontestuari begiratzea da. Kontestu bakoitzean hitzek esanahi bakarra dute eta testuingurua finkatzea oso garrantzitsua da esanahi anitzeko hitzek esanahi bakarra eduki dezaten. Hau komunikazio era guztietara zabaltzen da ahozkotik hasita ordenagailuenganako harremanera eta idatzitik eta beste komunikazio egoeretatik igaroz.
Bibliografia:
- DFKI (Deutsches Forchungszentrum für Künstliche Intelligenz), Language Technology Lab; martxoak 12, 11: 25 http://www.dfki.de/lt/projects.php
- Edinburgh Language Technology Group, Institute for Communicating and Collaborative Systems, University of Ediburgh; martxoak 12, 11.20 http://www.ltg.ed.ac.uk/
- IXA Group Natural Language Processing University of the Basque Country Computer Science Faculty, UPV – EHU, martxoak 12, 11.35 http://ixa.si.ehu.es/Ixa/Proiektuak
- National Centre for Language Technology, DCU, martxoak 10, 12.37 http://www.computing.dcu.ie/research/nclt/research.html
- Resolución Automática de la Ambigüedad Léxica fundamentada en el Modelo del Espacio Vectorial usando Ventana contextual Variable, v.v. a.a., 1998; kontsulta: martxoak 31, 18.30 http://www.esi.uem.es/~jmgomez/papers/aesla98.pdf
- The Stanford NLP Group; kontsulta: martxoak 12, 12.40 http://nlp.stanford.edu/
- European Network of Exellence in Human Language Technologies; kontsulta martxoak 12, 12.50 http://www.elsnet.org/
- Language Technology 2008, 28-29 otsaila, 2008; kontsulta: martxoak 31, 18.45 http://www.langtech.it/en
1 Comment(s)
Comments RSS TrackBack Identifier URI
Leave a comment

[...] Giza hizkuntzak teknologian sailkapen filologikoan Ø Ikerketa gai berriak HLTen arloan [...]