Xerka Alert Proiektua Informazio Sare Digitaleko testu informazioan azaltzen diren berrikuntza garrantzitsuak bildu eta banatzen dituHelburuak Proiektu honetan informazioa pilatu eta barreiatzeko sistema osatu bat eraiki nahi dugu, gainera erabiltzaileak berak pertsonalizatu dezakeena, izan ere, erabiltzaileak berari interesatzen zaion espazioa adierazi ahal izango du, normalean espazio konplexu eta gai anitzetakoa izango dena; eskaneatze eta kategorizazio eragileek erantzunen kalitateak algoritmoen bitartez erregulatzeko mekanismoak izango dituzte eta algoritmo horiek termino berriak aurkitu eta sarera sartzeko gai izango dira, hizkuntza naturala prozesatzeko eta automatikoki kategorizatzeko, hain zuzen. Helburu zientifikoak 1.- Hizkuntza naturala Prozesatzeko Teknologiak erabiltzaileak kontrolatzen duen Informazioa Berreskuratzeko sistema batean Gure apustua Hizkuntza Naturala Prozesatzeko metodoak, estatistika bayesiar teknikak eta informazioa pilatu eta bilatzeko metodo berritzaileak konbinatzean datza, honela erabiltzaileen behar espezifikoei egokitzeko gai den aplikazio bat lortzeko, dokumentu bildumak kategorizatzeko hauen edukien arabera. 2.- Testu dokumentuen kategorizazio tipologikoak dakarren problematikaren ikerketa (taxonomia) eta prototipo bat sortzea Arazo hau konpontzeko irtenbideak ikertu eta esperimentatzea oso interesgarria da, ez baita ez maila akademikoan ez eta enpresa mailan ere konpondu. 3.- Indexazio multidimentsionalean aurrerapenak izatea testu dokumentuetan edukiaren araberako bilaketak egiteko dauden arazoak ebazteko Badira indexatzeko metodo hibridoak, datu base berrietako indize lau tipikoak indexazio multidimentsionaleko egiturekin konbinatzen dituztenak, eta hauen gainean dokumentuen antzekotasunaren inguruko neurri alternatiboetan oinarritutako algoritmo ezberdinak aplikatzen dira. Metodo horien ikerketa helburu bat da, ez bakarrik testu dokumentuen bildumetarako, are urrunago, baita tipologia ezberdinetako multimedia dokumentuen kudeaketarako ere. Helburu teknologikoak Xerka Alerten helburu teknologikoak SYGEn erdietsitako helburuen eratorpen naturala dira, gure aurreko proiektu horren baliozkotasuna aski egiaztatua baitago (Neotec 2002-2003). Testu informazioa erabiltzaileen lan esparruan eta enpresen erabaki esparruan "kontestualizatzeko", SYGEren helburu espezifikoak lau ekintzatan laburbiltzen ziren (EXCOGE). Orain sistemaren aplikazio eremua zabalduko dugu, eta agertoki berri honetan erabiltzaileak berak deskribatu ahal izango du bere gaia, eta sortutako aldaketa edo berrikuntzen inguruko informazioa bakarrik jasoko du. Proiektu berri honen bultzada lagun dugula, hona hemen erdietsi nahi ditugun helburuak. 1. Hainbat prozesu kateatzea hiztegia aurkitu eta elikatzeko, Hizkuntza Naturala Prozesatzeko sistema eraginkor baten barnean 2. Dokumentuen tipifikaziorako eta kategorizazio aurreratu baterako sistema bat lantzea 3. Datu base hibrido bat eraikitzea, edozein bilaketa prozesatzaile eraginkorren euskarri gisa 4. Sistemaren erabiltzaile bakoitzarentzat hautemandako berrikuntzen banatzaile automatiko bat eraikitzea Proiektuaren garapen-kontsortzioa - Kontsortzio erakundeak
Produktuaren berrikuntzak Aurkezten dugun proiektua enpresaren lehiakortasuna mantentzeko interes estrategikoa duen arlo batean kokatzen da, Ezagutzaren Kudeaketan, alegia. Termino honen esanahia laburtzea ez da erraza. Izan ere, "Ezagutzaren Kudeaketa" terminoaren inguruko literatura bilatzaile arrunt batean bilatuz gero, pertsona batek bizi osoan irakur ditzakeen artikulu eta liburuak baino gehiago ateratzen dira eta, beraz, zaila da literatura horretatik interesgarrienak zein diren esatea. Aitzitik, tresna informatikoen aplikagarritasuna mugatua da informazioa eta ezagutza kudeatzeaz ari garenean. Erabiltzaileak dira eguneroko lanean muga hauen inplikazio praktikoak sumatzen dituztenak, bilaketa bilduma eta motorretatik garrantzizko dokumentuak soilik berreskuratzeko zailtasunetatik hasita, garrantzizkoak ez diren dokumentu pila itzultzen baitituzte. Aipatutako mugak dira, hain zuzen ere, SYGE gure proiektu aitzindariarekin gainditzen ditugunak. Dena den, Xerka Alerti esker aurrerapauso handi bat eman dugu kalitatearen bidean eta informazioaren teknologian oinarritutako ezagutza kudeatzeko tresnak bilatzeari dagokionez.
Proiektuaren inbertsioa eta iraupena Proiektu hau 2004 eta 2005 urteetan egingo da. Proiektuaren inbertsioa guztira: 1.059.000 €. Laguntza: I+G proiektu honek Industria, Merkataritza eta Turismo Ministerioaren laguntzak jaso ditu Profit 2004-2005 programaren bitartez, baita Eusko Jaurlaritzaren Industria Sailarena ere Intek 2004 programaren bitartez. |