ORTZIA LOREZ ETA LURRA IZARREZ

Just another WordPress.com weblog

EUSKAL WORDNET Junio 22, 2008

Archivado en: Edizio Digitala, Littera — ziortza @ 6:17 pm

Eli Pociellok euskarazko lehen ezagutza lexikala garatu du bere tesi-lanean, <<hitzei eta adierei buruzko informazioa duen datu base konplexua>>

Zer da Euskal Woednet?

Euskal WordNet (http://ixa2.si.ehu.es/mrc/wei.html), euskarazko ezagutza base lexikala da, IXA taldean garatu dena, WordNet ereduan oinarrituta. Hitzei eta adierei buruzko informazioa duen datu base konplexua da Euskal WordNet. Bertan hiztegi batek ematen duen informazioaz gain, sarrera lexikal (edo kontzeptu) bakoitzak dituen erlazio semantikoak ere kontsulta ditzakegu.

Hiztegi baten antza badu ere ez da hiztegia

Hiztegiak ez bezala munduko ezagutzari buruzko informazioa gordetzen duen gordailu egituratua da, hots, munduko entitateak eta beraien arteko erlazioak jasotzen ditu.

Adibidea:

Hatz

Hatz sarrera kontsultatuz gero: <<gizakiaren eskua edo oina bukatzen den bost zatietako bakoitza>> dela. Hori da esanahia, baina horretaz gain, beste hainbat informazio ere jaso dezakegu: hatza gorputzadar bat dela, hatz lodia hatz bat dela, hatzak eskuen zati bat direla, eskuak aldi berean besoaren zati bat direla, eta hatzak gauzak ukitzeko erabiltzen direla.

 

IXA TALDEA Junio 10, 2008

Archivado en: Edizio Digitala, Littera — ziortza @ 4:19 pm

Helburuak

Euskal Herriko Unibertsitateko Informatika Fakultateko IXA taldeak Lengoaia Naturalaren Prozesamenduan eginiko ikerketa-lana du helburu nagusi. Hizkuntz ingeneritza lez ere ezagutzen da mintzagai dugun alor hau. Euskararen gaineko ikerketa aplikatua da gure xede nagusia. Lan horretan diziplinarteko taldea osatzen du IXA taldeak informatikarien eta linguisten artean batez ere.

Azken helburua euskararako, teknologia berrien eragina hizkuntzan ahalik eta onena izan dadin.

Historia

IXA taldea 1987an sortu zen eta jasotako emaitza guztiak euskarari lotuak izan dira. Urteak aurrera joan ahala taldea eta zereginak handitu egin dira. 31 informatikari, 14 linguista eta beste alorretako adietuek osatzen dute talde hau.

Egindako proiektu finantzatuak 40tik gora dira. Hona hemen emaitza batzuk: (web orrialdean ongi agertzen den bezala:)

APLIKAZIO ETA TRESNA KOMERTZIALAK

  • EDBL (Euskararen Datu-Base Lexikala), 80.000 hitz inguruko datu-basea http://sipl54.si.ehu.es/edbl2000.
  • MORFEUS, estaldura zabaleko analizatzaile morfologikoa.
  • XUXEN, zuzentzaile/egiaztatzaile ortografiko komertziala (patentatua), Unix, Windows eta Mac-erako garatua. www.sc.ehu.es/xuxen-e.htm helbidean eskuragarri.
  • GAIN, internet/intraneterako bilatzaile adimenduna. Jalgin eta Euskaldunon Egunkariaren hemerotekan erabilia.
  • EUSLEM, euskararako lematizatzaile/etiketatzailea.
  • Multimeteo-euskara, eguraldi-iragarpenak euskaraz sortzeko sistema.
  • Elhuyar Hiztegia Word2000 testu-editorean integratua.

PROTOTIPOAK

  • HIZTSUA, hiztegi-sistema urgazle adimenduna.
  • ANHITZ, itzulpenean laguntzeko hiztegi adimenduna.
  • Hiztegixa, itzulpenean laguntzeko tresna.

IKERLERROAK

Ekuntza-baliabideak

Lehen

Orain

Gero

Corpus

corpus-I. Testu bilketa markaketa arinarekin

Testu-bilketa

100M hitz

corpus-II. Hitz bakoitza bere lema eta kategoriarekin etiketatuta

Aberasten

20 M hitz

 

corpus-III. Sintaktikoki etiketatutako testua
(50.000 hitz)

200.000 hitz

 

 

corpus-IV. Semantikoki etiketatutako testua
(50.000 hitz)

corpus-IV. Corpus eleanitza eta lerrokatua

Corpus eleanitza eta lerrokatua biltzen

100 M hitz

Lexikoa

EDBL datu-base lexikala. – Kategoria
- Inf. morfologikoa Aplikazio orokorrak eraikitzeko euskarria.

Bertsio hobetua (4.4.2) Aberasten:
-
Hitz anitzeko unitateak
- Aditz azpikategorizazioa

Aberasten:
-
Hitz anitzeko unitateak
- Aditz azpikategorizazioa
- Semantika

Hiztegi elektronikoak (MRD)

Hiztegi elektronikoak (MRD)

Hiztegi elektronikoak (MRD)

Morfo

Morfologiaren deskribapena

 

 

Sintaxia

Sintaxiaren deskribapena

Sintaxiaren deskribapena
- Esaldi-mugak
- Postposizioak
- Aditz azpikategorizazioa
- Menpekotasunak

Sintaxiaren deskribapena
- Estaldura zabala
- Hainbat formalismo
(Baterakuntza, CG)

Sem

Ezagutza-Base
lexiko-semantikoa.

Kontzeptu-taxonomia
Euskal WordNet

Beste hizkuntzetako corpusetatik informazioa eskuratzea
Aberasten eta hobetzen Euskal WordNet

 

Aberasten eta hobetzen Euskal WordNet
- Terminoak
- Entitateak
(izen bereziak)
- 100 mila sarrera

Tresnak

Lehen

Orain

Gero

Corpus

Corpusak sortu eta lantzeko tresnak

Corpusak sortu eta lantzeko tresnak

Corpusak sortu eta lantzeko tresnak

 

Lexiko-eskurapen automatikoa: Terminologia

 

Lexikoa

Hiztegien bertsio elektronikoak
- Ing-Eusk Morris
- Gazt-Eusk Elhuyar
- EH Ibon Sarasola

 

Lexikografoarentzako lan-postua (workbench)

Morfo
logia

Analizatzaile/Sortzaile morfologikoa

Hobetzen

 

Lematizatzaile/ Etiketatzailea

Hobetzen

 

Sintaxia

Azaleko sintaxia:
- Funtzio sintaktikoak
- Zatiak (Chunks)

Hobetzen
- Anbiguotasun
sintaktikoaren ebazpena

- Esaldi-mugak
- Postposizioak
- Aditz-azpikategorizazioa
- Menpekotasunak

Parserra
Estaldura zabala
Eraginkorra
Hainbat formalismo
- Murriztapen Gram. (CG)
- Baterakuntza
- Estatistikoak

Semantika

Adiera-desanbiguazioa (WSD)

WSD hobetzen
Ezagutza eleanitza

WSD hobetzen
Analisi semantikoa

Integrazioa

Tresnen integraziorako ingurune informatikoa


- XML estandarra
- TEI gida-lerroak

Tresna berriak integratzen
- morfosintaxia
- sintaxia

Hobetu

Aplikazioak

Lehen

Orain

Gero

Zuzentzaile ortografikoa

Bertsioak

 

 

Gramatika- eta estilo- zuzentzailea

 

Lematizazioa eta hizkuntza-bereizketa darabiltzan testuetarako
bilaketa-motorra
(search engine)

Informazio-bilaketa (Information Retrieval)

Informazio-erauzketa (Information Extraction)

Galdera-erantzutea
(Question Answering)
- hizkuntzen artekoa
Crosslingual
- Semantika erabiliz

Elhuyar Gazt-Eusk hiztegi elebidunaren integrazioa Word editorearekin

 

 

UZEIren sinonimo-hiztegiaren integrazioa Word editorearekin

 

 

Ibon Sarasolaren Euskal Hiztegiaren bertsio elektroniko aberastua

Hiztegi-kontsultarako sistema aurreratua

 

 

Baliabide lexikal heterogeneoen integrazioa

 

 

Bigarren hizkuntza ikasteko sistemak

 

 

Itzulpen-memorien sorkuntza

Itzulpen-memoriak (perpausa baino txikiago diren unitateak erabilita)

Itzulpen-laguntzak.
Integratuz:
- Hiztegiak
- Izen sintagmen itzulpena
- Esaldi sinpleen itzulpena
- Postediziorako laguntzak

Hobetzen
- Adibideetan oinarrituz
(Example based MT)
- Itzulpen-memoriak

 

 

 

Elkarrizketa-sistemak

O O O O O

 
 

 

 

 

EREDUZKO PROSA GAUR Abril 8, 2008

Archivado en: Edizio Digitala, Littera — ziortza @ 9:44 am

Sarrera:

Aurreko artikuluan Elhuyarreko corpusa aipatu nuen eta horregatik gaurkoan Ereduzko prosa gaur corpusean zentratukoa naiz.

Klasean aurkeztu behar dugun lanean bi corpus hauek landuko ditugu horregatik beharrezko ikusten dut corpus honen inguruko datu batzuk aipatzea.

Zergatik:

Euskararen inguruan dugun corpus zolienetakoa dela esan dezakegu. Euskal prosan oinarritua dago eta bilaketa arin eta erraza eskaintzen digu.

Ikus dezagun bada orriak berak sarreran esaten diguna: “gaur egungo hainbat euskal idazle ereduzkoren azken urteotako testuak bildu ditugu, horiekin corpus aski zabal bat eratuz. Corpus horri etekinik beteena ateratzeko aztergailu ahaltsu eta erabilerraz bat erantsi diogu”

Bilaketa modua:

1. Corpus arakatzailean klikatu behar dugu eta corpusera helduko gara.

2. Ezkerraldian agertzen zaigun zutabean nahi dugun hitza edo lema jarri eta aldizkari edo liburuetan hitz edo lema horren inguruan dagoen guztia azalduko zaigu.

3. Nahi izanez gero corpusa murrizteko aukera ere badaukagu.

Eginiko probak:

Proba gutxi egin ditudan arren bilaketa arin eta erraza egiteko aukera ematen digu gainera corpusa mugatzeko aukera ere badaukagu.

BURU :

Emaitza: 8674 agerraldi / 8300 esaldi
Libureetan: 3695 esaldi / 277 liburu
Prentsan: 4605 esaldi / 3623 artikulu

Bibliografia:

http://www.ehu.es/euskara-orria/euskara/ereduzkoa/

 

ELHUYAR CORPUSA Marzo 18, 2008

Archivado en: Edizio Digitala, Littera — ziortza @ 10:45 am

AURKEZPENA:ztcorpusari3qeq.jpg Buru hitza (I)

Elhuyar hiztegiaren corpusa erabiliko dugu kurtso amaierarako egin behar dugun proiektua garatzeko.

Zientzia eta Teknologiaren Corpusa, edo ZT corpusa, zientzia eta teknologiaren alorreko euskarazko testu-bilduma egituratu eta etiketatua da, eta alor horietako euskararen erabilera ikertzeko baliabidea izatea du helburu nagusia. Corpus berezi edo espezializatua da, eta UPV/EHUko IXA taldeak eta Elhuyar Fundazioak elkarlanean eratu dute. http://www.ztcorpusa.net/aurkezpena.htm

CORPUSA:

Epea:
1990-2002 (biak barne)
Eremuak:
Zientzia zehatzak
Materiaren eta energiaren zientziak
Lurraren zientziak
Biziaren zientziak
Teknologia
Orokorra
Bestelakoak
Generoak:
Oinarrizko hezkuntzako materiala
Goi-mailako liburua
Artikulu espezializatua
Dibulgazio-artikulua
Dibulgazio-liburua
Administrazio publikoko dokumentua
Egitura-etiketatzea:
TEI P4 (XML)
Automatikoa: testuaren egitura-ezaugarriak (atalburuak, atalak, azpiatalak, paragrafoak, zerrendak, taulak, oin-oharrak, irudi-oinak, eta abar.); nabarmentze-ezaugarriak (tipografikoak, hau da, letra-estiloa eta komatxo edo kakotxak)
Eskuz landua (gune orekatuko laginak): nabarmentze-ezaugarrien balioa (enfasia, aipua, atzerri-hitza, ohiz kanpoko adiera edo erabilera ironikoa, metahizkuntza, terminoa, izen berezia…)
Aurreprozesamendu linguistikoa (gune orekatuko laginak):
Corpusaren lexikoi osagarria elikatzea (EDBLn eta Elhuyar Hiztegian ez dauden eta corpusean atzeman diren maiztasun handiko lema espezializatuak)
Aldaeren normalizazioa (<reg> etiketa)
Akats ortotipografikoen zuzenketa (<corr> etiketa)
Etiketatze linguistikoa:
Erabilitako baliabide lexikalak: EDBL (http://ixa2.si.ehu.es/edbl/ )+ZT corpusaren lexikoi osagarria (Elhuyar Hiztegia+corpusaren aurreprozesamendu linguistikoan bildutako lexiko espezializatua)
Automatikoa:

  • lema eta kategoria
  • hitz anitzeko unitate ’seguruak’ eta marraz lotutako izen-elkarte diren lema konplexuak etiketatu dira, eta horien osagaien informazioa (lema eta kategoria) ere gorde da, horien araberako kontsultak egiteko aukera ere izateko
  • testu-hitz batek analisi bat baino gehiago dituenean (anbiguoa denean), desanbiguazio automatikoaren bidez analisi bat hobesten da, baina gainerako analisiak gorde egin dira
  • desanbiguazio automatikoa amaieran egin da, eskuz egindako desanbiguazio-lanetik ‘ikas’ dezan
Eskuz landua (gune orekatuko laginak):

  • desanbiguazioa: lema/kategoria mailako analisi bat baino gehiago ematen duten testu-formetarako analisi zuzena hautatu da
  • prozesamendu linguistikoan izandako akatsak zuzendu dira
  • aldaeren normalizazioa: EDBLn zehaztutako aldaera ez-estandarren agerraldiak aldaera estandarraren lemarekin etiketatu dira. EDBLn aldaeren estandartasuna ebazteko erabiltzen den iturria Euskaltzaindiaren Hiztegi Batua da
Tamaina:
Guztira: 7,6 milioi hitz (7.623.734)
Automatikoki landuak: 6 milioi hitz (5.989.976)
Automatikoki landuak eta gero eskuz berrikusiak eta zuzenduak: 1,6 milioi hitz (1.633.758)
Lema-kopurua:
Guztira: 136.792
Eskuz egiaztatuak: 69.921

NOLAKOA DA:

Galdera

…ien nola garraiatzen zuten soinua izurdeek azaletik <span onmouseout=”tip_it(0,”,”,”,”)” onmouseover=”tip_it(1,’Automatikoa, analisi anitzekoa, automatikoki hautatua = bilatutakoa’,'#E5E49A’,’burutu aditza – buru izena‘,’#C0C0C0′)”>buru barneko belarrietaraino, baina gaitasun horren misterioa ar…
… basora, bi tronpetari tronpetei puzka dituztela <span onmouseout=”tip_it(0,”,”,”,”)” onmouseover=”tip_it(1,’Automatikoa, analisi anitzekoa, automatikoki hautatua = bilatutakoa’,'#E5E49A’,’burutu aditza – buru izena‘,’#C0C0C0′)”>buru. Basoan haritz-abar hostotsuak ebakitzen dituzte, eta horie…
…tik sudur eta ahoraino etorriz. Bestea da baratxuri <span onmouseout=”tip_it(0,”,”,”,”)” onmouseover=”tip_it(1,’Automatikoa, analisi anitzekoa, automatikoki hautatua = bilatutakoa’,'#E5E49A’,’burutu aditza – buru izena‘,’#C0C0C0′)”>buru bat, bizitaraino zuritua, hartu eta umetokiaren barnean eza…
#objektua#Oloaren aleak ez dira <span onmouseout=”tip_it(0,”,”,”,”)” onmouseover=”tip_it(1,’Automatikoa, analisi anitzekoa, automatikoki hautatua = bilatutakoa’,'#E5E49A’,’burutu aditza – buru izena‘,’#C0C0C0′)”>buru batean agertzen, sorta moduan baizik. Alea, aldiz, gariaren…
Beste <span onmouseout=”tip_it(0,”,”,”,”)” onmouseover=”tip_it(1,’Eskuz zuzendua’,'#A1E6B5′,’buru izena‘,’#C0C0C0′)”>buru batean, Edouardo Manet: sortsez Kubatarra, handik joan-eta …
…desberdinean prestatzea izango da, alegia, famili <span onmouseout=”tip_it(0,”,”,”,”)” onmouseover=”tip_it(1,’Automatikoa, analisi anitzekoa, automatikoki hautatua = bilatutakoa’,'#E5E49A’,’burutu aditza – buru izena‘,’#C0C0C0′)”>buru batek erabiltzekoa, diru-hornidurak egitekoa edota elokuent…
…desberdinean prestatzea izango da, alegia, famili <span onmouseout=”tip_it(0,”,”,”,”)” onmouseover=”tip_it(1,’Automatikoa, analisi anitzekoa, automatikoki hautatua = bilatutakoa’,'#E5E49A’,’burutu aditza – buru izena‘,’#C0C0C0′)”>buru batek erabiltzekoa, diru-hornidurak egitekoa edota elokuent…
…una, eta, neurriz, orratz buru baten eta poxpolu <span onmouseout=”tip_it(0,”,”,”,”)” onmouseover=”tip_it(1,’Automatikoa, analisi anitzekoa, automatikoki hautatua = bilatutakoa’,'#E5E49A’,’burutu aditza – buru izena‘,’#C0C0C0′)”>buru baten artekoak dira. Hegodunak edo hego gabekoak izan daite…
…autza itxurakoa, antenaduna, eta, neurriz, orratz <span onmouseout=”tip_it(0,”,”,”,”)” onmouseover=”tip_it(1,’Automatikoa, analisi anitzekoa, automatikoki hautatua = bilatutakoa’,'#E5E49A’,’burutu aditza – buru izena‘,’#C0C0C0′)”>buru baten eta poxpolu buru baten artekoak dira. Hegodunak edo h…

Bibliografia:http://www.ztcorpusa.net/cgi-bin/kontsulta.py

IRUDIA:

Forma Kop.
 buruzko 4020
 buruz 3778
 burua 1553
 buruan 754
 buru 642
 buruaren 398
 buruari 335
 buruak 279
 buruko 237
 Beste guztiak 1143
 Guztira 13139

Guztien testuinguruak batera

 

BIBLIOGRAFIARI BURUZ HITZ BATZUK Marzo 11, 2008

Archivado en: Edizio Digitala, Littera — ziortza @ 11:24 am

Sarrera:

Bibliografia ongi aipatzea eta berau aipatzea geroz eta garrantzitsuagoa da. Gaur egun  hainbat arazo dago lan baten fidagarritasuna norainokoa den ikusteko. Askotan plagioagatik eta beste askotan bibliografia egokia aukeratu ez dogulako. Nire beharra ez da izango lan bat egiterako orduan erabili behar dugun bibliografiaren inguruko datuak edo gomendioak emotea, baina bai bibliografia modu egokian egituratzea.

lan hau egiteko ondoko web orrialdea erabili dut: http://library.duke.edu/research/citing/workscited/

Bibliografia nola aipatu: 

Bibliografia aipatzeko modu desberdinak daude kategoria berdin baten barruan eta hori da hain justu azalduko dudana.

Ikus dezagun bada:

  • Egunkarietako artikuluak:

Article from a printed journal

APA Brown,  E. (1996). The lake of seduction: Silence, hysteria, and the space of
feminist theatre. JTD: Journal of Theatre and Drama, 2, 175-200.

APA style includes the journal issue number only if each issue of the journal is paginated individually:
Kralj, M. M. (1994). Getting out of the box. Consulting Psychology Journal:
Practice and Research, 46
(2), 27-28.

Chicago Brown, Erella. “The Lake of Seduction: Silence, Hysteria, and the Space of
Feminist Theatre.” JTD: Journal of Theatre and Drama 2 (1996): 175-200. (Documentation One)

Chicago style generally includes the journal issue number:
Kralj, M. M. 1994. “Getting out of the box.” Consulting Psychology Journal:
Practice and Research
46 (2): 27-28.

Brown, Erella. 1996. The lake of seduction: Silence, hysteria, and the space of
feminist theatre. JTD: Journal of Theatre and Drama 2: 175-200. (Documentation Two)

Chicago style generally includes the journal issue number:
Kralj, M. M. 1994. Getting out of the box. Consulting Psychology Journal:
Practice and Research
46 (2): 27-28.

MLA Brown, Erella. “The Lake of Seduction: Silence, Hysteria, and the Space of
Feminist Theatre.” JTD: Journal of Theatre  and Drama  2  (1996): 175-200.

MLA style includes the journal issue number only if each issue of the journal is paginated individually:
Kralj, Mary M. “Getting out of the box.” Consulting Psychology Journal:
Practice and Research 46.2 (1994): 27-28.

Turabian Brown, Erella. “The Lake of Seduction: Silence, Hysteria, and the Space of
Feminist Theatre.”  JTD: Journal of Theatre and Drama  2  (1996):  175-200.

Turabian requires the journal issue number only if each issue of the journal is paginated individually:
Kralj, Mary M, “Getting out of the box,” Consulting Psychology Journal:
Practice and Research
46, no. 2 (1994): 27-28.

CSE Citation-Sequence
Brown E. The lake of seduction: Silence, hysteria, and the space of feminist theatre. JTD: J Theatre Drama 1996;2:175-200.

CSE requires the journal issue number only if each issue of the journal is paginated individually:
Kralj MM. Getting out of the box. Consulting Psychology Journal: Practice and Research 1994;46(2):27-8.

Name-Year
Brown E. 1996. The lake of seduction: Silence, hysteria, and the space of feminist theatre. JTD: J Theatre Drama 2:175-200.

CSE requires the journal issue number only if each issue of the journal is paginated individually:
Kralj MM. 1994. Getting out of the box. Consulting Psychology Journal: Practice and Research 46(2):27-8

 Articles with multiple authors

APA Jones, G., Hanton, S., & Connaughton, D. (2002). What is this thing called
mental toughness? An investigation of elite sport performers. Journal of
Applied Sport Psychology, 14, 205-218.
Chicago Jones, G., S. Hanton, and D. Connaughton.  2002.  What is this thing called
mental toughness? An investigation of elite sport performers. Journal of
Applied Sport Psychology  14: 205-218.
(Documentation One)

Jones, G., S. Hanton, and D. Connaughton. What is this thing called mental
toughness? An investigation of elite sport performers. Journal of Applied
Sport Psychology (2002) 14: 205-218.
(Documentation Two)
MLA Jones, Graham, Sheldon Hanton, and Declan Connaughton. “What is This
Thing Called Mental Toughness? An Investigation of Elite Sport
Performers.” Journal of Applied Sport Psychology 14 (2002): 205-218.
Turabian Jones, Graham, Sheldon Hanton, and Declan Connaughton. 2002. What is this
thing called mental toughness? An investigation of elite sport performers.
Journal of Applied Sport Psychology 14 (May): 205-218.
CSE Citation-Sequence
Jones G, Hanton S, Connaughton D. What is this thing called mental toughness? An investigation of elite sport performers. J Appl Sport Psychol 2002;14:205-18.

Name-Year
Jones G, Hanton S, Connaughton D. 2002. What is this thing called mental toughness? An investigation of elite sport performers. J Appl Sport Psychol 14:205-18.

Articles from an online journal

APA <!–

–> Evnine, S. J. (2001). The universality of logic: On the connection between
rationality and logical ability [Electronic version]. Mind, 110, 335-367.

Chicago No example given in the latest edition.
MLA Evnine, Simon J. “The Universality of Logic: On the Connection between
Rationality and Logical Ability.” Mind 110.438 (2001). 31 July 2001
<http://www3.oup.co.uk/mind/>.
Turabian Evnine, Simon J. “The Universality of Logic: On the Connection between
Rationality and Logical Ability.” Mind 110 (2001). Journal on-line. Available
from http://www3.oup.co.uk/mind.  Accessed 31 July 2001.

The sixth edition of Turabian has limited examples of citing electronic resources. This example is adapted from those examples.

CSE Recommends National Library of Medicine Format:

Evnine SJ. The universality of logic: On the connection between rationality and logical ability. Mind [Internet]. 2001 [cited 2001 Jul 31];110(438):335-67. Available from: http://www3.oup.co.uk/mind/hdb/Volume_110/Issue_438/pdf/1100335.pdf.

  • Aldizkarietako artikuluak:

Article from a printed magazine

APA Gawande, A. (2001, July 9). The man who couldn’t stop eating. The New
Yorker, 77, 66-75.
Chicago Gawande, Atul.  “The Man Who Couldn’t Stop Eating.” New Yorker, 9 July 2001,
66-75.
(Documentation One)

Gawande, A.  2001.  The man who couldn’t stop eating. New Yorker, 9 July,
66-75.
(Documentation Two)

MLA Gawande, Atul.  “The Man Who Couldn’t Stop Eating.” New Yorker  9 Jul. 2001:
66-75.
Turabian Gawande, Atul.  “The Man Who Couldn’t Stop Eating.”  New Yorker, 9 July 2001,
66-75.
CSE Citation-Sequence
Gawande A. The man who couldn’t stop eating. New Yorker 2001 Jul 9:66-75.

Name-Year
Gawande A. 2001 Jul 9. The man who couldn’t stop eating. New Yorker:66-75.

 

Article from an Online Magazine

APA Saletan, W. (2001, August 16). The ethicist’s new clothes.  Slate. Retrieved
August 17, 2001, from http://slate.msn.com/framegame/entries/
01-08-16_113959.asp
Chicago Saletan, William.  “The Ethicist’s New Clothes.” Slate, August 16, 2001,
http://slate.msn.com/framegame/entries/01-08-16_113959.asp.
MLA Saletan, William. “The Ethicist’s New Clothes.” Slate 16 August 2001. 17
August 2001 <http://slate.msn.com/framegame/entries/
01-08-16_113959.asp>
Turabian Saletan, William. “The Ethicist’s New Clothes.” Slate, 16 August 2001.
Magazine on-line. Available from http://slate.msn.com/framegame/entries/
01-08-16_113959.asp. Accessed 17 August 2001.

The 6th edition of A Manual for Writers of Term Papers, Theses, and Dissertations provides limited examples of citing electronic resources.The citation above is adapted from those examples.

CSE Recommends National Library of Medicine Format:

Saletan W. The ethicist’s new clothes. Slate [serial on the Internet]. 2001 Aug 16 [cited 2001 Aug 17]. [about 17 paragraphs]. Available from: http://slate.msn.com/framegame/entries/01-08-16_113959.asp.

  • Liburuak:

Autore bakarra

APA Fleming, T. (1997). Liberty!: The American revolution. New York: Viking.

APA era da gaur egun gehien erabiltzen dena beraz ez ditut beste moduak sartuko.

Bi autore

APA Sennett, R., & Cobb, J. (1972). The hidden injuries of class. New York: Vintage
Books.

Hiru autore edo gehiago

APA Schwartz, D., Ryan, S., & Wostbrock, F. (1995). The encyclopedia of TV game
shows. New York: Facts on File.

Liburu elektronikoak 

APA Norman, R. (1998).  The moral philosophers.  New York: Oxford University
Press. Retrieved August 14, 2001, from Duke University, Duke University
Libraries, netLibrary Web site: http://www.netlibrary.com

Artikuloz osaturiko liburuak 

APA Cassel, J., &  Zambella, B. (1996). Without a net: Supporting ourselves in a
tremulous atmosphere. In T. W. Leonhardt (Ed.), LOEX of the West:
Teaching and learning in a climate of constant change (pp. 75-92).
Greenwich, CT: JAI Press Inc.

Entzikolpediak eta neurri handiko liburuak 

APA Lumiansky, R.M. (1998). Chaucer. In The new encyclopaedia Britannica
(Vol. 15, pp. 745-748). Chicago: Encyclopaedia Britannica.

  • Beste material batzuk:

web orrialdeak

APA National Park Service. (2003, February 11). Abraham Lincoln Birthplace
National Historic Site. Retrieved February 13, 2003, from
http://www.nps.gov/abli/
Chicago National Park Service. Abraham Lincoln Birthplace National Historic Site.
[updated 11 February 2003; cited 13 February 2003]. Available from
http://www.nps.gov/abli/.

Note: Adapted from examples on page 634 of Chicago Manual of Style 14th edition.

MLA Abraham Lincoln Birthplace National Historic Site. 11 Feb. 2003. National Park
Service. 13 Feb. 2003 <http://www.nps.gov/abli/>.
Turabian No example in latest edition.
CSE Recommends National Library of Medicine Format:
Abraham Lincoln Birthplace National Historic Site [Internet]. Washington: National Park Service (US); [updated 2003 Feb 11; cited 2003 Feb 13]. Available from: http://www.nps.gov/abli/.

Ondorioa:

Aurrerago aipatu dudan web orrialdean bibliografia modu eta gai gehiago agertzen dira, baina guk orokorrean gehien erabiltzen ditugun materialen bibliografia modua aipatzea egokiago ikusi dut. Bibliografia aipatzea erabat beharrezkoa da, bestela plagioa egiteko arriskua izango dugu.

Bibliografia: 

http://library.duke.edu/research/citing/workscited/webpage.html 

 

ELRA Febrero 19, 2008

Archivado en: Edizio Digitala, Littera — ziortza @ 11:42 am

Europako baliabide linguistikoen erakundea da ELRA. Bere helburua baliabide linguistikoak bultzatzea da, beti ere, teknologia berrien alorrean.Irakur dezagun bada ELRAren web orrialdean agertzen zaigun ingelesesko definizioa:

“The term language resources refers to a set of speech or language data and descriptions in machine readable form, used e.g. for building, improving or evaluating natural language and speech algorithms or systems, or, as core resources for the software localisation and language services industries, for language studies, electronic publishing, international transactions, subject-area specialists and end users.

Examples of linguistic resources are written and spoken corpora, computational lexicons, terminology databases, speech collection and processing, etc.
Basic software tools are also important for the acquisition, preparation, collection, management, customisation and use of these language resources and other resources.”

http://www.elra.info/

ERLAk zerbitzu desberdinak ematen ditu. Horietako batzuk honakook genituzke:

● The catalogue of Resources

Datu basea hiru zatitan banaturik dago; Speech, Written Lexica/Corpora & Terminology.

Identification and distribution of LRs

Legal assistance

Production of new LRs on demand

Evaluation

LREC

Helburuaeta zerbitzuak:

ELRAren helburua, Human Lnaguage Technologietarako baliabide linuistikoak bultzatzea da, honekin batera, lenguaia ebaluatu nahi dute ingenieritzaren aplikazioen bitartez. Bi helburu hauek betetzeko, zerbitzu anitz eskaintzen ditu ELRAk ; “Services around Language Resources” section :

- Identification of language resources
- Promotion of the production of language resources
- Production of language resources
- Validation of language resources
- Evaluation of systems, products, tools, etc., related to language resources
- Distribution of language resources
- Standardisation

Bibliografia:

http://www.elra.info/

elra_supply211.jpg

 

BALIABIDE LINGUISTIKOAK Febrero 19, 2008

Archivado en: Edizio Digitala, Littera — ziortza @ 11:09 am

Errekurtso linguistikoen inguruan asko hitz egin da azken urteotan. Egia da bestalde, gaztelaniazkoak eta ingeleseskoak direla ugarienak eta agian eragimkorrenak. Baina euskarak ere bere materialak dituela ez dugu ahantzi behar.

Batez ere itzulpenetan oinarritutako baliabidea hartuko ditut nire testuaren ardatz. Lanaz denaz bezainbatean maiz joko dut Joseba Abaituak idatziriko artikulu batera: Itzulpen automatikoaren dimentsioak

Itzulpen automatikorako bidea:

Oso erabilera zabala du. Testuak gazteleratik euskara itzultzeaz gain galegora eta katalanera ere itzultzeko aukera ematen du eta noski alderantzizko bidea egin dezakegu. Bukatzeko kode irekian eraki da programa eta horrek laguntasun handia ematen digu.

Zientzia.net-ek esaten duen moduan itzulpen automatikoak egiteko bide desberdinak aurki ditzakegu: itzulpen automatikoa egiteko hainbat bide daude, baina bi dira nagusiak: aurretik itzulita dauden testu-bildumetan, hau da, corpusetan, oinarritzen direnak, eta erregela linguistikoetan oinarritutakoak –hitzen ordena esaldian, deklinabidea, aditzak…–.

IXAko Iñaki Alegriak aipatzen duen moduan: “erregela linguistikoetan oinarritutako sistemek hiru fasetan egiten dute lana. Aurrena jatorrizko testuaren analisi sintaktiko-morfologikoa egiten dute, gero beste hizkuntzarako transferentzia gauzatzen dute, eta, azkenik, bigarren hizkuntza horretan sortzen dute testua”.

h219-023-03-handia.jpg

 

GUTENBERGEN BIBLIAREN PORTADAhIS Enero 10, 2008

Archivado en: Ana Elejabeitia, Littera — ziortza @ 6:02 pm

reina31.gifbiblia_200px-gutenberg_cover_00001.jpg 

                            Hartzaren Biblia                                                   Gutenbergen Biblia

Historia: 

Gutenbergek 1455. urtean lehen biblia inprimatu zuen. Honi Gutenbergen Biblia deitu zitzaion. Inpirmatzeko makina sortu aurretik, liburuak eskuz kopiatzen ziren, horregatik argi ikusten da Gutenbergen ekarriaren iraultza. Gutenbergek, bestalde, ez zituen kopia asko egin, 165 bakarrik. biblia latinez zegoen eta elizak eta eruditoek bakarrik zuten hau irakurtzeko aukera. 1543. urtean Luterok alemanerazko lehen biblia inprimatu zuen eta honen 1000 kopia egin zituen.

Biblia gaztelaniaz:

1543. urtean Franzisko de Enzinas izan zen Testamentu berriaren grekerazko bertsioa hartu eta gaztelaniara itzuli zuen lehena. 1569. urtean Casiodora de la Reinak Biblia osoa itzuli zuen gaztelaniara. Betsio hau La Biblia del Oso bezala ezagutu zen, portadan hartz bat agertzen zelako.

Bibliografia:

http://etimologias.dechile.net/?Biblia

 

Tipoak Diciembre 18, 2007

Archivado en: Ana Elejabeitia, Littera — ziortza @ 9:38 am

Pausoak:

Fabrikazio prozesua oso geldoa eta gogorra zen, baina behin egin eta gero hainbat inpresio egiteko aukera ematen zuten, eta ondorioz argi askoko argazkiak agertuz.
Testuak doin bezala: “Durante más de 400 años todos los tipos se construyeron al modo de Gutenberg; el proceso de fabricarlo metálicos recibió el nombre de fundición tipográfica. En los primeros años de la imprenta, los tipos había que colocarlos manualmente.”

  1. Kajistak tipoekin hitzak sortzen zituen, ezkerretik esskumara, beti ere konponedore baten gainean.
  2. Ondoren tipoa marko metaliko baten gainezn eusten zen, marko eta tipoak forma osatzen zuten. Hau prensan jartzen zen inprimazteko.
  3. Metal gehiegibazegoen, zepiloa erabiltzen zen, era horretan hizki guztiak maila berean inprimatzeko.

Bibliografia:

http://www.biografiasyvidas.com/monografia/gutenberg/fotos5.htm

Irudia:

gutenberg_5.jpg

 

Inprenta Diciembre 18, 2007

Archivado en: Ana Elejabeitia, Littera — ziortza @ 9:31 am

 Oinarria:

lehenengo inprimakiak testuak esaten duen bezala; “utilizaban un mecanismo helicoidal para aplicar presión a la rama de impresión”.

Berain oinarria laborantzako tresna batean zegoen, alegia; “en las prensas de los agricultores para obtener aceite de oliva”.  gaur egungo inprimakiekin alderatuz, makina horiek geldoak ziren eta klopuru jakin bat bakarrik inpimatu zezaketen, 250kopia orduko.

Bibliografia: 

http://www.biografiasyvidas.com/monografia/gutenberg/fotos4.htm

Irudia: 

gutenberg_4.jpg