Los objetos digitales forman parte del patrimonio cultural, a este patrimonio se le denomina patrimonio digital (el conjunto de objetos, creados de forma numérica o procedentes de la digitalización de documentos analógicos, que tienen un valor perdurable para una comunidad).

La recopilación pude ser exhaustiva (recopila todo) o selectiva (recopila lo que tenga más valor), pero es importante la necesidad de la cooperación debido a la naturaleza de los objetos digitales, a su volumen y a los medios necesarios. La cooperación con los creadores puede facilitar la conservación de los documentos producidos sólo en formato digital (por ejemplo cuando utilizan el procesadores de textos para escribir se puede ver toda la evolución). En la cooperación con los centros depositarios habría que establecer los derechos y obligaciones de los centros.

Los parámetros para la selección de una publicación digital son el contenido, la estructura y el estilo, el autor, su diseño y formato, el entorno informático y las facilidades de acceso y de utilización (en segundo lugar: su amigabilidad, las facilidades de búsqueda y recuperación de la información y la interacción entre el usuario y la aplicación/condiciones técnicas y legales para descargar e instalar una publicación en el sistema informático de la biblioteca o repositorio digital).

Algunos retos:

- Facilitar su acceso y consulta a los usuarios en la sede física de la biblioteca, en sus domicilios o en sus lugares de trabajo a través de las redes de ordenadores y telecomunicaciones

- Sería conveniente disponer de una base de datos en la que se describieran todos los objetos digitales que integraran el patrimonio digital para facilitar su búsqueda y recuperación a los usuarios,

- Se necesitaría una institución que se encargara de elaborar, actualizar y supervisar la aplicación de las normas y los procedimientos así como de proporcionar la formación y asistencia técnica necesaria.

- Racionalizar la digitalización de la edición analógica

- El repositorio disponga de garantías de seguridad informática y contra las catástrofes naturales, sin olvidar las incidencias electromagnéticas.

“La conservación no es un fin en sí mismo: sólo se justifica si los bienes culturales pueden ser consultados a lo largo del tiempo”

Fuente:

GARCIA MELERO,L.A.(2005) La recopilación y conservación del patrimonio digital, Jornadas sobre Bibliotecas Nacionales (Biblioteca Valenciana) http://bv.gva.es/documentos/Ponencias/Melero.pdf

Posteado por: deiene | Noviembre 9, 2009

Centros de documentación: glosario

Autenticidad. Garantía del carácter genuino y fidedigno de ciertos materiales digitales, es decir, de que son lo que se afirma de ellos, ya sea objeto original o en tanto que copia conforme y fiable de un original, realizada mediante procesos perfectamente documentados.

Protección de datos. Operaciones destinadas a resguardar los dígitos binarios que constituyen los objetos digitales de pérdidas o de modificaciones no autorizadas.
Patrimonio digital. Conjunto de materiales digitales que poseen el suficiente valor para ser conservados para
que se puedan consultar y utilizar en el futuro.

Preservación digital. Acciones destinadas a mantener la accesibilidad de los objetos digitales a largo plazo.

Metadatos de preservación. Metadatos destinados a ayudar a la gestión de la preservación de materiales digitales documentando su identidad, características técnicas, medios de acceso, responsabilidad, historia,
contexto y objetivos de preservación.
Programa de preservación. Conjunto de disposiciones (y de los responsables de tomarlas) destinadas a garantizar la accesibilidad permanente a los materiales digitales.

Ingesta. Operación consistente en almacenar objetos digitales, y la documentación relacionada, de manera
segura y ordenada.

Fuente:

DIRECTRICES PARA LA PRESERVACIÓN DEL

PATRIMONIO DIGITAL , Dia de consulta: 9 de Noviembre de 2009, 13:28

http://unesdoc.unesco.org/images/0013/001300/130071s.pdf

Posteado por: deiene | Noviembre 1, 2009

Documentación digital y documentación tradicional

El tipo de documentación ha cambiado con el apoyo de las nuevas tecnologías. Por ello es importante mostrar las diferentes utilidades y posibilidades que cada tipo nos aporta.

La documentación tradicional es la documentación básica, normalmente la de papel. Esto supone una manera más fácil de perder los documentos, a causa de su deterioro o degaste. Por otro lado, es más sencillo manejarlo una vez que tengamos la información en las manos (a veces el acceso resulta dificultoso) y es inmanente. El hecho de que sea en papel dificulta el acceso a los hipervínculos (citas,eferencias,…) y puede que necesiteos más infomación pero seamás difícil de manejarlo en conjunto.

Hé aquí una cita de MSINFO (SISTEMAS DE INFORMACIÓN):

La información tradicional es producida por medios que requieren, cada uno, un sistema de codificación y de registro particular. La información textual requiere de alfabetos para ser codificada y de la impresión para ser registrada; la sonora de ondas y grabaciones; la de imágenes de puntos de luz y de papel o celuloide sensible, para producir fotografías o cine. Con el advenimiento de las tecnologías “digitales”, la información, no importa el medio original en que se produce, es, como he dicho, toda traducida a códigos conformados por los dígitos “1″ y “0″ que representan impulsos negativos y positivos de electricidad. En consecuencia, cualquiera sea su tipo: texto, sonido o imagen, la información se registra en el mismo medio y con el mismo código. Las diferencias de codificación mediática y de soporte para registro desaparecen. “

La documentación digital es interactiva porque mediante sus hipervínculos el investigador puede completar su trabajo, modificar, escoger una cita, contribuir con anotaciones… Además, puede recoger texto, imagen, sonido y vídeo a la vez; por eso decimos que es multimediático. Es muy accesible para todos y está permitido consultarlo cuando y cuantas veces se quiera. Pero tambien tiene inconvenientes, porque el autor puede cambiarlo cuando quiera o incluso borrarlo. Esa es la razón por la qué hay que anotar la fecha de la consulta. El manejo también pude ser un problema; es más fácil de manejar los documentos que tenemos entre manos y no en ua patalla (sobretodo cuando hay que leer mucho).

La documentción digital va abriendo caminos y complementa por ahora a la documentación tradicional, pero todavía hay mucha documentación traicional sin digitalizar. La documentación digital no tiene la ayuda en el aspecto del soporte físico, pero en todo lo demás son ventajas.

Fuentes:

Posteado por: deiene | Noviembre 1, 2009

Social bookmarking

Posteado por: deiene | Junio 19, 2008

Hitz espezializatu batzuen esanahiak eta ezberdintasunak

Giza Hizkuntza Teknologietan sakondu eta bereiztu beharreko hitz batzuk daude:

MACHINE TRANSLATION EDO MAKINA BIDEZKO ITZULPENGINTZA:Hizkuntzen arteko itzulpenak egiteko makinak erabiltzea da, hau da, ordenagailua. Baina garrantzitsuena honetan eranilitako software-a da. Ingelesezko siglask MT(Mahine Translation) dira.

MACHINE AIDED TRANSLATION EDO MAKINAZ LAGUNDUTAKO ITZULPENGINTZA:Itzulpena egiten duena gizkia da, baina makina(ordenagailu sfotwarea) erabiltzen du bere itzulpena egiteko eta osatzeko.

MULTILINGUAL CONTENT MANAGEMENT EDO EDUKI ANITZETAKO KUDEAKETA:Informazioa modu zabalean helarazteko pentsatuta dago. Honen bidez informazioa hainbat hizkuntzatara itzultzen da,kudeatzaileen bitartez, informazioa zabaldu daiten.

TRANSLATION TECHNOLOGHY EDO ITZULPENGINTZARAKO TEKNOLOGIA:Hizkuntza batetik beste batera itzultzea,teknologiaren bidez, baina azkenengo erronka ahotsaren bitartez izatea eta memento berean beste hizkuntzara pasatzea da.Idatzizko beste hizkuntza batera ere pasatzea barneratn du.

Iturriak:

Eduard Hovy, Margaret King & Andrei Popescu-Belis. (2003). FEMTI – a Framework for the Evaluation of Machine Translation in ISLE. Kontsulta data: 2008ko ekainaren 4a, 12.13
http://www.issco.unige.ch:8080/cocoon/femti/st-home.html

David Farwell. (2006). Computational Linguistics and Machine Translation Research and Development. 2008ko ekainaren 4a, 13:01
http://www.fti.uab.es/tradumatica/revista/num4/articles/06/06central.htm

Jean Véronis. (2006). Traduction: Systran ou Reverso? 2008ko ekainaren 6a, 11:43
http://aixtal.blogspot.com/2006/01/traduction-systran-ou-reverso.html

Jeff Allen. (2005). Software / System Reviews of Language Technology tools.2008ko ekainaren 18a:11:32
http://www.geocities.com/langtecheval/

Posteado por: deiene | Junio 19, 2008

MT sistemaren bidez gauzatutako itzulpenak

MT sistemaren bidez, itzulpenak gauzatu daitezke, baina betiere hizkuntzen jatorria kontutan hartu behar da. Enbor beretik datozen izkuntzak eta sintaktikoki antzekoak direnak, itzulten hurbilagoa lortuko dute. Bestalde jatorria, eta ondorioz hikuntzaren estruktura urrunago daukatenen arteko itzulpena ez da hain fidagarria izango.

Hona hemen adibide batzuk:

Hurbiltasuna daukaten hizkuntzen artean:
(Instituto Cervantes bidez)

Frantsesetik gaztelaniara (Parisen datuak)

Paris est la ville la plus peuplée et la capitale de la France, chef-lieu de la région d’Île-de-France et unique commune-département du pays. Elle se situe sur une boucle de la Seine, au centre du Bassin parisien, entre les confluents de la Marne et de la Seine en amont, et de l’Oise et de la Seine en aval. Ses habitants s’appellent les Parisiens et les Parisiennes.

Itzulpena:

París (pronunciado/pa.?i/) es la ciudad más poblada y la capital de Francia, cabeza de partido de la región de Île-de-France y único municipio-departamento del país. Se sitúa sobre un cierre del Sena, en el centro de la Cuenda de París, entre las confluencias de la Marga y el Sena aguas arriba, y de Oise y el Sena posterior. Sus habitantes se llaman los Parisienses y los Parisienses.

Katalanetik gaztelaniara(Kataluniako historia):

Catalunya és un territori històric format originalment a partir dels comtats que formaven la Marca Hispànica, al nord-est de la Península Ibèrica, en temps de Carlemany. Avui en dia, el mot Catalunya s’empra sobretot per referir-se a la Comunitat Autònoma de Catalunya, a Espanya, i la Catalunya del Nord, que forma el Departament dels Pirineus Orientals a França.

Itzulpena:

Catalunya es un territorio histórico formato originalmente a partir de los condados que formaban la Marca Hispánica, al noreste de la Península Ibérica, en tiempo de Carlomagno. Hoy en día, el mot Catalunya se utiliza sobre todo por referirse a la Comunidad Autónoma de Catalunya, en España, y la Catalunya del Norte, que forma el Departamento de los Pirineos Orientales en Francia

Gallegotik gaztelaniara (galizia):

Galicia[1] ou Galiza[2] é unha nación[3] establecida xurídica e administrativamente como Comunidade Autónoma con estatuto de “nacionalidade histórica” segundo a Constitución española e o seu Estatuto de Autonomía (ver Estatuto de Galicia) dentro do Reino de España. Está situada no extremo noroeste da Península Ibérica e linda, ao leste, con Asturias e Castela e León, ao oeste, co Océano Atlántico, ao norte, co Mar Cantábrico e, ao sur, coa República de Portugal.

Ten como lingua propia o galego, similar e de orixe común co portugués, e comparte oficialidade co castelán, que é oficial en todo o estado español.

Itzulpena:

Galicia[1] o Galiza[2] es una nación[3] establecida jurídica y administrativamente como Comunidad Autónoma con estatuto de “nacionalidad histórica” según la Constitución española y su estatuto De autonomía (ver Estatuto de Galicia) dentro del Reino de España. Está situada en el extremo noroeste de la Península Ibérica y linda, al este, con Asturias y Castilla y León, al oeste, con el Océano Atlántico, al norte, con el Mar Cantábrico y, al sur, con la República de Portugal.

Tiene como lengua propia el gallego, similar y de origen común con el portugués, y comparte oficialidad con el castellano, que es oficial en todo el estado español.

Urrunago dauden hizkuntzen artean:

(Reverso translate online)
Ingelesetik gaztelaniara:(ingelesezko abestia: do you know)

If birds flying south is a sign of changes
At least you can predict this every year.
Love, you never know the minute it ends suddenly
I can’t get it to speak
Maybe finding all the things it took to save us
I could fix the pain that bleeds inside of me
Look in your eyes to see something about me
I’m standing on the edge and I don’t know what else to give.

Itzulpena:

Si los pájaros que vuelan el sur son un signo de cambios Al menos usted puede predecir esto cada año.
El amor, usted nunca sabe(conoce) el minuto que esto termina de repente(pronto) no puedo conseguirlo para hablar Tal vez encontrando todas las cosas que esto tomó para salvarnos(ahorrarnos) yo podría fijar el dolor que sangra dentro de mí la Mirada en sus ojos para ver algo sobre mí estoy de pie sobre el borde y no sé que más dar.

Alemanetik gaztelaniara : (Berlineri buruzko informazioa) (traslendium-en bitartez)

Berlin ist Bundeshauptstadt und Regierungssitz Deutschlands. Als Stadtstaat ist Berlin ein eigenständiges Land und bildet das Zentrum der Metropolregion Berlin/Brandenburg. Berlin ist mit 3,4 Millionen Einwohnern die bevölkerungsreichste und flächengrößte Stadt Deutschlands und nach Einwohnern die zweitgrößte Stadt der Europäischen Union.

Berlin wurde während seiner Geschichte mehrfach Hauptstadt deutscher Staaten wie die des Markgrafentums/Kurfürstentums Brandenburg, des Königreichs Preußen, des Deutschen Reiches oder der DDR (nur der Ostteil der Stadt). Seit der Wiedervereinigung im Jahr 1990 ist Berlin gesamtdeutsche Hauptstadt.

Itzulpena:

Berlín es capital federal y sede del gobierno de Alemania. Como estado de ciudad es un país autónomo Berlín y forma el centro de la región de metrópoli Berlín/Brandemburgo. Berlín es la ciudad poblada y mayor de superficie de Alemania con 3,4 millones de habitantes y según|tras habitantes la segundo mayor ciudad de la Unión Europea.

Berlín se convertía durante su historia varias veces en capital de estados alemanes como ésos del Markgrafentums/Kurfürstentums Brandemburgo, el reino Prusia, del Imperio Alemán o de la DDR (sólo la parte del este de la ciudad). Desde la reunificación en el año 1990 es capital de toda Alemania Berlín.

Erabilitako hiru itzulpen makinen bidez, hau da lortutako emaitza: hizkuntzen jatorria, sintaxia eta semantika oso garrantzitsuak dira itzulpena gauzatzerakoan.

Iturriak:

John Hutchins (University of East Anglia, Norwich), kontsulta data: Maiatzak 19: 12:07
http://home.comcast.net/~jmiller308/MachTrans.html
Instituto Cervantes, kontsultaren data: 2008ko maiztzaren 28a: 16:48 http://oesi.cervantes.es/traduccionAutomatica.html
Reverso translate online, kontsultaren data: 2008ko maiatzaren19a:, 11:37
http://elmundo.reverso.net/textonly/default.asp
Translendium.Kontsultaren data:2008ko maiatzaren 19, 12:01
http://www.translendium.net:8080/home/

FEMTI (Framework for Machine Translation Evaluation in ISLE)-k bi interrelazio klasifikaioetan edo taxonomietan dauka eragina.

Hauek dira ezaugarri nagusienak FEMTI-ri dagokionez:

  • Asimilazioa: Asimilazioaren azken helburua (zeinetan itzulpenak parte hartzen duen) organizaioz kanpoko jendeak idatzitako textuak, hizkuntza askotan idatziak daudenak aurrera eramatea da. Hauek euren artean erlazioa izaten dute.
  • Zabalkuntza: Organizaioan bertan itzulitako testuak zabaltzea, besteei helaraztea. Organizazioaren barnera eta kanpora helaraztea.
  • Komunikazioa: Hizkuntza ezberdinetan hitz egiten duten pertsonen arteko komunikazioa, elkarrizketa, hobetzea da helburua. Horretarako itzulpen onak izan behar dira, goi mailakoak, komunikazioa ere ona eta kalitatezkoa izan daiten.

Iturria:

 FMTI printable version. Kontsulta ordua eta data: Maiatzak 31, 18:43 http://www.issco.unige.ch:8080/cocoon/femti/printable.html

 

Posteado por: deiene | Abril 1, 2008

Aukeratutako ikerkuntza gaiak

Hauek dira Giza Hizkuntzaren teknologietan barruan, garatu izan diren ikerkuntzetako batzuk:

Diskurtsoaren teknologia : ahozko teknologiak konputoko linguistikan, inteligentzia artifizialean, informatikan, matematikako modelaketan lagundu egin du. Diskurtsoaren teknologiak NLP-ko hainbat teknologia batzne ditu bere barnean. Erabilera orokorrenak hauek dira: diskurtso automatikoaren araketa (ASR) eta makienei hitz egitearaztea. Beste atal garrantzitsu batzuk diskurtsoaren analisia, diskurtsoaren kodifikazioa eta diskurtsoaren nabaritasuna dira.

Lengoaiaren eboluzioa:  Lengoaiaren garapenaren ikerkuntzarako sistemak dira kasu honetan erabilitakoak. Pertsonen  arteko eta makinen arteko ikaskuntza prozesua desberdina da. Gizakiek badakitelako  giza hikuntzari lotuta dauden esanahiak. Hizkuntzak, historikoki, komunikazio sistema onenak izateko garatzen dira non gizakien lengoai ikaskuntza garatu egin den sistema hauek hobeto ikasteko. Makinek  hizkuntza ikasteko, hasiera hasieratik hasi behar dute.

Semantika: Egoera komunikatibo gehienetan , hizkuntza komunikatzeko erabiltzen dugu. Semantikak lengoaiak duen esanhi eta edukina modelatzen ditu eta horretarako logika erabiltzen du. Irudikapenak eta infernetzia logikoak NLPan, tradukzio automatikoan,lengoai naturaleko interfazak ordenadoreetan, galdera-erantzuna sistemetan,jakintzaren  errepresentazioan eta informazioa ateratzean(extrazioan) atal garrantzitsuak dira.

Iturriak:

Posteado por: deiene | Abril 1, 2008

Some research topics

These are some research topics:
Conferences on HLT:

Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics 2007 

Research Centres:

Language Technology Lab (DFKI, Germany)

  • exploiting – and automatically extending – ontologies for content processing
  • tighter integration of shallow and deep techniques in processing
  • enriching deep processing with statistical methods
  • combining language checking with structuring tools in document authoring document indexing for German and English
  • automatically associating recognized information with related information and thus building up collective knowledge
  • automatically structuring and visualizing extracted information
  • processing information encoded in multiple languages, among them Chinese and Japanese

National Centre for Language Technology (Ireland) 

References: Here there are with the links.

P. D. : I wrote it in English because I found it easier

Posteado por: deiene | Abril 1, 2008

Europako ikerketa zentroak

Hauek dira Europako Ikerkuntza zentroetariko batzuk, Giza Hizkuntzaren teknonologiei dagokienez:  

National Centre for Language Technology (Ireland). Kontsultaren data:2008ko martxoak 30, http://www.computing.dcu.ie/research/nclt/

Edinburgh Language Technology Group (Scotland, UK). KOntsultaren data: 2008ko martxoak 30, http://www.ltg.ed.ac.uk/

The Stanford Natural Language Processing Group. Kontsultaren data:2008ko martxoak 30, http://nlp.stanford.edu/

IXA Taldea. Euskal Herriko Unibertsitatea :Informatika Fakultatea. KOntsultaren data: 2008ko martxoak 30, http://ixa.si.ehu.es/Ixa

German Research Center fot Artificial Intelligence.Language Technology Lab.KOntsulta data:2008ko Martxoak 17, http://www.dfki.de/lt/lt-general.php

Language Technology Documentation Centre in Finland. Kontsultaren data: 2008ko Martxoak 28, http://www.ling.helsinki.fi/filt/info/index-en.shtml

Entradas antiguas »

Categorías