E-books, protagonistas de la Azoka de Durango

Diciembre 16, 2009 por littlemisssunshines

En la 44 edición de la Feria del Libro y de la Música de Durango, la novedad es la presentación del libro digital (e-book).

En esta  edición de la Feria del Libro y de la Música de Durango, la novedad ha sido la presentación del libro digital, también conocido cono “e-book”. Jorge Jiménez, presidente de la Asociación de Editores Vascos y editor de Alberdania; Enric Faura, responsable del portal edi.cat; e Ignacio Latasa, director de Leer-e, empresa distribuidora del lector electrónico, explican como el libro digital aspira a convertirse en algo imprescindible.

Libro digital o e-book

A pesar de que es “un mercado que todavía no ha explotado” y que aún falta tiempo para consolidarlo, el libro electrónico va a suponer una revolución en el mundo editorial. Es una oportunidad para las lenguas minoritarias porque dan mayor visibilidad y permite divulgación a menor precio. Latasa afirma que no es una amenaza para los libros de papel y no va a suponer la desaparición del “formato tradicional”. Por otra parte, recomienda acercarse al stan del azoka para informarse, y afirma que por lo general, el libro digital está teniendo muy buena aceptación.

El interés ha sido,  más mediático que real. Mientras que los profesionales han debatido sobre el futuro impacto de los libros digitales en la industria, las ventas de contenidos sólo han alcanzado, al parecer, poco más una decena de ejemplares entre el público en general. Una novedad muy interesante ha sido la presentación por parte del editor Jason Epstein, en el marco de la feria, de la Expresso Book Machine , un expendedor de contenidos similar a los cajeros automáticos o a los expendedores de vídeos en los videoclubs. Se elige la obra y esta se imprime al instante en formato libro. Hoy en día ya se puede utilizar en EEUU, Egipto y Australia.

Hay varios stans informativos y aunque también se distribuyen títulos, la funcion de los puestos es informar a los ciudadanos sobre esta nueva forma de lectura e invitar a comprar un libro aunque no se tenga el lector, ya que se puede leer en el ordenador.

Fuentes:

http://biblumliteraria.blogspot.com/2009/12/feria-de-durango.html

http://www.eitb.com/noticias/tecnologia/detalle/308899/el-libro-digital-protagonista-azoka-durango/

Recopilación y conservación del Patrimonio Digital

Noviembre 24, 2009 por littlemisssunshines


Según la UNESCO, el patrimonio digital consiste  en “recursos únicos que son fruto del saber o la expresión de los seres humanos.  Comprende recursos de carácter cultural, educativo, científico o administrativo e información técnica, jurídica, médica y de otras clases, que se generan directamente en formato digital o se convierten a éste a partir de material analógico ya existente.”

La preservación digital podría definirse, según la Unesco, como” el conjunto de procesos destinados a garantizar la continuidad de los elementos de patrimonio digital durante todo el tiempo que se consideren necesarios.”

La labor de los profesionales es seleccionar qué documentos queremos preservar y para qué lo hacemos.  Antes de nada hay que decidir que documentos se van a recopilar.  Esta recopilación se basa en los siguientes factores: tipo de biblioteca, comunidad a la que atiende, forma de producción de los documentos,…Una vez  que se hayan decidido los objetos a  recopilar, el siguiente paso es adquirirlos. Los procedimientos usados con los documentos tradicionales también son aplicables a los documentos digitales.

A la hora de recopilarlos, los objetos serán tratados de distinta manera según naturaleza:

  • Los objetos digitales tangibles (CD-ROM, DVD,…) serán tratados de la misma manera que los documentos tradicionales.
  • Los objetos en línea podrán ser transferidos de dos maneras distintas: el sujeto obligado transmite la publicación al repositorio o le autoriza a acceder a sistema informático para descargar el documento, o el editor se ve obligado a remitir a la biblioteca depositaria una copia  en soporte óptico o magnético de cada nueva edición. Aparte de los ficheros, la transferencia supone la remisión de la documentación técnica.

Una vez adquiridos los documentos, el centro deberá seguir un procedimiento para garantizar la calidad de éstos: verificar archivos, comprobar su accesibilidad, cotejar la pertinencia de los metadatos,…

El patrimonio digital presenta algunas dificultades para ser recopilado.Hay que evaluar una gran cantidad de material.

-Los medios utilizados para producir y divulgar los materiales digitales son muchos.
-El tiempo de realización suele ser decisivo.
-Algunos objetos digitales pueden ser difíciles de definir.
-Puede ser difícil establecer la procedencia de los materiales digitales.

.

La Recopilación y Preservación del Patrimonio Digital. Día de consulta: 15:18,  15/11/09 de http://bv.gva.es/documentos/Ponencias/Melero.pdf

Directrices para la Preservación del Patrimonio Digital. Día de consulta: 15:25, 15/11/09  de http://unesdoc.unesco.org/images/0013/001300/130071s.pdf


GLOSARIO

Noviembre 9, 2009 por littlemisssunshines


  • Internet: El mayor sistema de redes interconectadas (o interredes) del mundo que, en todos los casos, utilizan los protocolos TCP/IP (Protocolo de Control de Transmisión/Protocolo Internet).
  • Derechos: Facultades o poderes legales que se tienen o ejercen con respecto a los materiales digitales, como son los derechos de autor, la privacidad, la confidencialidad y las restricciones nacionales o corporativas impuestas por motivos de seguridad.
  • Autenticidad: Garantía del carácter genuino y fidedigno de ciertos materiales digitales, es decir, de que son lo que se afirma de ellos, ya sea objeto original o en tanto que copia conforme y fiable de un original, realizada mediante procesos perfectamente documentados.
  • Certificación: Proceso de evaluación del grado en que un programa de preservación cumple con un conjunto de normas o prácticas mínimas previamente acordadas.
  • Protección de datos: Operaciones destinadas a resguardar los dígitos binarios que constituyen los objetos digitales de pérdidas o de modificaciones no autorizadas.
  • Patrimonio digital: Conjunto de materiales digitales que poseen el suficiente valor para ser conservados para que se puedan consultar y utilizar en el futuro.
  • Preservación digital: Acciones destinadas a mantener la accesibilidad de los objetos digitales a largo plazo. -Identidad de objetos digitales: Característica que permite distinguir un objeto digital del resto, incluidas otras versiones o copias del mismo contenido.
  • Ingesta: Operación consistente en almacenar objetos digitales, y la documentación relacionada, de manera segura y ordenada.
  • Derechos: Facultades o poderes legales que se tienen o ejercen con respecto a los materiales digitales, como son los derechos de autor, la privacidad, la confidencialidad y las restricciones nacionales o corporativas impuestas por motivos de seguridad.
  • Verificación. Acción de comprobar si un objeto digital, en un formato de fichero dado, está completo y cumple con la especificación de formato.

26.10.09

  • Amanuense: Persona que tiene por oficio escribir a mano, copiando o poniendo en limpio escritos ajenos, o escribiendo lo que se le dicta.
  • Códice: Libro anterior a la invención de la imprenta.
  • Miniado: Pintado, ilustrado de miniatura.
  • Colofón: Anotación al final de los libros, que indica el nombre del impresor y el lugar y fecha de la impresión, o alguna de estas circunstancias.
  • Filigrana: Obra formada de hilos de oro y plata, unidos y soldados con mucha perfección y delicadeza.
  • Glosa: Explicación o comentario de un texto oscuro o difícil de entender.
  • Papel vitela: papel liso y sin grano, de gran calidad, cuya superficie permite la reproducción detallada de los dibujos más finos.
  • Piedra Rosetta: piedra que contiene un texto en tres tipos de escritura y su gran importancia radica en haber sido la pieza clave para comenzar a descifrar los jeroglíficos de los antiguos egipcios

15.12.09

  • Copyright: El derecho de autor (del francés droit d’auteur) es un conjunto de normas y principios que regulan los derechos morales y patrimoniales que la ley concede a los autores (los derechos de autor), por el solo hecho de la creación de una obra literaria, artística, científica o didáctica, esté publicada o inédita.
  • Copyleft:es una forma de licencia y puede ser usada para modificar el derecho de autor de obras o trabajos, tales como software de computadoras, documentos, música, y obras de arte. Bajo tales licencias pueden protegerse una gran diversidad de obras, tales como programas informáticos, arte, cultura y ciencia, es decir prácticamente casi cualquier tipo de producción creativa.

Noviembre 8, 2009 por littlemisssunshines

Documentación digital vs documentación “tradicional”

Decimos que una información es digital cuando está codificada en el formato que puede interpretar un ordenador y suele decirse que consiste en series de ceros y de unos.

Por otra parte, decimos que una información digital está en línea cuando es posible acceder a ella desde terminales u ordenadores remotos, a través de redes de área local, de área amplia o bien de combinaciones de ambas.

Debemos preguntarnos cuál es la diferencia concreta de la información digital en relación a las otras clases de información o a los otros tipos de soportes. Más específicamente es necesario que nos planteemos lo siguiente: ¿cuáles son las propiedades de la información digital comparada con la analógica? Se proponen tres propiedades de la información digital: computabilidad, virtualidad y capacidad.

Ya tenemos ante nosotros una primera consecuencia que se deriva de la computabilidad de la información digital: cuando se encuentra en este formato podemos realizar una serie de operaciones de búsqueda o de descubrimiento que sería imposible realizar con otra de naturaleza analógica.

El papel puede contener (de hecho es el medio idóneo) texto e imagen estática, pero no sonido ni imagen animada; por su parte las cintas de vídeo pueden contener ambos, pero son muy ineficientes para el texto o la imagen fija. El soporte digital es el único que puede contener todas las morfologías de la información. Esto nos indica que, si la web es todavía predominantemente

textual, tal cosa no durará mucho y será, cada vez más, audiovisual sin dejar de ser textual.

 

La virtualidad también tiene problemas. En primer lugar proporciona dolores de cabeza a los autores y a las empresas editoriales por la facilidad de copia. También a las bibliotecas y a los centros de documentación por las nuevas restricciones a las que deben hacer frente

con relación a la copia y la reproducción de información digital. En algunas ocasiones se ha llegado incluso a poner en duda que el derecho de propiedad intelectual tenga sentido en la Red.

 

Por otro lado, un documento digital se degrada de modo “catastrófico”. Un simple bit erróneo en un archivo de cientos de páginas o una pequeña mota de polvo que entre en contacto con la superficie de un soporte magnético, puede hacer totalmente imposible su lectura, al menos con los medios con los que cuenta un ciudadano normal.

 

Finalmente, la virtualidad hace difícil en ocasiones determinar los límites de un documento digital. Mientras los analógicos son claramente objetos discretos y tienen límites bien definidos, no sucede siempre lo mismo con los documentos digitales.

 

 

Fuentes:

http://www.msinfo.info/propuestas/documentos/documentos_digitales.html

http://dialnet.unirioja.es/servlet/articulo?codigo=1071179

http://www.elprofesionaldelainformacion.com/contenidos/2001/diciembre/5.pdf

 

About Social Bookmarking…

Octubre 15, 2009 por littlemisssunshines

Social bookmarking

Social bookmarking is a method for Internet users to share, organize, search, and manage bookmarks of web resources. Unlike file sharing, the resources themselves aren’t shared, merely bookmarks that reference them.

 

Descriptions may be added to these bookmarks in the form of metadata, so that other users may understand the content of the resource without first needing to download it for themselves. Such descriptions may be free text comments, votes in favor of or against its quality, or tags that collectively or collaboratively become a folksonomy.

 

In a social bookmarking system, users save links to web pages that they want to remember and/or share. These bookmarks are usually public, and can be saved privately, shared only with specified people or groups, shared only inside certain networks, or another combination of public and private domains. The allowed people can usually view these bookmarks chronologically, by category or tags, or via a search engine.

Most social bookmark services encourage users to organize their bookmarks with informal tags instead of the traditional browser-based system of folders, although some services feature categories/folders or a combination of folders and tags.

 

As these services have matured and grown more popular, they have added extra features such as ratings and comments on bookmarks, the ability to import and export bookmarks from browsers, emailing of bookmarks, web annotation, and groups or other social network features

Advantages

With regard to creating a high-quality search engine, a social bookmarking system has several advantages over traditional automated resource location and classification software, such as search engine spiders. All tag-based classification of Internet resources (such as web sites) is done by human beings, who understand the content of the resource, as opposed to software, which algorithmically attempts to determine the meaning of a resource. Also, people can find and bookmark web pages that have not yet been noticed or indexed by web spiders.

For users, social bookmarking can be useful as a way to access a consolidated set of bookmarks from various computers, organize large numbers of bookmarks, and share bookmarks with contacts. Libraries have found social bookmarking to be useful as an easy way to provide lists of informative links to patrons.

Disadvantages

From the point of view of search data, there are drawbacks to such tag-based systems: no standard set of keywords (i.e., a folksonomy instead of a controlled vocabulary), no standard for the structure of such tags (e.g., singular vs. plural, capitalization), mistagging due to spelling errors, tags that can have more than one meaning, unclear tags due to synonym/antonym confusion, unorthodox and personalized tag schemata from some users, and no mechanism for users to indicate hierarchical relationships between tags (e.g., a site might be labeled as both cheese and cheddar, with no mechanism that might indicate that cheddar is a refinement or sub-class of cheese). 

 

Sources:

-www.wikipedia.com

What do they mean?

Abril 28, 2008 por littlemisssunshines

-Machine translation,  is a sub-field of computational linguistics that investigates the use of computer software to translate text or speech from one natural language to another.  MT performs simple substitution of words in one natural language for words in another. Using corpus techniques, attemps more complex translations , allowing for better handling of differences in linguistic typology, phrase recognition, and translation of idioms, as well as the isolation of anomalies.

-Machine aided Translation , where translation proper is performed by a computer, even if the human helps by preediting, postediting, or answering questions to disambiguate the source text. In Computer-Aided Translation, or more precisely Machine-Aided Human Translation (MAHT), by contrast, translation is performed by a human, and the computer offers supporting tools.

-Multilingual Content Management systems contain information, mostly in the form of more or less structured text documents, but potentially also including audio clips, video clips and images. Minimally, such a system provides mechanisms for storage and retrieval of content data, but it may also give support for indexing of documents, distributed document editing, version management, and generation of different views and guided tours. 

Finally…

-Translation technology is the type of technology that offers translation between two languages. It’s aim is to make simultaneous translations between oral language to another languages.  Researchers  revealed a directional speaker system that delivers a translated audio feed to just one person in a room, removing the need for them to wear headphones. And another concept device projected translated subtitles along the bottom of one lens of a modified pair of glasses.

 

 

 

 

Sources:

-Machine translation. (2008, April 7). In Wikipedia, The Free Encyclopedia. Retrieved  April 9, 2008,11.50 from http://en.wikipedia.org/w/index.php?title=Machine_translation&oldid=203927830

-MCM Project, Multilingual Content Management, Vaxjo University (WSCC); april 10 12.00http://wscc.info/index.php?show=53044_SWE&&page_anchor=http://wscc.info/p53044/p53044_swe.php

-Kitsite, Multilingual Content Management (2007); april 10 12.05 http://www.kitsite.com/articles/multilingual-content-management.html

-Christian Boitet, 8.4 Machine-aided Human Translation; kontsulta: april 12 13.40 http://cslu.cse.ogi.edu/HLTsurvey/ch8node6.html

-Will Knight, NewScientist.com news service, Live speech-translation technology unveiled 18:05 31 October 2005; april 12 12.38 http://www.newscientist.com/article.ns?id=dn8241

 

Translation examples between related languages

Abril 20, 2008 por littlemisssunshines

Example of a translation from Galician to a related language as it is the Spanish:


Oito galegos secuestrados en Somalia

Catro persoas lograron acceder ao atuneiro vasco armados con lanzagranadas e manteñen retida á tripulación do ‘Praia Bakio’, composta por 13 persoas de orixe africana, oito galegos e cinco vascos. As autoridades españolas non teñen constancia de que ningún dos 26 resulte ferido durante o asalto.
A pesar de que o atuneiro sufriu danos materiais durante o asalto, os danos non impiden o seu navegabilidad e gobernabilidade e, segundo o seguimento que se lle está facendo, os primeiros indicios apuntan a que o buque diríxese cara a terra firme.


Ocho gallegos secuestrados en Somalia

Cuatro personas lograron acceder al atunero vasco armados con lanzagranadas y mantienen retenida a la tripulación del ‘Playa Bakio’, compuesta por 13 personas de origen africana, ocho gallegos y cinco vascos. Las autoridades españolas no tienen constancia de que ninguno de los 26 resulte herido durante el asalto.
A pesar de que el atunero sufrió daños materiales durante el asalto, los daños no impiden su navegabilidad y gobernabilidad y, según el seguimiento que se le está haciendo, los primeros indicios apuntan a que el buque se dirige cara a tierra firme.

As it can be seen, there is only one mistake in the translation so it can be said that it is easier to make translations with good results between related languages, on the other hand, translation between less related languages have usually typical grammatical, syntactical or word-order flaws.

Sources:

-Comprendium translator 21 april 2008, 12:57 from [(http://www.translendium.net:8080/home/text.do;jsessionid=E9A5ABD30639A486D97FC1824833274F)

-A Nosa Terra diario 21 april 2008, 12.30 from http://www.anosaterra.org/nova/oito-galegos-secuestrados-en-somalia-.html



1st translation example applied to less related languages ( Elnglish -to- Spanish)

Abril 16, 2008 por littlemisssunshines

The followings are the MT systems I have used and the translations I have made by using different web pages that offer quite a good range of possibilities to make them possible:

Instituto Cervantes. Servicio de traducción automática interactivo. Powered by AutomaticTrans.

Resultado de la traducción:
Texto original:
“Tough sentence for gun possession welcomed(1)

The Leader of Nottingham City Council has welcomed a lengthy jail sentence handed down to a man caught with a loaded gun in Nottingham.(2)

Councillor Jon Collins said he hoped it would act as a deterrent to others considering carrying guns.

Makan Dayil, 28, of Beardsley Gardens, The Meadows, was jailed for ten years following his conviction at Nottingham Crown Court for possessing the gun and ammunition, after police(3) found a revolver loaded with five bullets in his car on Queens Drive, Nottingham, on(4) August 29, last year.”

Texto traducido:

“Oración resistente para la posesión del arma dada la bienvenida

El líder del consejo de ciudad de Nottingham ha dado la bienvenida a una oración de cárcel muy larga dada abajo a un hombre cogido con un arma cargado en Nottingham.

El concejal Jon Collins dijo él esperaba que actuara como impedimento a otros que consideran el llevar de los armas.

Makan Dayil, 28, de los jardines de Beardsley, los prados, fue encarcelado por diez años que seguían su convicción en la corte de la corona de Nottingham para poseer el arma y la munición, después de que el policía encontrara un revólver cargado con cinco balas en su coche en reinas conduzca, Nottingham, de agosto el 29, el año pasado”.

-There are some obvious errors in the translation:

  1. The headline of the article has been wrongly translated:
    • “sentence” in this case does not mean “oración” but it does mean ” sentencia”.
    • “thought” in this case does not mean “resistente” “but does mean ”dura”.
    • “for” has been wrongly translated into “para” instead of “por”.

2. In the first paragraph :

  • “sentence” in this case does not mean “oración” but it does mean ” sentencia”.
    • “handed down” has been wrongly translated into “dada abajo” instead of “dada”.
    • “caught” has been wrongly translated into ”cogido” instead of “pillado”.
    • the adjective “loaded” has been translated as if it was masculine but it is femenine in this translation of “loaded gun” = “arma cargadA”.

3. In the third paragraph:

    • “police” = “el policía” has been translated as if it was a single noun but it is a colective noun “polocía” = ” La policía”.
    • The preposotion “on” has been wrongly translated into “de” instead of “el”.

 

 

 

Sources:

-Nottingham City Council “Tough sentence for gun possesion welcomed”, April 16 12:00 from [(http://www.nottinghamcity.gov.uk/news_page/news_about_nottingham_-_policing_and_public_safety_/tough_sentence_for_gun_possession_welcomed.htm)

-Instituto Cervantes- Servicio de traducción automática interactivo16 april 2008, 12:00 from http://oesi.cervantes.es/traduccionAutomatica.html

Characteristics of a translation task according to the FEMTI report

Abril 9, 2008 por littlemisssunshines

The characteristics of the translation task refers to the information flow intended for the output, from the point of view of the agent who receives the translation.

From the point of view of the FEMTI or Framework for the Evaluation of Machine Translation in ISLE the main characteristics of a translation task are these three ones:

  1. Assimilation: The ultimate purpose of the assimilation task (of which translation forms a part) is to monitor a relatively large volume of texts produced by people outside the organization, in usually several languages.
  2. Dissemination: The ultimate aim of dissemination is to deliver to others a translation of documents produced inside the organization.
  3. Communication: The purpose of the communication task is to support multi-turn dialogues between people who speak different languages. The translation quality must be high enough for painless conversation, despite possible syntactically ill-formed input and idiosyncratic word and format usage.

 

Sources:

-FEMTI – a Framework for the Evaluation of Machine Translation in ISLE, April 7, 12,10 from http://www.issco.unige.ch:8080/cocoon/femti/st-home.html

Explanation of three of the topics

Marzo 30, 2008 por littlemisssunshines

In this article I’ll make the asked explanation on three of the topics we have spoken about recently:

This first topic I’m going to talk about is the “Humaine” or “Human-machine interaction Network on emotions” one of the current projets of the German Research Center for Artificial Intelligence.

Humaine aims to lay the foundations for European development of systems that can register, model and influence human emotional and emotion-related states and processes – ‘emotion-oriented systems’. Such systems may be central to future interfaces, but their conceptual underpinnings are not sufficiently advanced to be sure of their real potential or the best way to develop them.

One of the reasons is that relevant knowledge is dispersed across many disciplines. Humaine brings together leading experts from the key disciplines in a programme designed to achieve intellectual integration. It identifies six thematic areas that cut across traditional groupings and offer a framework for an appropriate division of labour – theory of emotion; signal/sign interfaces; the structure of emotionally coloured interactions; emotion in cognition and action; emotion in communication and persuasion; and usability of emotion-oriented systems. Teams linked to each area will run a workshop in it and carry out joint research to define an exemplar embodying guiding principles for future work in their area.

The second topic on which I am going to focus is the one called “Whiteboard“; a completed project of the same research centre. This project focused on the “Multilevel annotation for dimamic free text processing”.

The project aimed at designing, implementing, investigating and evaluating a new system architecture that facilitated the combination of different language technologies for a range of practical applications. Language technologies offered numerous means for a partial analysis of texts that could be employed for information retrieval, information extraction, language checking, and many other applications. Processing methods and tools differed along several dimensions, e.g., wrt. levels of linguistic description, depth of analysis, or the way knowledge of language is derived (linguistically or statistically).

Methods often overlaped in their functionality but differed in their strengths and weaknesses. Finding optimal combinations of heterogeneous techniques and processing components was one of the most difficult tasks in language processing – the challenge of the Whiteboard project. The novel architecture to be developed and explored in Whiteboard was based on the concept of an annotated text. The different LT components enriched an XML. Each component can exploit or disregard previously assigned annotations. Its architecture had a single shared data structure, which at the same time was the input, throughput, and output of the system. The envisaged architecture permited the pragmatic combination of different processing approaches, most notably novel ways of the combination of shallow and deep methods.

Finally, the last topic I had picked to focus on is the “Neca” or “The net environment for embodied emotional conversational agents”; one of the previous projects of the Austrian Research Institute for Artificial Intelligence.

The objective of the NECA project was to develop a new generation of mixed multi-user / multi-agent virtual spaces populated by affective conversational agents. The agents are be able to express themselves through synchronised emotional speech and non-verbal expression, generated from an abstract representation. This is the first time that such expressive capabilities are featured in Internet applications. The agents’ usefulness were evaluated in two concrete application scenarios. From a technical point of view, the NECA platform provides a confederation of dedicated components including an affective reasoner, co-ordinated generation of verbal and nonverbal aspects of communication, and emotional speech synthesis, thus providing a basis for the development of new Internet applications with emotional agents.

Sources:

http://www.dfki.de/pas/f2w.cgi?ltp/humaine-e

http://www.dfki.de/pas/f2w.cgi?ltc/whiteboard-e

http://www.ofai.at/research/nlu/projects/nlproject_neca.html