OESI. Oficina de Espaol en la Sociedad de la Informacin. El portal de las Tecnologas Lingisticas en Espaa
Inicio | Mapa Web | Contacte
Buscar
  Escuchar el texto en voz alta Escuchar
  Qué es la OESI?
línea divisoria
TECNOLOGÍAS LINGÜÍSTICAS
línea divisoria
SERVICIOS
DILE
Noticias
Agenda
Infoteca
línea divisoria
PROYECTOS OESI
bullet Eagles
RILE
TLs para todos
Euromap
LIQUID
C-ORAL-ROM
línea divisoria
RECURSOS ÚTILES
bullet Solicitud de información
línea divisoria
 
 
 
Enlace al Portal de la Sociedad de la Información de Telefónica

  Escuchar el texto en voz alta Escuchar
La Tecnología Lingüística (TL) es la derivada de aplicar los conocimientos sobre la lengua al desarrollo de sistemas informáticos.
Índice
Tecnologías del habla
Tecnologías del texto
Recursos lingüísticos
Implicaciones sociales y económicas
Beneficios


Tecnologías del habla

Las tecnologías del habla son aquellas que se basan en el tratamiento del lenguaje hablado.

- Reconocimiento del habla

Actualmente es posible que una persona hable a una máquina y ésta comprenda la información que se le transmite. El ordenador recibe los sonidos del habla en forma de ondas analógicas que se analizan para identificar las unidades que constituyen las palabras (fonemas). El reconocimiento del habla es el proceso a través del cual un mensaje hablado se convierte en texto.

Por ejemplo: Es posible dictar  un texto al ordenador y que éste reproduzca por escrito lo que le estamos dictando, sin necesidad de escribirlo.

- Síntesis de habla o conversión texto-voz

 Permite la generación de mensajes hablados a partir de un texto escrito almacenado en formato electrónico.

Por ejemplo: Las personas con discapacidad visual pueden conocer la información que aparece en la pantalla de sus ordenadores a través de los sistemas que convierten el texto escrito en texto hablado.

Además de éstos, existen otros procedimientos de las tecnologías del habla que permiten el desarrollo de aplicaciones que ofrecen valor añadido en muchos ámbitos de la sociedad.

- Reconocimiento de locutores

El reconocimiento de locutores es el proceso de identificación o verificación de la identidad del hablante de forma automática a partir de la señal de su voz.

La voz es única para cada individuo. Por esta razón, se puede identificar a una persona por su voz. Se han desarrollado técnicas que permiten, a través de la identificación de la voz de una persona, comprobar si esa persona está, por ejemplo, autorizada para acceder a un servicio.

Por ejemplo: Actualmente,  podemos  llamar  por teléfono a nuestro banco para realizar una transferencia y  nos atiende un sistema con el que nosotros nos comunicamos, que nos comprende y ejecuta nuestra orden siempre y cuando proceda de la voz de la persona autorizada.

- Generación del habla

El habla se puede generar a partir de plantillas que se completan con grabaciones previamente realizadas o bien concatenando unidades de habla (fonemas, palabras). Para esta técnica, hay que tener en cuenta aspectos como la intensidad, la duración y la entonación para lograr un discurso continuo y natural.

Por ejemplo, para la gestión automatizada de llamadas telefónicas en un servicio de compra de partidos de fútbol de una televisión de pago.

 

 

subir


Tecnologías del texto

Las tecnologías del texto son aquellas que se basan en el tratamiento del lenguaje escrito.

- Herramientas de reconocimiento de textos

Existen dos tipos de reconocimiento de textos escritos. El Reconocimiento Óptico de Caracteres (ROC) que reconoce, a partir de fuentes de imprenta e imágenes impresas y el Reconocimiento Inteligente de Caracteres (RIC) que  reconoce la escritura a mano o fuentes de imprenta con calidad de impresión baja.

Por ejemplo: Esta técnica es muy utilizada por la instituciones que quieren digitalizar sus archivos documentales en formato papel para convertirlos a formato electrónico.

- Herramientas de recuperación de la información

Cada vez estamos más familiarizados con la expresión ?buscar en Internet? o ?los buscadores de la red?. Las herramientas de recuperación de información permiten que, a través de una consulta, un usuario pueda seleccionar entre un conjunto de documentos, aquellos que contienen la información que le interesa.

Mediante las herramientas de recuperación de información multilingüe, además, el usuario puede realizar consultas en su lengua y encontrar documentos de su interés independientemente de la lengua en la que estén escritos. 

Por ejemplo: Se han desarrollado sistemas de búsqueda y localización de información médica  en  bases de datos multilingües en las que el usuario realiza una consulta en su idioma.

- Herramientas de creación, comprensión de textos escritos y traducción automática

La implantación de una Sociedad de la Información global hace que estemos en contacto con grandes volúmenes de información que, en la mayoría de las ocasiones, no están en nuestra lengua. Para facilitar este proceso de comprensión de la información existen los denominados traductores automáticos, que son programas informáticos que hacen traducciones de textos o del habla de forma automática.

Por ejemplo: Los traductores que están disponibles en Internet que permiten traducir páginas web a múltiples idiomas.

Además, en la actualidad existen sistemas de traducción del habla que permiten, por ejemplo, mantener una conversación telefónica entre dos personas que hablan distintas lenguas,  ya que traducen automáticamente la conversación a la lengua correspondiente de cada una de ellas.

- Herramientas que ayudan a la mejora la escritura en formato electrónico verificando la ortografía, la gramática o el estilo.

Por ejemplo: Los programas de corrección ortográfica y gramatical que están incorporados en cualquier procesador de texto identifican las palabras mal escritas o las frases mal construidas.

- Herramientas que realizan análisis morfológicos, sintácticos o semánticos.

 Por ejemplo: Los programas que  corrigen los signos de puntuación de las frases en función del significado de las mismas o las concordancias entre un adjetivo y un nombre en un sintagma.

subir


Recursos lingüísticos

 Los recursos lingüísticos son elementos esenciales para el desarrollo de aplicaciones basadas en Tecnologías Lingüísticas. Éstos constituyen una de las principales formas de representar el conocimiento de la lengua. Son recursos lingüísticos:

- Léxicos

Un léxico es un conjunto de palabras y de información sobre ellas acerca de su estructura gramatical (morfología), su estructura fonética (fonología) o su significado (semántica) en diferentes contextos.

Por ejemplo: existen algunos casos especiales de léxicos como son las Redes de Palabras (Wordnets) que describen las relaciones existentes entre las palabras que las forman (sinónimos, antónimos, sustantivos, colectivos, etc.). Éstos tienen una gran utilidad para la búsqueda de información, las herramientas integradas de apoyo a la traducción y los sistemas ofimáticos inteligentes de creación de documentos.

- Gramáticas computacionales

Estas gramáticas describen la estructura de una lengua en diversos niveles: palabra (gramática morfológica), frase, oración, etc.

Por ejemplo: Las gramáticas pueden tratar la estructura en términos de significado (semántica y discurso) o en términos de sintaxis.

-  Corpus

Un corpus es una muestra amplia de lengua  escrita o hablada que proporciona las bases para:

            · analizar la lengua y determinar sus características

            · verificar empíricamente la teoría lingüística

            · entrenar a las máquinas para adaptar su comportamiento

Por ejemplo: un corpus puede contener grabaciones de conversaciones entre agentes de viajes y clientes que luego se utilizarán para desarrollar un sistema telefónico automático de reservas que reconoce las  órdenes verbales del cliente.

 

subir


Implicaciones sociales y económicas

El desarrollo de la ingeniería lingüística contribuye a la mejora de la calidad en la educación, la ayuda a los discapacitados, la mejora de la oferta de ocio y de los servicios de las empresas y la administración y, por tanto, ayuda a  todos los ciudadanos en la creación de una sociedad mejor. Estas son algunas de sus ventajas:

- Mayores posibilidades de un acceso de calidad a la información y a los servicios.

- Cooperación y comunicación internacional más eficaz.

- Accesibilidad y participación: mayores oportunidades para integrar a los discapacitados en la vida profesional y en las actividades sociales cotidianas.

- Mas seguridad gracias a las técnicas de verificación del locutor.

- Mejores oportunidades para la educación, ocio y creatividad.

 

subir


Beneficios

 La clave de la sociedad de la información multilingüe reside en nuestra capacidad para desarrollar la utilización de la lengua. Los nuevos avances de las Tecnologías Lingüísticas nos permitirán:

- Acceder a la información que necesitamos realmente, ahorrando tiempo y evitando sobrecargas de información

- Hablar con nuestros ordenadores en casa, en el trabajo, en el coche o en lugares públicos cuando necesitemos información y ayuda

- Posibilidad de establecer contactos con otras culturas evitando las barreras idiomáticas

- Intervenir con más eficacia en los negocios, la administración o en el ámbito internacional

subir

línea divisoria
La Oficina del Español en la Sociedad de la Información del Instituto Cervantes es miembro institucional de las siguientes asociaciones:
SEPLN, ELRA, EAMT
 
 
El Instituto Cervantes agradece el patrocinio de:
Telefonica
SEPLN ELRA EAMT Telefónica
Instituto Cervantes, Madrid (España), 2009. Reservados todos los derechos