www.madridiario.es
Nueva tecnología de acceso a la información en biomedicina

Nueva tecnología de acceso a la información en biomedicina

miércoles 21 de diciembre de 2011, 00:00h
Investigadores del Departamento de Ingeniería del Software e Inteligencia Artificial de la Universidad Complutense de Madrid (UCM) han desarrollado un método para la generación automática de resúmenes de documentos del campo de la biomedicina. El método representa el documento como  un grafo semántico usando conceptos y relaciones procedentes del Unified Medical Language System (UMLS).
Es indudable que el acceso a la bibliografía del campo de la biomedicina resulta fundamental tanto para los profesionales de la salud como para los consumidores. Sin embargo, el volumen enorme de bibliografía disponible supone una amenaza para el aprovechamiento de la información en ausencia de tecnologías de acceso sencillas y eficaces.

La generación de resúmenes -o proceso por el cual se crea automáticamente una versión compacta de un texto mediante selección y/o generalización de la información más importante de la fuente- constituye una incuestionable ayuda para la gestión de esta sobrecarga de información. Además, la generación automática de resúmenes ha demostrado que mejora el indexado y la categorización de la bibliografía.

Uso de conceptos en lugar de palabras
Aunque la mayoría de los sistemas de generación de resúmenes están diseñados para ser multipropósito y por ello no tienen en cuenta las propiedades particulares de cada dominio y tipo de documento, estudios recientes han demostrado los beneficios de la generación de resúmenes basada en representaciones más ricas que hacen uso de fuentes de conocimiento de un dominio específico. Esta última tendencia representa los documentos usando conceptos en lugar de palabras, pudiéndose enriquecer mediante el uso de asociaciones semánticas entre conceptos (por ejemplo, sinonimia, hiperonimia, homonimia, concurrencias o asociaciones semánticas) para mejorar la calidad de los resúmenes. En particular, el UMLS (Unified Medical Language System) ha demostrado ser una fuente de conocimiento útil para la generación de resúmenes en el dominio de la biomedicina.

Investigadores del Departamento de Ingeniería del Software e Inteligencia Artificial de la Universidad Complutense de Madrid (UCM) han desarrollado un método para la generación automática de resúmenes de textos de biomedicina, basado en la representación del documento como un grafo que usa el UMLS para identificar conceptos y las relaciones semánticas entre ellos, y en el cálculo de la relevancia de las oraciones a extraer en relación a la importancia, peso o prestigio de los conceptos en el grafo del documento. De este modo se construye una representación más rica en conocimiento (semántica) que la proporcionada por los modelos tradicionales basados en términos.

Distintas estrategias para la generación de resúmenes
Los investigadores proponen tres estrategias o heurísticas para la selección de oraciones, donde cada una de ellas pretende construir un tipo diferente de resumen según el tipo de información en la fuente que es probable que se incluya en el resumen.

Además, el generador de resúmenes se enfrenta a diversos problemas derivados de las peculiaridades de la terminología biomédica, tales como la ambigüedad léxica y el uso de acrónimos y abreviaturas.

“Al evaluar los resúmenes automáticos frente a los resúmenes manuales de los autores, se ha encontrado que la mejor estrategia o heurística es aquella que selecciona la mayor parte de la información del principal tema del documento, pero también incluye otra información secundaria o “satélite” que podría ser relevante para los usuarios”, explica Laura Plaza.




¿Te ha parecido interesante esta noticia?    Si (0)    No(0)


Normas de uso

Esta es la opinión de los internautas, no de Madridiario

No está permitido verter comentarios contrarios a la ley o injuriantes.

La dirección de email solicitada en ningún caso será utilizada con fines comerciales.

Tu dirección de email no será publicada.

Nos reservamos el derecho a eliminar los comentarios que consideremos fuera de tema.