Español (spanish formal Internacional)English (United Kingdom)

e-Ciencia Semántica

semanticescienceLos rápidos avances de las tecnologías transforman la manera en que se realiza la investigación científica. El análisis y almacenamiento de datos ha pasado desde un actividad manual a una actividad en la que las computadoras son vitales. Como resultado, una enorme cantidad de datos científicos se está recogiendo o produciendo diariamente mediante equipos de cómputo. Ninguna organización de investigación individual tiene suficientes recursos para recoger todo, de ahí que la recogida de datos y procesos de almacenamiento estén distribuidos y dispersos en diferentes lugares. Tampoco ningún grupo de investigación individual tiene el poder de cómputo para procesar todos estos datos. Además, la colaboración entre científicos de diferentes instituciones o disciplinas es necesaria en muchas ocasiones para aplicar una gama de métodos y modelos para analizar y procesar la avalancha de información, y la capacidad de acceder a bases de datos y la reutilización, métodos, modelos y resultados de las actuales publicaciones científicas en general, garantiza una mayor eficacia y mejor calidad en la investigación que se puede realizar.
 

El desarrollo de la e-Ciencia es una respuesta a estas nuevas tendencias en la investigación científica. E-ciencia fue concebida originalmente como la aplicación de la informática a las ciencias tradicionales (en su mayoría empíricos, aunque en algunos casos teóricos también) con el fin de ayudar a los científicos con sus investigaciones en las actividades tradicionales tales como el modelado, simulación y predicción, entre otros. Sin embargo, ahora la e-Ciencia se puede considerar que han ido más lejos que eso, e incluso está siendo considerada como una tercera pata del método científico, junto con los teórica y empírica, mediante la introducción de un nuevo entorno en la investigación científica que también ha dado lugar a nuevos métodos de investigación que pueden llevar potencialmente a una mejor ciencia.

Dar soporte a algunas de estas nuevas exigencias derivadas de este nuevo enfoque de la ciencia requiere, en algunos casos, la definición explícita del significado de los datos sobre estos diferentes dominios. Este es el papel que las semánticas explícitas y sus tecnologías asociadas, modelos y métodos de reproducción pueden jugar en el contexto de lo que se conoce como e-Ciencia semántica. Es decir, mientras que tradicionalmente la e-Ciencia se ha dirigido principalmente hacia cuestiones de cálculo y distribución de datos, interoperabilidad y alto rendimiento en tareas de investigación científicas tradicionales y no tradicionales, el foco principal de la e-Ciencia semántica está en la aplicación de la semántica explícita sobre la infraestructura  de la e-Ciencia para aumentar la interpretación precisa de la información, los análisis científicos más eficientes y mejor colaboración entre los científicos, entre otros.

Proyectos

Actualmente tenemos los siguientes proyectos de la UE en ejecución en este ámbito: el proyecto Wf4Ever, la Red de Excelencia PlanetData y la Marie Curie Initial Training Network SCALUS. Asimismo, también se encuentra en ejecución el proyecto nacional myBigData .

Los proyectos anteriores en esta área incluyen ADMIRE STREP y OntoGrid.

Principales resultados

El trabajo realizado en esta área de investigación se ha centrado principalmente en:

  1. La integración basada en ontologías de fuentes de datos heterogéneas científicas y no científicas. Importantes pasos hacia ese objetivo son la prestación de soporte a consultas en SPARQL en  SPARQL endpoints distribuidos, con un banco de pruebas en el dominio de la bioinformática que hace uso de Bio2RDF endpoints  y algunos resultados iniciales en la planificación de consultas sobre fuentes de datos distribuidas. Resultados anteriores, que se siguen utilizando en varios proyectos de e-Ciencia semántica, son la arquitectura S-OGSA y sus correspondientes infraestructuras tecnológicas:
    • Buil-Aranda, C., Arenas, M., Corcho, O., Polleres, A., "Federating queries in SPARQL 1.1: Syntax, semantics and evaluation", Web Semantics: Science, Services and Agents on the World Wide Web, Volume 18, Issue 1, January 2013, Pages 1-17, 10.1016/j.websem.2012.10.001
    • Corcho, O., Alper, P., Kotsiopoulos, I., Missier, P., Bechhofer, S., Goble, C. (2006) An overview of S-OGSA: A Reference Semantic Grid Architecture. Journal of Web Semantics, 4 (2). pp. 102-115. ISSN 1570-8268
  2. La definición de modelos para describir experimentos científicos a través de “Research Objects” centrados en flujos de trabajo científicos, que además de describir el flujo de trabajo contienen las trazas de sus ejecuciones, sus relaciones con otros flujos de trabajo y todos aquellos elementos relacionados de alguna manera con el experimento (por ejemplo, los archivos o bases de datos utilizados, referencias, etc.) Esta actividad incluye esfuerzos adicionales para la definición de buenas prácticas y guías a la hora de gestionar y crear los Research Objects, así como estrategias para combatir la decadencia de los flujos de trabajo:
  3. La publicación de un conjunto de trazas de provenance product de las ejecuciones de numerosos flujos de trabajo. Dicho conjunto se ajusta al estándar de Provenance del W3C PROV-O, y aporta un conjunto de datos muy útil  a la hora de realizar diversos tipos de análisis sobre los resultados de los experimentos (cómo se han derivado los resultados, si se ha completado correctamente o no un experimento, creación de abstracciones sobre las trazas para ayudar a entender mejor lo que ha ocurrido, detección de errores ocurridos durante el experimento, etc.):
    • Khalid Belhajjame, Jun Zhao, Daniel Garijo, Aleix Garrido, Stian Soiland-Reyes, Pinar Alper and Oscar Corcho, A Workflow PROV-Corpus based on Taverna and Wings. To be presented in BigPROV13.
  4. Otra área de trabajo está relacionada con la comprensión de flujos de trabajo científico para mejorar la reutilización de los mismos, mediante el uso de su procedencia. Analizando manualmente las plantillas y las trazas, se han identificado un conjunto independiente de patrones de dominio en los flujos de trabajo científico que se podrían utilizar para simplificarlos y abstraerlos. Actualmente estamos trabajando en el reconocimiento automático de estas abstracciones, con el fin de simplificar la vista del flujo de trabajo a otras comunidades y que sea más fácil de entender. Los metadatos y la procedencia son la clave para facilitar esta tarea, ya que describen la historia y las principales características de todos los recursos en la ejecución de un flujo de trabajo:

    Miembros

    Esta área de investigación está liderada por Oscar Corcho, y el equipo está formado por la profesora María Pérez Hernández, el post-doc Rafael González, los estudiantes de doctorado José Mora, Freddy Priyatna, Daniel Garijo Verdejo, Idafen Santana Pérez y por la estudiante de doctorado Olga Ximena Giraldo.

    Lecturas recomendadas

    Algunas lecturas relacionadas con la e-Ciencia Semántica:

    Ofertas de trabajo

    Actualmente, no hay ninguna oferta de trabajo o becas disponibleas para este proyecto. Para ofertas en otros proyectos o áreas de investigación, visite la sección ofertas de trabajo.

    No obstante, puede contactar con Óscar Corcho para comprobar si hay posibles ofertas en un futuro cercano.

     

    Created under Creative Commons License - 2010 OEG.