PhD. Thesis

Authoring Dynamic Web Documents Using Ontologies and Programming by Demonstration Techniques

José Antonio Macías Iglesias

Directed by Pablo Castells Azpilicueta

Departamento de Ingeniería Informática

Escuela Politécnica Superior

Universidad Autónoma de Madrid

September 2003

 

Abstract

 

Nowadays, the World Wide Web has become a popular information distribution medium where, in the beginning, most of pages were static and hand-written to mostly turn out to supply dynamically generated web pages through specialized web servers whom provide information coming from customized storage sources.

Such a fact resulted in enhancing web power and expressivity but, on the other hand, in decreasing the ease of use for editing and creating web documents by non expert-in-programming users.

This Ph.D. thesis is aimed at supplying with a WYSIWYG authoring tool for providing the final user with an easy-to-use interface in order for enabling him/her to edit dynamically generated web pages, as well as avoiding the author from having to manipulate complex textual programming languages focused on the construction and specification of web documents.

Techniques presented in this work are focused on the use of ontologies, as a first order concern in mostly today’s related web research fields, as well as on strategies for end-user development. Such techniques are intended to recognize implicit user’s intents under a programming environment by means of Programming by Demonstration’s mechanisms. Furthermore, explicit heuristics are exploited to detect meaningful fragments located on HTML pages, using ontologies to characterize contents and separate them from presentation’s structures on web pages. The goal is to provide with feedback about page generation, enabling to build a conceptual reverse path that starts from the generated web page towards the procedural information about generation.

Most of techniques used in this thesis are put into practice by means of an authoring tool called DESK. Furthermore, others authoring tools, such as PEGASUS, for knowledge representation and dynamic web documents generation, PERSEUS for authoring interactive knowledge, and finally HADES for managing modules and integration, are taking into account to bring off the challenge of authoring dynamically generated web pages.

 

INDEX

Front Page, Abstract, Acknowledgements and Index

Capítulo I. Introducción .................................................................................................. 1

 

    1.1 Definición del problema............................................................................................ 2

    1.2 Objetivos................................................................................................................. 3

    1.3 Solución aportada..................................................................................................... 4

       1.3.1 Autoría mediante ejemplos.................................................................................. 4

       1.3.2 Herramientas complementarias............................................................................ 5

    1.4 Dificultades............................................................................................................... 6

    1.5 Principales aportaciones............................................................................................ 8

    1.6 Limitaciones............................................................................................................. 8

    1.7 Estructura del trabajo presentado............................................................................ 10

    1.8 Terminología empleada........................................................................................... 10

 

Capítulo II. Trabajo Relacionado................................................................................. 13

 

    2.1 Introducción........................................................................................................... 14

    2.2 Extracción automática del conocimiento en documentos web................................... 15

       2.2.1 Sistemas de extracción de información.............................................................. 16

       2.2.2 Wrappers......................................................................................................... 16

       2.2.3 Detección de estructuras especiales en documentos web................................... 18

       2.2.4 Minería de datos en la web............................................................................... 20

          2.2.4.1 Restrospectiva............................................................................................ 20

          2.2.4.2 Áreas de aplicación.................................................................................... 21

    2.3 Paradigma de la Programación por Demostración.................................................... 22

       2.3.1 Entornos demostracionales................................................................................ 23

       2.3.2 Detección de tareas iterativas............................................................................ 26

       2.3.3 Asistencia al usuario durante la navegación y edición web.................................. 27

    2.4 Interfaces de usuario basadas en modelos............................................................... 30

       2.4.1 Desarrollo de interfaces de usuario.................................................................... 30

       2.4.2 Modelización de tareas..................................................................................... 33

    2.5 Sistemas web hipermedia........................................................................................ 36

       2.5.1 Retrospectiva................................................................................................... 37

       2.5.2 Sistemas web hipermedia adaptativos................................................................ 38

          2.5.2.1 Clasificación............................................................................................... 38

          2.5.2.2 Ejemplos de sistemas hipermedia adaptativos.............................................. 40

       2.5.3 La autoría en los sistemas web hipermedia......................................................... 42

    2.6 La red semántica.................................................................................................... 44

       2.6.1 Separación entre contenidos y presentación....................................................... 45

       2.6.2 Retrospectiva................................................................................................... 46

       2.6.3 Áreas de aplicación.......................................................................................... 46

       2.6.4 Lenguajes de definición de ontologías................................................................ 47

       2.6.5 Herramientas.................................................................................................... 49

       2.6.6 Minería de datos en la web semántica............................................................... 51

 

Capítulo III. Generación de Documentos Web Dinámicos......................................... 53

 

    3.1 Introducción........................................................................................................... 54

    3.2 PEGASUS............................................................................................................. 54

       3.2.1 Representación del conocimiento...................................................................... 55

          3.2.1.1 Ontología................................................................................................... 56

          3.2.1.2 Modelo del dominio.................................................................................... 57

       3.2.2 Modelo de la presentación................................................................................ 58

          3.2.2.1 Plantillas..................................................................................................... 58

          3.2.2.2 Reglas........................................................................................................ 60

       3.2.3 Arquitectura..................................................................................................... 61

    3.3 Herramientas de autor............................................................................................. 63

       3.3.1 Creación del modelo del dominio mediante PERSEUS...................................... 63

          3.3.1.1 Creación de una ontología del dominio........................................................ 64

          3.3.1.2 Creación de una red semántica de objetos del dominio................................ 66

          3.3.1.3 Generación del modelo del dominio............................................................. 66

       3.3.2 Autoría del diseño de página mediante DESK................................................... 68

       3.3.3 Integración mediante HADES........................................................................... 68

 

Capítulo IV. Autoría Mediante Ejemplos..................................................................... 71

 

    4.1 Introducción........................................................................................................... 72

    4.2 La herramienta de autor DESK............................................................................... 74

    4.3 DESK cliente......................................................................................................... 76

       4.3.1 Heurísticas de bajo nivel................................................................................... 78

       4.3.2 El modelo de monitorización............................................................................. 81

    4.4 DESK servidor....................................................................................................... 84

       4.4.1 Mecanismos de inferencia en el servidor............................................................ 84

       4.4.2 Heurísticas de alto nivel..................................................................................... 86

          4.4.2.1 Módulo de localización de contexto semántico............................................ 86

          4.4.2.2 Módulo de construcción de un modelo abstracto de la

                      presentación............................................................................................... 91

          4.4.2.3 Módulo de desambiguación........................................................................ 93

    4.5 Tratamiento de reglas de presentación PEGASUS bajo DESK................................ 96

       4.5.1 Generación de semántica adicional en la presentación........................................ 98

       4.5.2 Reconocimiento y tratamiento de meta-información bajo DESK........................ 98

    4.6 Agente de inferencia DESK.................................................................................. 100

       4.6.1 Configuración del agente................................................................................. 102

       4.6.2 Detección de patrones iterativos...................................................................... 104

          4.6.2.1 Patrones regulares.................................................................................... 105

          4.6.2.2 Patrones no regulares................................................................................ 108

       4.6.3 Ejecución de los cambios detectados por el agente DESK............................... 109

    4.7 Extensiones no WYSIWYG................................................................................. 110

    4.8 Un ejemplo completo............................................................................................ 113

       4.8.1 El ejemplo propuesto...................................................................................... 114

       4.8.2 Creación de la ontología y los objetos del dominio........................................... 114

       4.8.3 Generación de la presentación......................................................................... 118

       4.8.4 Autoría de la presentación generada................................................................ 121


Capítulo V. Evaluación y Conclusiones...................................................................... 129

 

    5.1 Introducción......................................................................................................... 130

    5.2 Evaluación empírica del sistema propuesto............................................................ 131

       5.2.1 Experiencia con DESK................................................................................... 131

       5.2.2 El ejemplo propuesto...................................................................................... 133

       5.2.3 Resultados, discusión y conclusiones sobre la experiencia................................ 136

          5.2.3.1 Datos medidos durante la interacción........................................................ 137

          5.2.3.2 Opinión de los usuarios sobre DESK........................................................ 139

          5.2.3.3 Conclusiones finales sobre la experiencia................................................... 142

    5.3 Discusión y comparativa con otros sistemas........................................................... 144

    5.4 Aportaciones........................................................................................................ 149

    5.5 Recapitulación...................................................................................................... 150

       5.5.1 Autoría de documentos web dinámicos........................................................... 150

       5.5.2 Herramientas complementarias........................................................................ 153

    5.6 Trabajo futuro...................................................................................................... 155

 

ANEXO........................................................................................................................ 159

 

    1 Cuestionario presentado para la evaluación de la experiencia

       de autoría con DESK.............................................................................................. 160

    2 Página web inicial presentada al usuario para la experiencia

       de autoría con DESK.............................................................................................. 163

    3 Página web final presentada al usuario para la experiencia

       de autoría con DESK.............................................................................................. 165

 

Bibliografía................................................................................................................... 167


Publications concerning this PhD. Thesis can be found by clicking here

You can download the .ZIP file by clicking here (4MB)



Maintained by José Antonio Macías

Last Update: 19 September  2003