The main purpose of search engines, which support the task of Information Retrieval, is to provide the users with an easy method to find information on the Web. Despite their advantages, Web search engines still have numerous limitations. Several works have been done to enhance information access systems and offer a better user experience in different fields such as distributed and contextual information retrieval, link analysis and exploratory search. This thesis deals with Web Information Foraging, which is a recent information access paradigm that aims at discovering paths leading to relevant information on the Web. The principal goal of the research undertaken during the Ph.D. has been to design and implement effective and efficient Information Foraging systems based on multi-agent technology. For this purpose, we investigated Information Foraging in different domains including health, scientific publications and social media. To address this issue, we proposed a modular architecture with two important phases for the Information Foraging system to be developed. The first phase is a learning process, which aims to locate the most relevant Web pages that might interest the user according to his/her interests. This can be performed on a fixed instance of the Web. The second phase takes into account the openness and dynamicity of the Web and it consists of an incremental learning starting from the results of the first phase and reshaping the outcomes taking into account the changes that occur on the Web. The whole system offers a tool to help users access information online easily. The development of the system went through three important steps, where different concepts and technologies were used in order to achieve both effectiveness and efficiency and also to make the system able to operate on various environments.
Lo scopo principale dei motori di ricerca, che supportano il compito di information retrieval, è quello di fornire agli utenti un metodo facile per trovare informazioni sul Web. Nonostante i loro vantaggi, i motori di ricerca hanno ancora numerosi limiti. Sono state realizzate diverse opere per migliorare i sistemi di accesso alle informazioni e offrire un'esperienza di utilizzo migliore in settori diversi, come distribuite e contestuali information retrieval, link analysis e exploratory search. Questa tesi si occupa di Web Information Foraging, un paradigma di information access più recente che mira a scoprire i percorsi che portano a informazioni rilevanti sul Web. L'obiettivo principale della ricerca intrapresa durante il Ph.D. è stato quello di progettare e implementare sistemi efficaci ed efficienti di Information Foraging basati sulla tecnologia multi-agent. A questo scopo, abbiamo studiato information foraging in diversi domini, tra cui salute, pubblicazioni scientifiche e social media. Per affrontare questo problema, abbiamo proposto un'architettura modulare con due fasi importanti per il sistema di Information Foraging. La prima fase è un processo di apprendimento che mira a localizzare le pagine Web più rilevanti che potrebbero interessare l'utente secondo i propri interessi. Questo può essere eseguito su un'istanza fissa del Web. La seconda fase tiene conto dell'apertura e della dinamicità del Web e consiste in un apprendimento incrementale partendo dai risultati della prima fase e ricondizionando i risultati tenendo conto delle modifiche apportate sul Web. L'intero sistema offre uno strumento per aiutare gli utenti a accedere facilmente alle informazioni online. Lo sviluppo del sistema ha attraversato tre importanti passaggi in cui sono stati utilizzati diversi concetti e tecnologie per ottenere efficacia ed efficienza e anche rendere il sistema in grado di operare in diversi ambienti. Innanzitutto, abbiamo proposto un approccio basato sulla Swarm Intelligence per simulare il processo di foraggicazione come descritto nella Information Foraging Theory. Abbiamo eseguito la nostra proposta utilizzando Bee Swarm Optimization (BSO) per realizzare un processo automatico di information foraging fondato sul comportamento del foraggicazione delle informazioni dell'uomo. Conoscendo che BSO è un approccio di swarm intelligence che coinvolge agenti reattivi e che il concetto di Information Foraging si basa sulla natura, abbiamo pensato che questo potrebbe essere uno dei modi più appropriati per affrontare il problema del Web Information Foraging. Per convalidare la nostra proposta, sono stati condotti esperimenti su MedlinePlus, un sito dedicato al dominio medico e che contiene informazioni su oltre 1000 malattie e condizioni sanitarie. I risultati sono stati promettenti e hanno dimostrato la capacità di Information Foraging di accedere alle informazioni pertinenti sul Web in base agli interessi di un utente.
(2017). Web information foraging using Multi-agent System. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2017).
Web information foraging using Multi-agent System
DRIAS, YASSINE
2017
Abstract
The main purpose of search engines, which support the task of Information Retrieval, is to provide the users with an easy method to find information on the Web. Despite their advantages, Web search engines still have numerous limitations. Several works have been done to enhance information access systems and offer a better user experience in different fields such as distributed and contextual information retrieval, link analysis and exploratory search. This thesis deals with Web Information Foraging, which is a recent information access paradigm that aims at discovering paths leading to relevant information on the Web. The principal goal of the research undertaken during the Ph.D. has been to design and implement effective and efficient Information Foraging systems based on multi-agent technology. For this purpose, we investigated Information Foraging in different domains including health, scientific publications and social media. To address this issue, we proposed a modular architecture with two important phases for the Information Foraging system to be developed. The first phase is a learning process, which aims to locate the most relevant Web pages that might interest the user according to his/her interests. This can be performed on a fixed instance of the Web. The second phase takes into account the openness and dynamicity of the Web and it consists of an incremental learning starting from the results of the first phase and reshaping the outcomes taking into account the changes that occur on the Web. The whole system offers a tool to help users access information online easily. The development of the system went through three important steps, where different concepts and technologies were used in order to achieve both effectiveness and efficiency and also to make the system able to operate on various environments.File | Dimensione | Formato | |
---|---|---|---|
phd_unimib_811389.pdf
accesso aperto
Descrizione: tesi di dottorato
Tipologia di allegato:
Doctoral thesis
Dimensione
7.6 MB
Formato
Adobe PDF
|
7.6 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.