WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Youtaqa : système de questions-réponses intelligent basé sur le deep learning et la recherche d’information


par Rayane Younes & Asma AGABI & TIDAFI
Université d'Alger 1 Benyoucef BENKHEDDA - Master  2020
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

CHAPITRE 4. ANALYSE ET DISCUSSION DES RÉSULTATS

Les résultats présentés ci-dessus montrent que le Test Set contient 5928 questions ayant une réponse dans leurs contextes d'un total de 11873 questions. Notre MER a pu atteindre un Exact Match de 87% et un F1-Score de 92%.

4.6 Déploiement et test du système

Les résultats obtenus des questions sans réponses sont liés directement au manque d'informations sur la base de documents Wikipédia car il y a des questions qui sont subjectives comme l'opinion sur un sujet ou plus encore des questions de confirmation (les questions qui ont comme réponses «Oui» ou «Non»). De plus, et comme nous avons vu précédemment, chaque module présente une marge d'erreur à son niveau. Cela dit, la partie des résultats erronés obtenus sont dus à ces imperfections.

FIGURE 4.6: Exemple d'utilisation du système YouTaQA

Nous estimons que notre système affiche des performances globales acceptables en prenant en compte la marge d'erreur et les limites liées à la source d'information de notre système ainsi qu'un temps d'exécution moyen de 5 6 secondes seulement.

4.7 Conclusion

Dans ce dernier chapitre, nous avons présentéles résultats donnés par l'implémentation de notre architecture présentée dans le chapitre précédent. Nous avons testénos modules et avons présentéet discutéles résultats obtenus en calculant des métriques d'évaluation et en présentant des graphes afin de faciliter la comparaison des expérimentations.

43

Conclusion Générale

Le travail qui nous a étéconfiés dans le cadre de notre projet de fin d'études, consiste à concevoir et réaliser un système complet de questions-réponses basésur la recherche d'information.

Le but principal de notre système était de fournir une solution complète qui, après l'identification des problèmes rencontrés dans les travaux précédents, facilitera la réponse aux questions des utilisateurs. La tâche principale des systèmes QAS existants étant de répondre aux questions en exigeant tout de même un passage dans lequel il extrairait la réponse, notre système permettra aux utilisateurs d'automatiser la fourniture du passage en utilisant un moteur de recherche performant et rapide.

Nous nous sommes appuyés sur l'application des méthodes innovantes basées sur le Deep Learning afin de décrire et éliminer avec succès les anomalies et les problèmes que nous avons rencontrés au fil des étapes du développement de la solution.

Pour but de réaliser le pipeline complet de notre système nomméYouTaQA, nous avons tout d'abord implémentéun moteur de recherche en utilisant la base de documents « Wikipédia » comme source d'in-formations, tout en considérant chaque section d'article comme étant un document en lui-même afin d'affiner les résultats de recherche. Ensuite, en se basant sur le « Deep Learning» et spécialement le modèle BERT qui permet d'atteindre l'état de l'art à l'heure oùcette thèse a étérédigée, nous avons bâti un module de classification de documents qui sert à reclasser les passages résultants de notre moteur de recherche en lui fournissant la question et les 5 meilleurs passages, cela nous permet à chaque fois d'identifier le passage le plus probable et d'avoir une réponse exacte à une question donnée.

Étant notre Classifieur basésur le « Deep Learning », nous avons étéamenés à faire un entraînement à ce dernier, ce qui nous a poussés à choisir le DataSet de SQUAD réalisépar l'universitéde Stanford et qui fournit plus de 150.000 paires de question-passage et qui précise à chaque paire si le passage contient une réponse à la

44

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Ceux qui vivent sont ceux qui luttent"   Victor Hugo