WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp

Home | Publier un mémoire | Une page au hasard

Memoire Online >

Informatique et Télécommunications

Mutualisation de requêtes XQuery sur des Flux RSS dans un environnement Pair-à-Pair

( Télécharger le fichier original )
par Mohammed Salah Benamira
Université de Versailles Saint Quentin en Yvelines - Master 2 Recherche 2007

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

2.1.3 Les principales balises

Le contenu d'un document RSS se situe toujours entre les balises <rss>. Elles possèdent obligatoirement un attribut version qui spécifie la version à laquelle le document RSS est conforme.

Au niveau suivant de cette balise se trouve une unique balise <channel> qui contiendra les métadonnées du flux RSS, obligatoires ou non, ainsi que la liste des contenus.

2.1.4 Métadonnées

En ce qui concerne les métadonnées, trois éléments sont obligatoires dans un channel:

· <title> : Définit le titre du flux ;

· <description> : Décrit succinctement le flux ;

· <link> : Définit l'URL du site correspondant au flux.

D'autres éléments optionnels existent comme :

· <pubDate> : Définit la date de publication du flux ;

· <image> : Permet d'insérer une image dans le flux ;

· <language> : Définit la langue du flux.

2.1.5 Contenu : Description de chaque article

Pour chaque article, une balise <item> est ajoutée dans notre document.

Dans cette balise se trouvent les données correspondantes à l'actualité sous forme de balise. Les balises les plus courantes sont :

· <title> : Définit le titre de l'actualité.

· <link> : Définit l'URL du flux correspondant à l'actualité.

· <pubDate> : Définit la date de l'actualité.

· <description> : Définit une description succincte de l'actualité.

· <guid> : Définit de manière unique l'actualité.

Selon la DTD RSS 2.0, il doit y avoir au moins un <title> ou une <description> dans un item et le reste des balises est optionnel.

D'autres balises existent comme :

· <author> : Définit l'adresse électronique (mail) de l'auteur.

· <category> : Associe l'item à une catégorie.

· <comments> : Définit l'URL d'une page de commentaire en rapport avec l'item.

· <namespaces> : C'est une extension des flux RSS qui permet d'inclure des nouvelles fonctionnalités comme iTunes par exemple.

2.2 Les réseaux Pair-à-Pair

Une définition du Pair-à-Pair ou P2P ou pair à pair est : «Pair-à-Pair computing is the sharing of computer resources and services by direct exchange between systems» [5]. Une autre définition est : «Pair-à-Pair refers to a class of systems and applications that employ distributed resources to perform a critical function in a decentralized manner» [6].

2.2.1 Objectif Pair-à-Pair

Le modèle P2P étant très général, des applications de nature très différentes peuvent l'utiliser, les objectifs sont variés [4] :

· Partage et réduction des coûts entre les différents pairs ;

· Fiabilité et passage à l'échelle, l'absence d'élément centralisé pour l'échange des données permet d'accroître la fiabilité en supprimant tout point central de panne et d'améliorer le passage à l'échelle en évitant les goulots d'étranglement ;

· Localisation des ressources. Ceci permet l'Agrégation des ressources et interopérabilité, en mettant en commun des ressources individuelles comme de la puissance de calcul ou de l'espace de stockage.

· Aucune administration centralisée : autonomie des pairs en l'absence d'une autorité centrale. Les pairs peuvent se connectés/déconnectés à tout moment

· Communication ad-hoc et collaborative.

2.2.2 Classification des systèmes Pair-à-Pair

Plusieurs études essayent de classifier, les systèmes Pair-à-Pair. Trois grandes catégories peuvent être identifiées : centralisé, décentralisé, et hybride. La catégorie décentralisée peut encore être divisée en structurée et non structurée. La différence principale entre ces systèmes est le mécanisme utilisé pour rechercher des ressources dans le réseau Pair-à-Pair.

2.2.2.1 Réseaux Pair-à-Pair centralisés

Dans les systèmes Pair-à-Pair centralisés, la description et l'adresse des ressources sont stockées dans un annuaire d'un serveur central. Ainsi, les noeuds envoient des requêtes au serveur central pour trouver quels noeuds ont les ressources désirées. Le serveur ne fournit que la capacité de rechercher et négocie les téléchargements entre clients. De ce fait, le contenu reste du côté client, ne passant jamais par le serveur. Après avoir reçu une requête d'un pair, l'index central recherche le meilleur pair dans son annuaire pour répondre à sa requête. Le meilleur pair est celui qui est le plus économique, le plus rapide ou le plus disponible selon les besoins de l'utilisateur. Lorsque le nombre de participants devient trop grand ce modèle comporte quelques inconvénients dus à son infrastructure centralisée, notamment la surcharge de l'annuaire responsable d'accueillir les informations de tous les participants. Cette catégorie de réseaux Pair-à-Pair ne peut pas s'étendre à de très grands réseaux. De plus, l'existence d'un centre unique, même s'il est dupliqué, ne permet pas une bonne fiabilité du réseau. Celui-ci peut tomber en panne à cause d'un seul noeud. Napster a été l'exemple le plus connu reposant sur ce modèle.

2.2.2.2.a Réseaux Pair-à-Pair décentralisés et non structurés

Les systèmes décentralisés et non structurés sont ceux au sein desquels il n'existe ni annuaire centralisé, ni connaissance où se situent les noeuds du réseau (la topologie), ni adresse sur l'emplacement des fichiers. Le logiciel de P2P Gnutella en est un exemple. Ce réseau est formé de noeuds qui rejoignent le réseau P2P en suivant quelques règles simples. L'emplacement des fichiers n'est fondé sur aucune connaissance de la topologie. Pour trouver un fichier, un pair demande tout simplement à ses voisins qui eux-mêmes vont demander à leurs voisins s'ils n'ont pas le fichier considéré, et ainsi de suite. Ces architectures non structurées sont extrêmement résistantes aux noeuds entrant et sortant du système. Par contre, l'actuel mécanisme de recherche n'est pas adapté aux très grands réseaux (on dit que le réseau ne passe pas à l'échelle) et génère une charge importante sur les participants du réseau. Les exemples de cette catégorie sont nombreux comme FreeNet ou Gnutella.

2.2.2.2.b Les réseaux Pair-à-Pair décentralisés mais structurés

Les systèmes décentralisés mais structurés n'ont toujours pas de serveur central mais ils sont « structurés » dans le sens où leur topologie est strictement contrôlée et les fichiers sont stockés dans des endroits spécifiques pour faciliter les recherches. Ils sont dits structurés car les noeuds participants à l'application P2P sont reliés entre eux selon une structure particulière comme un anneau. Ce type de réseau a été défini pour rendre des services de routage et de localisation fondés sur le Pair-à-Pair.

Les systèmes Pair-à-Pair décentralisés mais structurés possèdent un algorithme de recherche pour lequel une ressource donnée se trouve en un endroit parfaitement déterminé à l'avance. Cet endroit a été calculé pour qu'il soit le plus simple d'accès aux autres peers du réseau.

L'algorithme de recherche est donc complètement déterministe, et les liens entre les pairs sont faits suivant des règles bien définies. Cette structure permet la découverte efficace des fichiers partagés. De plus, elle est particulièrement appropriée au développement de réseaux à grande échelle. Dans cette catégorie, on peut placer Chord, CAN (Content Adressable Network), Tapestry, Pastry, Kademlia et Viceroy.

2.2.2.3 Les réseaux Pair-à-Pair hybrides

Les réseaux hybrides permettent de résoudre des problèmes de l'approche purement distribuée tout en gardant l'efficacité de la solution centralisée. Les réseaux fondés sur ces mécanismes de localisation et de routage de données peuvent supporter un nombre de pairs de l'ordre du million. Cette solution combine les caractéristiques des modèles centralisés et décentralisés. La décentralisation signifie, entre autres, l'extensibilité, la tolérance aux fautes et le passage à l'échelle. La centralisation partielle implique quelques centres serveurs qui contiennent des données importantes pour le système. Chaque utilisateur élit son Super-pair, qui est « le serveur central » pour « des noeuds locaux » et peut communiquer avec d'autres Super-pairs. FastTrack, KaZaA, BitTorrent, eDonkey/eMule en sont quelques exemples.

précédent sommaire suivant

Changeons ce systeme injuste, Soyez votre propre syndic

"L'ignorant affirme, le savant doute, le sage réfléchit" Aristote