Les problématiques de push de messages vers des clients connectés (encore appelé "web messaging") sont courantes dans les secteurs où l’information varie sur des temps très court, comme la finance, la sureté, la supervision ou encore les réseaux sociaux. Les données doivent être diffusées le plus rapidement possible à de nombreux clients, car ces données n'ont de valeur (ou d'intérêt) que pendant un temps limité.
Pour faire du web messaging, il existe aujourd’hui différentes techniques (polling, « comet » long polling et streaming) qui s’appuient sur des technologies variées (XmlHttpRequest, WebSocket, Flash socket, Silverlight socket, iFrame, RTMP). Le marché évolue d’ailleurs clairement dans ce sens : des solutions, jusqu’à présent concentrées sur la problématique Message-Oriented Middleware (RabbitMQ, HornetQ) offrent désormais une API HTTP, avec pour certaines d’entre elles, une API cliente basée sur WebSocket (même si cette technologie n’est pas encore compatible avec tous les navigateurs).
Nous allons ici parler d’une de ces solutions, permettant à la fois d’assurer une grande compatibilité et de hautes performances : Diffusion. Cet article a pour objet de présenter cette solution. Il se découpera en deux parties :
Diffusion est une solution standalone de diffusion de message éditée par la société PushTechnology, société fondée en 2006 et basée à Londres, spécialisée dans les problématiques de middleware orientés messages et de push web.
PushTechnology propose :
Le serveur Message Broker est un serveur orienté message développé en Java, multi-threadé et utilisant le framework NIO (gestion d’I/O non bloquantes) afin de garantir le service auprès d’un grand nombre de clients concurrents.
Citons quelques-unes des key features mises en avant par l’éditeur :
L’une des spécificités de la solution Diffusion, celle qui nous intéresse aujourd’hui, est qu’elle offre une surcouche orientée web (et donc sur protocole HTTP). Appelée internet message broker, cette surcouche permet de diffuser des messages via Internet à destination de navigateurs, clients mobiles ou clients lourds connectés. Des tests de performance réalisés par l’éditeur ont montré qu’il était possible de diffuser jusqu’à 90k messages par secondes auprès de tels clients via Internet (conditions de test non précisées).
Plusieurs API sont ainsi mises à disposition afin de connecter ces différents types de clients à un broker Diffusion, parmi lesquelles :
Les protocoles disponibles sont les suivants :
L’API JavaScript se différencie des autres API disponibles car elle possède un mécanisme de « fallback » : elle est capable de permuter parmi les 5 protocoles disponibles en fonction de la nature du client et de la connectivité disponible. Ce choix est donc transparent à la fois pour l’utilisateur et pour le développeur.
Comment fonctionne Diffusion et comment utiliser les différentes API mises à disposition afin d’implémenter rapidement une solution basée sur du web messaging ? Ouvrons un peu plus le capot…
Le schéma ci-après présente le schéma général d’une architecture Diffusion :
On distingue trois couches :
Nous allons détailler ces différentes couches dans ce qui suit.
Dans son implémentation la plus simple, une architecture Diffusion est constituée de Topics, de Publishers et de Clients. Transitent entre ces acteurs des TopicMessages, qui peuvent être routés de manière avancée grâce à différents mécanismes.
Les Topics sont des fils de messages sur lesquelles il est possible de publier. Ils peuvent être hiérarchisés en sous Topics. Ainsi, un message publié à la racine d’un arbre sera diffusé dans toutes ses branches, autrement dit dans chacun des sous Topics.
Les Topics peuvent être déclarés :
Les Publisher sont garants d’un ou plusieurs Topics mais également des Clients y souscrivant. Ils ont pour rôle de traiter les nouveaux messages et leur diffusion auprès d’un, plusieurs ou la totalité des clients ayant souscrit au Topic. Un Publisher peut être de deux types :
Ils ont donc à leur charge la transmission des nouveaux messages vers tout ou partie des clients ayant souscrit au Topic.
Les Clients se connectent sur un serveur Diffusion et s’inscrivent à un ou plusieurs Topics. Ils reçoivent ainsi tous les messages dès lors qu’ils sont publiés sur ces derniers, mais ils peuvent également en publier de nouveaux : la chaine de transmission des messages est bidirectionnelle.
Chaque Client possède sa propre pile de messages au sein d’une instance Diffusion. Cette pile est de type FIFO. Elle est alimentée par les Publishers et continuellement déchargée à destination du Client.
Un TopicMessage est l’implémentation des messages échangés entre les différents acteurs. Il se compose de fixed headers (utilisés par Diffusion pour sa mécanique interne), de user headers et d’un bloc user data (zone libre du message pour l’utilisateur).
Le contenu d’un message est binaire. Diffusion propose une hiérarchisation des données en deux niveaux grâce à des records, des fields et des delimiters. Ces delimiters sont en réalité de simples caractères ASCII, permettant de sérialiser simplement les données.
Il est possible d’utiliser des métadonnées afin de décrire les différents champs composants un message. Ces métadonnées permettent également de faire de la validation et de la transformation des données. Elles ne sont pas transmises avec le message et devront donc être connues à l’avance par les différents lecteurs du message.
Un TopicMessage existe sous deux formes :
Il peut également avoir trois états :
Aux différents acteurs étant en mesure de publier sur un Topic, nous pouvons ajouter l’EventPublisher. Il permet d’implémenter facilement des sources externes d’événements, directement connectées à un ou plusieurs Topics via un Publisher. Il peut s’intégrer à n’importe quel applicatif Java ou .Net grâce aux deux API mises à disposition.
Diffusion propose une gestion avancée des files de messages, avec entre autre les mécanismes suivants :
L’architecture et les mécanismes de Diffusion ne divergent pas tellement de celle d’un autre Message-Oriented Middleware, et les habitués retrouveront rapidement leurs marques. L’intérêt est ici de pouvoir connecter facilement un grand nombre de clients web, quel qu’en soit leur nature, à des files de messages.
Dans la seconde partie, nous aborderons, autour d’un use-case simple, les bases permettant de mettre en œuvre un navigateur connecté recevant des informations en temps réel depuis un serveur Diffusion.