RMG – Un moteur de recherche salésien : donbosco.info

18 avril 2025

(ANS - Rome) - Dans le cadre des travaux de rédaction du Bollettino Salesiano OnLine (BSOL), le Bulletin Salésien en ligne, il est devenu nécessaire de créer divers outils de support, dont un moteur de recherche dédié. C'est ainsi que donbosco.info est né.

Ce moteur de recherche a été conçu en tenant compte des limitations actuellement présentes dans les différentes ressources salésiennes disponibles dans le Web. De nombreux sites Web proposent des systèmes d'archives avec fonction de recherche, mais ils sont souvent incapables de localiser toutes les occurrences des mots, en raison de limitations techniques ou de restrictions introduites pour éviter de surcharger les serveurs.

Pour surmonter ces difficultés, plutôt que de construire une simple archive de documents avec une fonction de recherche, l'équipe qui a développé le projet a créé un véritable moteur de recherche, doté également d'une fonction de lecture. Il s'agit d'une solution complète, basée sur du matériel dédié et un logiciel spécifiquement développé.

Lors de la phase de conception, deux options ont été évaluées : un logiciel à installer localement, ou une application côté serveur accessible via le Web. La mission du Bulletin Salésien en Ligne étant de diffuser le charisme salésien au plus grand nombre de personnes, il a été décidé d'opter pour la solution Web, afin de permettre à chacun de rechercher et de consulter les documents salésiens.

Le moteur de recherche est disponible sur www.donbosco.info

L'interface web est volontairement essentielle, pour assurer une plus grande vitesse de chargement. La « page d’accueil » répertorie les fichiers et dossiers présents, dans le but de faciliter leur consultation. Les documents ne sont pas seulement en italien, mais également disponibles dans d'autres langues, sélectionnables via l'icône appropriée en haut à gauche.

La plupart des fichiers téléchargés sont au format PDF, obtenus à partir de numérisations par OCR (reconnaissance optique de caractères). Étant donné que l’OCR n’est pas toujours parfait, il arrive que tous les mots recherchés ne soient pas détectés. Pour faire face à cela, plusieurs stratégies ont été mises en œuvre : ignorer la ponctuation et les caractères accentués ou spéciaux, et permettre les recherches même en présence de caractères manquants ou incorrects. Vous trouverez plus de détails dans la section FAQ, accessible en bas de page.

Compte tenu de la présence de milliers de documents, la recherche peut renvoyer un très grand nombre de résultats. Pour cette raison, il est possible d'affiner la recherche par dossiers, titre, auteur ou année : les critères sont cumulatifs et aident à trouver plus rapidement ce dont on a besoin. Les résultats sont répertoriés en fonction d'un score de pertinence, qui prend actuellement en compte principalement la densité des mots-clés dans le texte et leur proximité.

Idéalement, il serait préférable d'avoir des documents au format vectoriel plutôt que scannés, car la recherche serait toujours précise et les fichiers seraient plus petits, avec des avantages conséquents en termes de rapidité.

Le projet, comme on peut bien le comprendre, est ambitieux et d’une grande importance pour l’ensemble du monde salésien. C'est pourquoi le P. Andrei Munteanu, Directeur du BSOL et promoteur du projet du moteur de recherche, invite chacun à collaborer : « Si vous disposez de documents au format vectoriel ou de meilleure qualité que ceux déjà présents dans le moteur de recherche, vous pouvez les télécharger via le service de téléchargement disponible sur www.donbosco.space. Vous pouvez également ajouter d'autres documents non présents dans le moteur de recherche. Pour obtenir vos identifiants de connexion (nom d'utilisateur et mot de passe), veuillez envoyer une demande par courriel à Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. ».

InfoANS

ANS - “Agence iNfo Salésienne” – est un périodique pluri-hebdomadaire télématique, organe de communication de la Congrégation salésienne, inscrit au Registre de la Presse du Tribunal de Rome, n. 153/2007.

Ce site utilise également des cookies d’autres provenances, pour enrichir l’expérience des utilisateurs et pour des raisons statistiques.En parcourant cette page ou en cliquant sur un de ses éléments, vous acceptez la présence de ces cookies. Pour en savoir davantage ou refuser, cliquez sur l’indication « Autres informations ».