mercredi 11 février 2009

Développement du nouveau moteur Refertec

Un nouveau projet qui prend forme pour les équipes de développement : la mise au point d'un robot sélectif "intelligent", et d'un nouveau moteur de recherche textuel pour Refertec. Le cahier des charges est basé sur la capacité de ce nouveau robot à sélectionner et classifier de nouvelles ressources pour l'annuaire (Refertec est spécialisé dans la classification des ressources pour l'enseignement de la technologie au collège - la sélection et le classement est aujourd'hui effectuée manuellement par une communauté d'enseignants webmaster).

Si le projet s'inspire des concepts technologiques développés par Google, il est néanmoins beaucoup plus sélectif (il n'a pas vocation à indexer tout le web, google le fait très bien !). A la différence de Googlebot, le robot a pour mission explicite de n'indexer que des ressources pertinentes pour la discipline visée. Un second traitement devra également associer les ressources trouvées à une ou plusieurs rubriques de l'annuaire.

Le robot (nom de code "RSB" pour Resource Search Bot) ira parcourir le web à partir du second trimestre 2009, et alimentera la base de données temporaire du moteur Refertec. Un agent sélecteur, ira analyser la pertinence des ressources collectées, calculer le TECRank *, classifier dans les rubriques correspondantes à l'aide d'un algorythme intelligent.

Le second volet du projet donnera naissance à un moteur de recherche textuel de nouvelle génération intégré au site (nom de code "R3" pour Relevant Rating Resource) ... Rendez-vous en mars !

*TECRank : technologie propriétaire de calcul de pertinence et popularité