mercredi 3 juin 2009

Technologie d'un moteur de recherche

Le projet Refertec 2009, moteur de recherche de ressources pédagogiques désormais en ligne depuis début mai, a nécessité la mise au point d'une technologie avancée pour le développement du "coeur" du moteur : la sélection de ressources dans une grande base de données, en fonction des mot-clés de l'internaute, s'appuie sur un algorythme complexe, pour garantir la pertinence des résultats, et organiser la présentation de ceux-ci. Plus de 60 critères sont utilisés conjointement ou successivement pour calculer la note de pertinence par rapport à la recherche de l'internaute (pour cet exercice Google en utilise environ 200). Une première passe s'effectue dans la base (requête sélective), pour isoler les ressources en rapport avec la recherche, puis un certain nombre de passes supplémentaire (requêtes qualificatives) viennent attribuer un certain nombre de points à certaines ressources en fonction de leur contenu réel. Une dernière passe (requête pondérative) vient attribuer un bonus ou un malus de points, en fonction de critères tels que popularité et fraîcheur de la page, accessibilité du site et indice de confiance global de celui-ci. (tout comme le fait Google, les pages disposant d'un contenu récent sont mises en avant - les blogs sont donc légèrement avantagés par rapport à un site traditionnel, tout au moins pendant quelques jours - cet avantage disparait automatiquement au bout d'un mois). Les données résultats sont alors triées selon leur note, puis présentées à l'internaute sous forme de pages de résultats (SERP), par groupe de 5 par défaut pour ne pas augmenter inutilement la longueur de la page HTML (ce paramètre est modifiable par l'internaute). "l'audimat" d'une page est également mesurée afin de distinguer les résultats sélectionnés par l'internaute pour une recherche : cet élément sera prochainement pris en compte dans les SERP.
L'intégration des liens commerciaux (appelés également liens sponsorisés), s'effectue grace au service Adwords de Google. Leur pertinence à la recherche, est optimisée grace à des balises spécifiques dans le code HTML des SERP, afin de faciliter le travail du robot temps-réel "google-mediapartner" : les liens commerciaux doivent apporter un plus à l'internaute, et ne doivent en aucun cas perturber sa recherche, aussi il est essentiel qu'ils soient le plus proche possible de sa requête initiale.

Un algorythme spécifique vient ensuite sélectionner quelques "termes de recherches proches", afin de proposer une alternative de recherche à l'internaute : ainsi de temps à autre, jusqu'à 8 suggestions similaires peuvent être affichés en bas des SERP. Ces suggestions sont extraites de l'historique des recherches des internautes sur le site, triées par pertinence, popularité et fraîcheur ...
la technologie développée pour ce moteur sera très prochainement valorisée sur un nouveau projet de portail Web ...

lundi 30 mars 2009

Moteur Refertec

Le projet de développement du nouveau moteur Refertec avance, mais subit un retard conséquent : la mise au point du robot d'indexation donne un peu de "fil à retordre" aux équipes ... Le projet est aussi passionnant que le web est complexe ... Les nouvelles technologies (notamment le Web 2.0) utilisées complexifient nettement le travail d'un bot. La version alpha a déjà commencé ses incursions sur le web, mais avec quelques arrêts au stand pour défaillances mécaniques mineures mais bloquantes ! Parallèlement, les designers sont déjà dans les starting blocks pour lancer la nouvelle interface de l'annuaire, qui après quelques ultimes corrections sera accessibles aux abonnés avant l'été. Le nouveau délai de lancement du bot est arrêté pour le 1er juin ... Retour au Perl et au php ...

mercredi 11 février 2009

Développement du nouveau moteur Refertec

Un nouveau projet qui prend forme pour les équipes de développement : la mise au point d'un robot sélectif "intelligent", et d'un nouveau moteur de recherche textuel pour Refertec. Le cahier des charges est basé sur la capacité de ce nouveau robot à sélectionner et classifier de nouvelles ressources pour l'annuaire (Refertec est spécialisé dans la classification des ressources pour l'enseignement de la technologie au collège - la sélection et le classement est aujourd'hui effectuée manuellement par une communauté d'enseignants webmaster).

Si le projet s'inspire des concepts technologiques développés par Google, il est néanmoins beaucoup plus sélectif (il n'a pas vocation à indexer tout le web, google le fait très bien !). A la différence de Googlebot, le robot a pour mission explicite de n'indexer que des ressources pertinentes pour la discipline visée. Un second traitement devra également associer les ressources trouvées à une ou plusieurs rubriques de l'annuaire.

Le robot (nom de code "RSB" pour Resource Search Bot) ira parcourir le web à partir du second trimestre 2009, et alimentera la base de données temporaire du moteur Refertec. Un agent sélecteur, ira analyser la pertinence des ressources collectées, calculer le TECRank *, classifier dans les rubriques correspondantes à l'aide d'un algorythme intelligent.

Le second volet du projet donnera naissance à un moteur de recherche textuel de nouvelle génération intégré au site (nom de code "R3" pour Relevant Rating Resource) ... Rendez-vous en mars !

*TECRank : technologie propriétaire de calcul de pertinence et popularité

mardi 3 février 2009

Mission iTOD

Mission réussie pour l'accompagnement du groupe Zodiac Marine & Pool dans une des étapes clés du projet iTOD ... La pierre angulaire du projet est la mise en place d'une nouvelle infrastructure s'appuyant sur les ressources d'IBM (serveurs, système collaboratif, DataCenter, Helpdesk ..), par le biais de liaisons Verizon. La migration du site d'Angers*, réalisée en partenariat avec Infologie, conclue favorablement la dernière phase préalable de ce projet dirigé par Joseph BEJJANI, CIO du groupe.

* après les sites Nord Américains de Vista et Oakville, et les deux autres sites français du PoolCare.

mercredi 7 janvier 2009

Nouveau projet SEO

En fin d'année 2008, Infologie a assuré la conception avec les équipes de LGC Loisirs Diffusion, de la boutique en ligne "La Galerie Créative". Nous avons mise en place la boutique via la solution "Infologie Commerce Success", solution propriétaire éprouvée batie à partir de la solution opensource "oscommerce" et de quelques-unes de ses contributions. Nous étions chargé de la mise en place, la personnalisation, le paramétrage fonctionnel de la boutique, et l'installation et la validation technique des modules de paiement ATOS (e-transactions du Crédit Agricole). Nous sommes responsable de l'administration technique de la boutique, ainsi que du SEO. Nous avons mis en place une stratégie de référencement manuel et semi-automatisé (technologie propriétaire Infologie), ainsi qu'une stratégie de sites de contenus satellites, notamment via les blogs spécialisés et attachés à la boutique comme le blog de la Design Team.

Projet CRM SalesForce

2008 aura été l'année du CRM pour Infologie. Après avoir développé ses propres solutions depuis 1998 (comme le CRM "Dinoutou"), nous avons pris le virage des applications en ligne et accompagné le groupe Zodiac Marine & Pool, dans la mise en place de SalesForce.com. Nous avons assuré la reprise des données existantes et l'écriture des ETL et des scripts de flux automatiques (ERP MOVEX, Hyperion

Présentation de la société Infologie

Présentation

Depuis 1998, Infologie est prestataire de services informatiques sur les Pays de la Loire. Nos domaines d'intervention vont de la mise en place d'infrastructures (serveurs, routeurs, LAN, WLAN ..), de postes de travail, au déploiement et paramétrage de solutions applicatives et collaboratives, jusqu'à l'infogérance des systèmes et réseaux.

Notre service ingénierie logiciel étudie et propose des solutions adaptées sous forme de briques logicielles complémentaires en parfaite liaison avec les systèmes d'informations existants.

Nous disposons d'un réseau de techniciens et de consultants senior compétents sur les domaines système Windows Server 200x, solution collaborative Exchange server/Outlook, bases de données, VPN et accès distant, intranet et web server,sécurité, CRM.

Infologie s'appuie sur un réseau de compétences direct de 6 personnes (Structure technique Synerlog), ainsi que sur divers partenariats spécifiques (ADVENTI, SR-CONSULTANTS, PV-LOGICIELS ..).

Références et retour d'expérience

Notre expérience et nos compétences reconnues nous ont permises d'être prestataire partenaire régional de Saint-Gobain Glass pour les sites industriels de la région dès 1999. Nous assurons l'infogérance bureautique des sites régionaux depuis 2005. Grâce à notre connaissance "métier", notre service développement a également fourni des solutions d'intégration et d'exportation EDI (LISEC Software, Albat&Wirsam alfak-alcim), une solution de gestion-consignation des agrès, Gestion du marquage R43 ..

Le développement d'une solution CRM pour une PME angevine en 1999 (Piscine Services Anjou), et l'infogérance totale de son système d'informations, nous a conduit, lors de son rachat par Zodiac, à être partenaire consultant pour le démarrage de l'ERP Movex et pour la mise en place du CRM SalesForce pour les secteurs PoolCare et Marine. Nous assurons aujourd'hui la correspondance technique pour la mise en place des infrastructures de Zodiac Marine & Pool, pour la société Zodiac Pool Care Europe.

Nous développons et administrons également des sites transactionnels marchand ou non, pour le compte de PME régionales en interne ou en partenariat avec des web-agencies telle que Visual-Link.