graphique_tech-et-digital_janv2019ok

Tech & digital

Nous avons constitué une Gigabase couvrant l’ensemble des entreprises françaises, résultat d’un travail d’intégration et de corrélation de plus de 10 bases de données Open Data. À ce corpus de données mis à jour tous les mois, nous avons développé notre moteur de recherches interne WEBSCAN qui collecte les mots-clefs sur plusieurs millions de sites web.

Nos algorithmes enrichissent et croisent les informations avec les identifiants communs à chaque entreprise (SIREN, adresse, coordonnée GPS…) présents dans les sources de données et les sites web. Pour « passer rapidement de la donnée à l’information », nous avons organisé l’indexation des données.

Nos compétences techniques clefs sont :

  • la gestion de bases de données,
  • le web crawling et text mining sur HTML,
  • l’architecture logicielle.