Introduction¶
Documentation technique du projet El Géo Paso, statistiques dynamiques sur les offres d’emploi en géomatique publiées sur le forum francophone de géomatique GeoRezo.
Base de connaissances techniques sur le projet El Géo Paso. Cette base, enrichie au gré du temps disponible et de l’envie (autant dire qu’elle est incomplète), a vocation à éviter que le projet ne soit une boîte noire et à faciliter les phases de reprise du développement, celui-ci étant discontinu et irrégulier (bénévolat mon amour).
Description fonctionnelle¶
Récupération à partir de GeoRezo¶
Toutes les heures, les dernières offres publiées sont récupérées à partir du flux RSS du forum Job de GeoRezo et stockées en brut dans une table dédiée ;
Chaque nouvelle offre est analysée en s’appuyant sur le kit de traitement du langage naturel NLTK et des correspondances personnalisables en base de données via l’interface d’administration ;
Représentation des données¶
Les données sont ensuite représentées dans différents modes :
métriques globales ;
valeurs absolues du nombre d’offre par période ;
valeurs proportionnelles selon le différents critères (types de contrats…)
Description technique¶
Pour dupliquer le projet, la documentation est dans le wiki du dépôt.
Base de données¶
*Modèle généré automatiquement par Django Extensions graph-models (pydot)*
Briques logicielles¶
Le projet est développé en Python 3.5.x avec le framework Django et des extensions :
feedparser pour la consommation du flux RSS
NLTK pour l’analyse sémantique
DRF (Django REST Framework) et drf-yasg pour la mise en place de l’API REST et sa documentation automatisée
Django Extensions pour la boîte à outils de dév Django
Du côté de l’interface du site web, on retrouve les classiques :
Django Suit pour l’habillage de l’interface d’administration
Le site est servi sur le Web par gunicorn et nginx ou Apache selon les plateformes (dév ou production).