Ministère de l'Enseignement Supérieur
et
Universitaire
UNIVERSITE PROTESTANTE DE LUBUMBASHI
FACULTE DES SCIENCES INFORMATIQUES

Vérité & Liberté
PROJET TUTORÉ DE FIN D'ETUDES
Sujet : CONCEPTION D'UN SYSTEME INTELLIGENT
D'ANALYSE DE CV BASE SUR LE TRAITEMENT DU LANGAGE NATUREL (NLP) POUR UNE
EVALUATION OPTIMISEE DES CANDIDATURES : APPLICATION AU DEPARTEMENT
DES RESSOURCES HUMAINES.
Effectué par NKISSA KUDOLYE JOSPIN Promotion :
BAC3
Filière : IAGE
Août 2025
Ministère de l'Enseignement Supérieur
et
Universitaire
UNIVERSITE PROTESTANTE DE LUBUMBASHI
FACULTE DES SCIENCES INFORMATIQUES

Vérité & Liberté
PROJET TUTORÉ DE FIN D'ETUDES
Sujet : CONCEPTION D'UN SYSTEME INTELLIGENT
D'ANALYSE DE CV BASE SUR LE TRAITEMENT DU LANGAGE NATUREL (NLP) POUR UNE
EVALUATION OPTIMISEE DES CANDIDATURES : APPLICATION AU DEPARTEMENT
DES RESSOURCES HUMAINES.
Promotion : BAC 3 Filière : IAGE
Dirigé par Professeur MWAMBA KASONGO Dahouda
Co-dirigé par Assistant NGOIE NKAYA Philippe
ANNEE ACADEMIQUE
2024-2025

DEDICACE
À ma famille,
Ce mémoire est le fruit de votre soutien inestimable, de
vos encouragements et de votre amour sans limites.
À mes parents, pour vos sacrifices, votre patience et
votre confiance en moi. Sans vous, rien de tout cela n'aurait été
possible.
NKISSA KUDOLYE JOSPIN

REMERCIEMENTS
Avec un coeur profondément reconnaissant et des mots
chargés d'émotion, je tiens à commencer cette page en
rendant gloire à Jéhovah Dieu, le Soutien suprême de ma
vie. À Lui seul reviennent les louanges éternelles pour le
souffle de vie, la santé préservée, la force quotidienne,
et la protection invisible mais constante dont j'ai
bénéficié tout au long de ce parcours. Sans Sa main
puissante, aucun de mes efforts n'aurait porté de fruit.
Je rends un hommage vibrant à mes chers parents,
Kuudolye Celestin et Kikaina Naomie , véritables artisans de mon avenir,
pour leur amour inconditionnel, leur soutien inlassable, et surtout pour avoir
assuré ma scolarité de façon continue, depuis mes premiers
pas à l'école maternelle jusqu'à ce jour. Vous avez
été et restez mes modèles de persévérance et
de foi. Grâce à vous, je me tiens aujourd'hui debout, fier du
chemin parcouru.
Mes pensées les plus affectueuses vont également
à l'ensemble de ma famille élargie, et tout
particulièrement à mes oncles et tantes actuellement
présents ici à Lubumbashi, pour leur soutien moral de haute
qualité, leur proximité affectueuse, et leurs paroles
réconfortantes aux moments les plus décisifs. Je n'oublierai
jamais les cadeaux précieux que vous m'avez offert avec amour et
fierté après chaque réussite. Vos gestes m'ont toujours
rappelé que je n'étais jamais seul.
Je tiens à exprimer ma gratitude la plus profonde
à mon directeur de mémoire, le Professeur MWAMBA KASONGO Dahouda,
pour ses orientations ingénieuses, sa disponibilité constante, et
sa rigueur académique qui ont largement contribué à donner
de la profondeur et de la qualité à ce travail. Son encadrement
bienveillant a été un véritable phare tout au long de
cette aventure intellectuelle.
Mes sincères remerciements vont également
à mon co-directeur, l'Assistant NGOIE NKAYA Philippe, pour ses conseils
avisés, son écoute attentive, et ses encouragements stimulants.
Son accompagnement méthodique m'a permis de progresser avec assurance et
efficacité.
Je ne saurais oublier mes connaissances, mes amis, et toutes
les personnes merveilleuses qui ont, d'une manière ou d'une autre,
laissé une empreinte positive dans cette aventure. Une mention
spéciale et honorifique à Maître ASIM, un ami exceptionnel
et une source inépuisable d'inspiration depuis l'école SHALOM
jusqu'à UPL avec la devise sanguine « rendre les parentes
fières car nous n'avons aucune seconde d'erreur la science ! la science
! »
À tous ceux et celles qui, par un geste, un mot, un
sourire ou une prière, ont contribué à cette
réussite, je vous dis un immense MERCI. Que
Jéhovah Dieu vous comble de ses bénédictions les
plus riches.

Table des matières
REMERCIEMENTS ii
LISTE DE FIGURES v
LISTE DES TABLEAU vii
INTRODUCTION 1
CHAPITRE 1 : Revue de la littérature 4
I.1 Revue des systèmes 4
CHAPITRE 2 : MÉTHODOLOGIE 11
2.1 Introduction 11
2.2 Présentation des méthodologies de
développement logiciel (SDLC) 11
2.3 Outils et technologies utilisés
15
2.4 Architecture du système 17
2.5 Méthode d'implémentation du NLP
17
2.6 Exigences fonctionnelles et non fonctionnelles
19
2.7 Limites méthodologiques 19
2.8 Conclusion 19
Chapitre 3 Conception du système 20
3.1 Introduction 20
3.2 Modélisation du processus métier
21
3.3 Identification des acteurs 22
3.4 Diagramme de contexte métier 23
3.5 Diagramme de processus métier BPMN (Business
Process Model and Notation) 24
3.6 Diagramme de cas d'utilisation métier
26
3.7 MODELE DU DOMAIN 27
3.7 Analyse du système informatique 28
3.8. Analyse des besoins de conception 32
3.9 Diagramme de séquence 37
3.12. CONCEPTION DU MODÈLE LOGIQUE DE
DONNÉES 60
3.13. DIAGRAMME DE DÉPLOIEMENT 61
Conclusion partielle 64
CHAPITRE 4 IMPLEMENTATION DE LA SOLUTION PROPOSEE
65
4.1. Introduction 65
4.1. Technologies 65
4.2 Rappels théoriques essentiels 68
4.2.1. Introduction au Machine Learning 68
1.2.2 Apprentissage supervisé 68
2.2.3 Apprentissage non supervisé 69
2.3.4 Apprentissage par renforcement 69
iv
2.3.5 Notions de Deep Learning 69
4.3 Récolte de données 74
4.4 Conception et Entraînement du Modèle de
Classification pour l'Analyse CV-Offres 75
4.5. Conclusion 80
CHAPITRE 5. RESULTATS ET EVALUATIONS 81
5.1 Résultats 81
Conclusion Générale 87
Bibliographie 88

LISTE DE FIGURES
Figure 1 Diagramme de contexte métier 24
Figure 2 Diagramme de processus métier BPMN 25
Figure 3 Diagramme de cas d'utilisation métier 26
Figure 4 Diagramme de classes système 28
Figure 5 Présentation du système 33
Figure 6 Diagramme de cas d'utilisation 35
Figure 7 Diagramme de séquence CU1 créer compte
38
Figure 8 Diagramme de séquence CU2 S'authentifier
39
Figure 9 Diagramme de séquence CU 3
Réinitialisation de mot de passe 40
Figure 10 Diagramme de séquence CU 4 Gérer
profil 41
Figure 11 Diagramme de séquence CU 5 Publier offre
42
Figure 12 Diagramme de séquence CU 6 Gérer
l'offre 43
Figure 13 Diagramme de séquence CU 7 Consulter les
offres 44
Figure 14 Diagramme de séquence CU 8
Téléverser un cv 45
Figure 15 Diagramme de séquence CU 9 supprimer ou
modifier un cv 46
Figure 16 Diagramme de séquence CU 10 Analyser un cv
47
Figure 17 Diagramme de séquence CU 12 Afficher
résultat 48
Figure 18 Diagramme de séquence CU 11 AfficherResultat
48
Figure 19 Diagramme de séquence CU 12 afficher
candidatures 49
Figure 20 Diagramme système 51
Figure 21 Diagramme de classe participante CU 2
Authentification 52
Figure 22 Diagramme de classe participante CU 2
Authentification 52
Figure 23 Diagramme de classe participante CU 3
Réinitialisation 53
Figure 24 Diagramme de classe participante CU 4 Gérer
profil 53
Figure 25 Diagramme de classe participante CU 5 publier offre
54
Figure 26 Diagramme de classe participante CU 6 Gérer
offre 55
Figure 27 Diagramme de classe participante CU 7 Consulter
l'offre 56
Figure 28 Diagramme de classe participante CU 8
Téléverser cv 56
Figure 29 Diagramme de classe participante CU 9 Supprimer
modifier cv 57
Figure 30 Diagramme de classe participante CU 10 Analyser cv
58
Figure 31 Diagramme de classe participante CU 11 Afficher
résultat 59
Figure 32 Diagramme de classe participante CU 12 Afficher
candidature 59
Figure 34 Diagramme de déploiement 63
Figure 35 Machine learning, deep learning description 70
Figure 36 Quelques Domaines du nlp 73
Figure 37 Déséquilibre initiale de classe 76
Figure 38 Equilibres de classes 77
Figure 39 Comparaison de la performance des modèles
78
Figure 40 Tableau comparatif des modèles 78
Figure 41 visualisation de la courbe de précision et
perte 79
Figure 42 Matrice de confusion du modèle validé
79
Figure 43 Matrice de confusion normalisé 79
vi
Figure 44 interface d'accueille 81
Figure 45 interface des offres 81
Figure 46 interface des offres avec option de filtre 82
Figure 47 interface de login pour s'authentifier 82
Figure 48 interface pour réinitialiser le mot de passe
83
Figure 49 interface pour la vérification de OTP envoyer
par mail 83
Figure 50 interface pour sur la vue du détaille de
l'offre 84
Figure 51Interface pour uploader le cv 84
Figure 52 Dashboard Entreprise 85
Figure 53 Dashboard chercheur d'emploie 85
Figure 54 Dashboard entreprise avant l'analyse 85
Figure 55Dashboard entreprise l'analyse encours 86
Figure 56 opération Asynchrone avec serveur celery
86
Figure 57 Résultat d'analyse 86

LISTE DES TABLEAU
Tableau 1 Outils et technologies utilisés 15
Tableau 2 Rôles des acteurs 23
Tableau 3 Identification des acteurs du système
d'Analyse de cv basé sur le NLP 33
Tableau 4 Planification des itérations 35
Tableau 5 Contenu du dataset 74
Tableau 6 Algorithmes implémentés 77

INTRODUCTION
Contexte du sujet
Le processus de recrutement constitue un pilier fondamental de
la gestion des ressources humaines, car il détermine la qualité
du capital humain au sein d'une organisation. Avec la numérisation
croissante des candidatures, les entreprises doivent aujourd'hui traiter un
volume massif de CV, ce qui rend les méthodes traditionnelles de
sélection de plus en plus inefficaces.
Cette surcharge d'informations entraîne non seulement
une perte de temps considérable, mais aussi une augmentation du risque
d'erreur humaine ou de biais dans l'évaluation des profils. Si un
recruteur passe une minute au moins pour évaluer un CV. Imaginons que
suite d'une annonce , l'entreprise reçoit 2000 CV, cela voudrait dire
que le recruteur passerait environ 33 heures pour la
sélection de ces CV, ce qui équivaut 4 jours de travail de 8
heures.
Parallèlement, les avancées dans le domaine de
l'intelligence artificielle (IA), et plus particulièrement du
traitement automatique du langage naturel (Natural Language Processing,
NLP), ont ouvert de nouvelles perspectives pour automatiser et
améliorer les processus décisionnels. Le NLP permet aux machines
de comprendre, d'analyser et de générer du langage humain, ce qui
en fait une technologie de choix pour l'analyse de documents non
structurés tels que les CV.
Dans ce contexte, plusieurs solutions intelligentes ont
été proposées dans le monde pour automatiser la
présélection des candidatures. Des systèmes basés
sur la détection de mots-clés, des moteurs de correspondance
sémantique, et plus récemment des modèles d'apprentissage
profond tels que BERT ou GPT ont été mis en oeuvre avec des
résultats encourageants.
À Lubumbashi, le recrutement pour plusieurs structures
reste encore largement manuel, malgré la disponibilité croissante
de CV numériques. Les départements des ressources humaines
manquent souvent d'outils adaptés pour automatiser ce processus, ce qui
ralentit considérablement la sélection des bons profils. Il
existe donc un besoin réel et urgent d'outils intelligents.
Ce mémoire s'inscrit dans cette dynamique. Il vise
à concevoir un système intelligent capable d'analyser
automatiquement des CV numériques rédigés en
français, à l'aide de techniques avancées de traitement du
langage naturel. Ce système pourra ainsi contribuer à rendre le
processus de présélection plus rapide, plus objectif et plus
efficace au sein des entreprises de Lubumbashi.
Objectifs de l'étude
L'objectif principal de cette étude est de
concevoir un système intelligent d'analyse de CV basé sur
le traitement du langage naturel (NLP) permettant d'automatiser
l'évaluation initiale des candidatures au sein d'un département
des ressources humaines.
Les objectifs spécifiques sont :
· D'extraire automatiquement les informations
pertinentes contenues dans les CV (diplômes, expériences,
compétences, etc.).
· De mesurer la correspondance entre les profils et les
offres d'emploi selon des critères définis.
2
· De proposer un classement des candidats en fonction de
leur adéquation avec le poste à pourvoir.
· D'adapter le système au contexte local
congolais, notamment au format des CV rédigés en
français.
Dans un environnement économique de plus en plus
compétitif, les entreprises doivent recruter rapidement les meilleurs
profils. Cependant, les départements RH sont souvent confrontés
à la difficulté de traiter manuellement un grand volume de
candidatures, Ce traitement manuel est non seulement long, mais il peut
également être subjectif et peu reproductible.
Plusieurs outils existent pour aider à cette
tâche, mais ils sont souvent conçus pour des environnements
anglophones, ne tiennent pas compte de la structure des CV francophones, et
nécessitent des ressources techniques importantes. À Lubumbashi,
les petites et moyennes entreprises disposent rarement d'outils intelligents ou
de personnel formé à ce type de technologie.
Dès lors, une question centrale se pose :
comment concevoir un système intelligent, basé sur le
NLP, capable d'analyser automatiquement des CV en français et
d'optimiser le processus de présélection des candidatures
?
Hypothèse
Nous posons l'hypothèse suivante :
L'utilisation d'un système intelligent
basé sur le traitement automatique du langage naturel permet
d'automatiser et d'accélérer le processus de
présélection des CV, tout en améliorant la pertinence des
candidats retenus pour un poste donné.
Importance ou justification de l'étude Ce
travail est justifié par plusieurs besoins :
v Sur le plan pratique, il répond
à une demande réelle d'amélioration des outils RH dans un
contexte local où les ressources sont limitées.
v Sur le plan scientifique, il s'inscrit
dans la dynamique actuelle de recherche autour du NLP appliqué à
des problématiques RH.
v Sur le plan technologique, il explore la
mise en oeuvre de modèles d'IA modernes dans un environnement
francophone et africain, souvent peu représenté dans les bases de
données utilisées pour l'apprentissage automatique.
Portée et limites
La portée de cette étude se limite aux points
suivants :
· Le système ne traitera que des CV
numériques (PDF).
· Seuls les CV rédigés en langue
française seront analysés.
3
· Le système s'arrête à la
phase de présélection : il ne réalise pas
d'évaluation comportementale ni d'entretien.
Les limites incluent :
· L'efficacité du système dépendra de
la qualité des CV (orthographe, structure,
lisibilité).
· Le manque de données locales
annotées pour l'entraînement de modèles peut
limiter la performance initiale.
Structure du travail
Ce mémoire est organisé en cinq chapitres
principaux :
v Chapitre 1 : Revue de la
littérature
Analyse des travaux existants en lien avec l'analyse automatique
de CV, le NLP appliqué aux RH, et les systèmes intelligents
d'évaluation des candidatures.
v Chapitre 2 : Méthodologie
Présentation du modèle de développement
logiciel (SDLC), des techniques NLP adoptées, et des outils mis en
oeuvre.
v Chapitre 3 : Conception du système
Analyse du système informatique (Modélisation des
exigences fonctionnelles et non fonctionnelles ...)
Conception du système informatique (description de
l'architecture, et conception UML ...)
v Chapitre 4 : Implémentation
Description technique de la réalisation du
système, des choix technologiques et des modules
implémentés.
v Chapitre 5 : Résultats et
évaluation
Présentation du système développé,
des tests effectués (fonctionnalité, performance,
utilisabilité ...) et interprétation des résultats
obtenus.
4
|