IA

Le dédoublage (dédoublonnage, déduplication ) de fichiers d'adresses et les réseaux de neurones

Les réseaux de neurones informatiques sont une partie de l'intelligence artificielle qui a beaucoup d'applications. Parmi les plus connues la lecture des codes postaux ou la reconnaissance de visages. Cette technique s'utilise quand certaines conditions sont réunies en voici deux principales :j

  • pas de règle clairement définie
  • beaucoup d'exemples

Le réseau se compare un peu à une boite noire : on met d'un côté les informations et de l'autre on obtient une décision. Dans un réseau informatique les informations sont en général présentées comme allant de gauche à droite. Chaque neurone collecte les informations venant des neurones précédents et en déduit une information à transmètre aux neurones suivants.

Chaque neurone donne plus ou moins d'importance à certaines des informations qu'il reçoit. L'apprentissage consiste à trouver les ajustements pour qu'il accorde la bonne importance à la bonne information. Pour cela, à chaque prévision faite par le réseau au moment de son apprentissage on lui présente la réponse qu'il aurait du sortir. Il analyse les écarts pour s'adapter. Cet apprentissage supervisé qui se fait simplement a pour inconvénient que l'on ne saura pas comment fait le réseau pour travailler. Par contre, une fois l'apprentissage fait, en utilisation le réseau ne fait que des opérations mathématiques ce qui permet de faire un travail à une rapidité permettant des applications en temps réel.

Un exemple concret d'utilisation des réseaux de neurones : le dédoublage de fichiers

Ce problème correspond bien à l'utilisation des réseaux de neurones : beaucoup d'exemples disponibles et des règles compliquées à modéliser.

Le sujet se situe dans le cadre des opérations de marketing direct, en particulier pour le cas étudié des campagnes téléphoniques auprès d'entreprises ou d'administrations. Le but du dédoublage est donc :

  • éviter de contacter deux fois la même personne
  • éviter de confondre un client et un prospect

Ceci permettant à l'entreprise de garder une image de sérieux auprès de ses contacts. La prospection se fait donc par téléphone à partir d'adresses achetées auprès d'un provider (fournisseur) de fichier.

Après avoir détaillé le problème du dédoublage de fichiers, vous verrez la construction de la base d'exemples. Un réseau de neurones est alors créé vous verrez les fonctions d'activation utilisées (sygmoïde) ainsi que la forme du réseau. Un classeur excel montrera les calculs des paramètres. Enfin les résultats seront détaillés avec les performances de la méthode comparées avec d'autres méthodes statistiques.

La création d'un outil de dédoublage rapide devient un processus interressant voir passionnant quand on se sert des outils de l'intelligence artificielle que sont les réseaux de neurones.

Sommaire

Le dédoublage (dédoublonnage)

INTRODUCTION
LE CADRE D’UTILISATION DES FICHIERS
LES RAISONS DU DEDOUBLAGE
LES RAISONS DE L’UTILISATION DES RESEAUX DE NEURONES
LA METHODE UTILISEE JUSQU’A PRESENT
LES LIMITES DE LA METHODE UTILISEE JUSQU’A PRESENT
LES LIMITES PRATIQUES
L’INTERET D’UNE NOUVELLE METHODE

Création de la base d'exemples

LA CREATION DE LA BASE D’EXEMPLES
LES ENTREES DU RESEAU
LE RESEAU
LE CALCUL DE NOTES
LA BASE D’APPRENTISSAGE
LES PROCEDURES DE PREPARATION
LES BASES D’APPRENTISSAGE ET DE VALIDATION

Le réseau de neurones sous excel

LA FONCTION D’ACTIVATION
LA RETROPROPAGATION
L’APPRENTISSAGE DANS EXCEL
LA PROCEDURE

Les résultats

GRAPHIQUES
CONCLUSION


Cliquez pour la suite

Contactez-moi pour tout projet, question ou commentaire.

retour IA