Big Data & Intelligence Artificielle

Systèmes de Recherche et d’Extraction d’Information (SREI)

  

Profil Intervenant(s)
100x100

Docteur en Informatique - Professeur habilité & Expert Senior
10 ans d'Experience
Spécialités
Développement Web et Mobile, Moteurs de recherche, Big Data, JAVA/JEE, IA.


100x100

Docteur en Informatique - Professeur habilité & Expert Senior
10 ans d'Experience


Spécialités

Développement Web et Mobile, Moteurs de recherche, Big Data, JAVA/JEE, IA.




      A partir du  08-02-2021 à 10:00



        5 J 

        Formation hybride Cours théorique à distance sur la plateforme youcan-academy.com, et travaux pratiques en présentiel
Inscrivez-vous à la prochaine session

Appelez vos conseillers
06 49 99 11 00
06 64 16 75 10

Objectifs de la formation

• Comprendre la différence entre les différentes familles des systèmes de recherche d’information • Comprendre le fonctionnement des moteurs de recherche • Appliquer les techniques d’indexation • Appliquer les techniques d’expansion de requête • Avoir l’habilité de créer un crawler • Comprendre ... un crawler • Comprendre la recherche sémantique et la création d’ontologie Voir Plus

Prérequis


Avoir des compétences en algorithmique et en langages web.

Introduction


• Définition d’un système de recherche d’information • Les Objectifs des systèmes de recherche d’information • Les familles des SREI

L’indexation


• Notion d’indexation • Formes d’index • Pondération des termes par TF*IDF • Elimination des stopwords • L’indexation conceptuelle • L’indexation sémantique

Les modèles de recherche d’information


• Le modèle booléen • Le modèle booléen étendu • Le modèle vectoriel • Le modèle probabiliste

L’expansion de la requête


• La méthode Relevence Feedback • La formule de Rocchio • L’injection de pertinence • La correction de requête

L’appariement Document<->Requête


• La similarité Cosin, Dice et Jaccard • L’algorithme PageRank • L’apport du Machine Learning dans les moteurs de recherche

L’évaluation des SREI


• Les critères d’évaluation • La courbe précision/rappel • La F-Mesure

Le référencement naturel


• Le référencement naturel • Les métriques de classement Google • Techniques d’optimisation on-page selon Google • Techniques d’optimisation off-page selon Google • Optimisation des sites web pour le référencement

Travaux Pratiques


• Création d’un scrapper • Création d’un crawler • Extraction et structuration des données web • Pondération et élimination des stopwords par la technique TF*IDF • Développement d’une fonction de similarité (Jaccard) • Développer une fonction d’expansion de requête (Rocchio) • Création et expl ... Voir Plus

  Elasticsearch

  BIG Data Hortonworks Architecture et intégration

© Copyright All Rights Reserved 2020 | Developed By : Team Formations++