المقرر: Analyse de données séquentielles | Plateforme des ressources pédagogiques et d'enseignement à distance, Université de Biskra.

الخطوط العريضة للقسم

إختر القسم Présentation du cours

طي توسيع
Présentation du cours

طي الكل توسيع الكل
- إختر النشاط Présentation du cours
  
  Brève description
  
  Le cours vise à initier les étudiants aux concepts et questionnements propres aux données séquentielles, leur représentation et leur analyse. Les applications incluent la fouille des motifs séquentiels dans les bases de données transactionnelles, la fouille des séries temporelles et la fouille des motifs séquentiels pour les données biologiques.
- إختر النشاط Public cible
  
  Public cible
  
  Étudiants en informatique, Master 2, spécialité Système d'Information, Optimisation et Décision (SIOD).
- إختر النشاط Mode d'évaluation
  
  Evaluation, Crédits et coefficient
  
  Mode d'évaluation: 50% examen 50% contrôle TP
  
  Volume horaire: Une séance de cours (1h30) et une séance de travaux pratique (1h30)
  
  Crédit: 4
  
  Coefficient: 2
- إختر النشاط Fiche-contact
  
  Fiche-contact
  
  Enseignante: Dr. AKROUR Djouher
  
  Contact: djouher.akrour@univ-biskra.dz
  
  Heure de disponibilité: touts les Lundi, Mercredi et Jeudi à partir de 8h00 au laboratoire LESIA.
- طي توسيع
  Objectifs et prérequis du cours
  
  إختر النشاط Objectifs généraux
  
  Objectifs généraux
  
  Comprendre les concepts fondamentaux de l'analyse de données séquentielles.
  
  Maîtriser les outils et techniques pour modéliser et analyser des données séquentielles.
  
  Appliquer ces techniques à des problèmes réels dans divers domaines (finance, biologie, linguistique, etc.).
  
  Développer une pensée critique pour interpréter les résultats et choisir les méthodes appropriées.
  
  إختر النشاط Prérequis
  
  Prérequis
  
  Connaissances de base en statistiques.
  
  Familiarité avec un langage de programmation (e.g., Python).
  
  Notions de base en algorithmique et structures de données.
  
  Expérience préalable avec la fouille de données.
- طي توسيع
  Plan du cours détaillé
  
  إختر النشاط plan
  
  Chapitre 1 : Introduction
  
  1. Introduction
  2. Types de séquences
  3. Domaines d’application
  4. Visualisation de séquences
  5. Représentation de séquences
  
  Chapitre 2 : Fouille des motifs séquentiels dans les bases de données transactionnelles
  
  1. Introduction
  2. Concepts de base (Séquence, sous-séquence, support, …)
  3. Visualisation de séquences (i-plot, f-plot, d-plot)
  4. Caractéristiques des séquences (Longitudinale et transversale)
  5. Mesure de similarité entre séquences (Sac de caractère, P-spectrum, LCP, LCS)
  6. Fouille des motifs séquentiels (AprioriAll, GSP, SPADE)
  7. Motifs séquentiels avec contraintes
  8. Analyse de périodicité dans les motifs séquentiels
  
  Chapitre 3: Fouille de séries temporelles
  
  1. Définition
  2. Domaines d’applications
  3. Indices descriptifs d’une série temporelle
  4. Composants d’une série temporelle
  5. Estimation de la tendance
  6. Mesures de similarité
  7. Recherche de similarité dans une série temporelle
  8. Recherche de motifs fréquents dans une série temporelle
  9. Clustering des séries temporelles
  10. Requête par contenu des séries temporelles
  11. Classification des séries temporelles
  12. Détection d’anomalies dans les séries temporelles
  
  Chapitre 4: Fouille des motifs séquentiels pour les données biologiques
  
  1. Bioinformatiques
  2. Les séquences biologiques
  3. Évolution des séquences biologiques (Mutation et Séquences homologues)
  4. Alignement des Séquences Biologiques
  5. Méthodes d’évaluation de l’alignement
  6. Algorithme d’alignement (L'algorithme Needleman-Wunsch)
  7. Analyse des Séquences Biologiques (Chaîne de Markov et Modèle de Markov Cachées)
إختر القسم Préparation avant d'entamer le cours

طي توسيع
Préparation avant d'entamer le cours
- إختر النشاط Pré-test des prérequis
  
  Pré-test des prérequis إختبار
  
  ينبغي للطلبة
  
  التأشير بأنه منجز
  
  Ce test vise à évaluer votre niveau de connaissances dans le domaine de fouille de données et des statistiques et à identifier vos éventuelles lacunes à revoir pour pouvoir démarrer et comprendre le cours en question.
- إختر النشاط Prise en main du langage R
  
  Prise en main du langage R واجب
  
  فتحت: الأربعاء، 12 فبراير 2025، 12:00 AM
  
  تستحق: الأربعاء، 19 فبراير 2025، 12:00 AM
  
  ينبغي للطلبة
  
  التأشير بأنه منجز
  
  L'outil qui sera utilisé durant ce cours est le langage R.
  
  R est un langage de programmation interactif interprété et orienté objet contenant une très large collection de méthodes statistiques et des facilités graphiques importantes.
  
  Ce TP vous permettra de vous familiariser avec R et apprendre comment manipuler, importer et exporter en fichier CSV et représenter graphiquement les données.
- إختر النشاط Êtes-vous enthousiaste à l'idée d'apprendre ce module ?
  
  Êtes-vous enthousiaste à l'idée d'apprendre ce module ? إفادة
إختر القسم Chapitre 1 : Introduction à l'analyse de données séquentielles

طي توسيع
Chapitre 1 : Introduction à l'analyse de données séquentielles
- إختر النشاط Objectifs du chapitre:
  
  Objectifs du chapitre:
  
  Comprendre les concepts fondamentaux des données séquentielles.
  
  Identifier les types de séquences et leurs caractéristiques.
  
  Explorer les domaines d'application des données séquentielles.
  
  Apprendre à visualiser et représenter les données séquentielles pour en extraire des informations utiles.
  
  Découvrir les techniques de base pour l'analyse des séquences, comme la fouille de motifs séquentiels.
- إختر النشاط Contneu du chapitre
  
  Contneu du chapitre ملف
  
  Ce chapitre introduit les bases de l'analyse de données séquentielles, en mettant l'accent sur les concepts clés, les types de séquences, et leurs applications pratiques.
- إختر النشاط Objectifs du chapitre: (copie)
  
  Références:
  
  Vous pouvez consulter ces sources supplémentaires pour approfondir vos connaissances sur le data mining:
  
  Aggarwal, C. (2015). Data Mining The TextBook.
  
  Han, J., Kamber, M., & Pei, J. (2011). The Morgan Kaufmann series in data management systems. Data mining concepts and techniques.
- طي توسيع
  Activités d'apprentissage
  
  إختر النشاط Travail Pratique sur les statistiques descriptives
  
  Travail Pratique sur les statistiques descriptives واجب
  
  فتحت: الأربعاء، 12 فبراير 2025، 12:00 AM
  
  تستحق: الأربعاء، 19 فبراير 2025، 12:00 AM
  
  Dans ce TP, vous apprendrez à manipuler les données et réaliser des statistique descriptive avec le langage R.
  
  Vous pouvez consulter cet article pour apprendre davantage sur R:
  
  Gabadinho, A., Ritschard, G., Studer, M., & Müller, N. S. (2011). Mining sequence data in R with the TraMineR package. A User’s Guide. Department of Econometrics and Laboratory of Demography, University of Geneva.
  
  إختر النشاط Test d'acquisition
  
  Test d'acquisition إختبار
  
  Ce test évalue votre compréhension et votre acquisition des connaissances du chapitre 1.
- إختر النشاط Forum de discussion pour chapitre 1
  
  Forum de discussion pour chapitre 1 منتدى
إختر القسم Chapitre 2 : Fouille des motifs séquentiels dans les bases de données transactionnelles.

طي توسيع
Chapitre 2 : Fouille des motifs séquentiels dans les bases de données transactionnelles.
- إختر النشاط Objectifs du chapitre
  
  Objectifs du chapitre
  
  Comprendre les concepts de base des séquences, sous-séquences, et le calcul du support.
  
  Maîtriser les techniques de visualisation des séquences.
  
  Analyser les caractéristiques des séquences : longitudinales vs transversales.
  
  Apprendre à mesurer la similarité entre séquences.
  
  Découvrir les algorithmes de fouille de motifs séquentiels : AprioriAll, GSP et SPADE.
  
  Explorer les motifs séquentiels avec contraintes et l'analyse de périodicité dans les motifs séquentiels.
- إختر النشاط Contenu du chapitre
  
  Contenu du chapitre ملف
  
  Ce chapitre approfondit les concepts de l'analyse de données séquentielles en introduisant des notions avancées. Il explore les caractéristiques des séquences et les méthodes de calcul de similarité. Le chapitre présente également des algorithmes de fouille de motifs séquentiels.
- إختر النشاط Objectifs du chapitre: (copie) (copie)
  
  Références:
  
  Vous pouvez consulter ces sources supplémentaires pour approfondir vos connaissances sur l'extraction de motifs séquentiels :
  
  Zaki, M. J. (2001). SPADE: An efficient algorithm for mining frequent sequences. Machine learning, 42, 31-60.
  
  Mooney, C. H., & Roddick, J. F. (2013). Sequential pattern mining--approaches and algorithms. ACM Computing Surveys (CSUR), 45(2), 1-39.
  
  Fradkin, D., & Mörchen, F. (2015). Mining sequential patterns for classification. Knowledge and Information Systems, 45, 731-749.
  
  Aoga, J. O., Guns, T., & Schaus, P. (2017). Mining time-constrained sequential patterns with constraint programming. Constraints, 22, 548-570.
  
  Fournier-Viger, P., Lin, J. C. W., Kiran, R. U., Koh, Y. S., & Thomas, R. (2017). A survey of sequential pattern mining. Data Science and Pattern Recognition, 1(1), 54-77.
- طي توسيع
  Activités d'apprentissage
  
  إختر النشاط Travail Pratique sur l'analyse et visualisation des séquences catégorielles
  
  Travail Pratique sur l'analyse et visualisation des séquences catégorielles واجب
  
  فتحت: الخميس، 13 فبراير 2025، 12:00 AM
  
  تستحق: الخميس، 20 فبراير 2025، 12:00 AM
  
  Nous utilisons dans ce travail la library TraMineR et arulesSequences conçues pour fouiller et visualiser les séquences d’états et le jeu de données mvad vu en cours.
  
  إختر النشاط Test d'acquisition
  
  Test d'acquisition إختبار
  
  ينبغي للطلبة
  
  التأشير بأنه منجز
  
  Ce test évalue votre compréhension et votre acquisition des connaissances du chapitre 2.
- إختر النشاط Form de discussion pour chapitre 2
  
  Form de discussion pour chapitre 2 منتدى
إختر القسم Chapitre 3 : Fouille de séries temporelles

طي توسيع
Chapitre 3 : Fouille de séries temporelles
- إختر النشاط Objectifs du chapitre:
  
  Objectifs du chapitre
  
  Comprendre les séries temporelles et identifier leurs composantes et leurs indices descriptifs.
  
  Analyser les tendances.
  
  Mesurer la similarité entre les séries temporelles.
  
  Rechercher des motifs fréquent.
  
  Classifier des séries temporelles et effectuer du clustering.
- إختر النشاط Contenu du chapitre
  
  Contenu du chapitre ملف
  
  Ce chapitre explore l’analyse des séries temporelles. Il couvre les indices descriptifs, l’identification des tendances, les mesures de similarité, ainsi que les méthodes de classification, de clustering et de détection d’anomalies.
- إختر النشاط ref
  
  Références
  
  Vous pouvez consulter ces sources supplémentaires pour approfondir vos connaissances sur l'analyse des séries temporelles:
  
  Patel, P., Keogh, E., Lin, J., & Lonardi, S. (2002, December). Mining motifs in massive time series databases. In 2002 IEEE International Conference on Data Mining, 2002. Proceedings. (pp. 370-377). IEEE.
  
  Gaudin, R., & Nicoloyannis, N. (2005, January). Apprentissage non supervisé de séries temporelles à l'aide des k-means et d'une nouvelle méthode d'agrégation de séries. In EGC (pp. 201-212).
- طي توسيع
  Activités d'apprentissage
  
  إختر النشاط Travail Pratique sur l'analyse des série temporelle
  
  Travail Pratique sur l'analyse des série temporelle واجب
  
  فتحت: الجمعة، 14 فبراير 2025، 12:00 AM
  
  تستحق: الجمعة، 21 فبراير 2025، 12:00 AM
  
  ينبغي للطلبة
  
  التأشير بأنه منجز
  
  Vous apprendrez dans ce travail comment manipuler, analyser et visualiser les données de séries temporelles en R. Vous apprendrez également comment estimer les tendances et faire des prévisions.
  
  إختر النشاط Test d'acquisition
  
  Test d'acquisition إختبار
  
  ينبغي للطلبة
  
  التأشير بأنه منجز
  
  Ce test évalue votre compréhension et votre acquisition des connaissances du chapitre 3.
- إختر النشاط Forum de discussion pour chapitre 3
  
  Forum de discussion pour chapitre 3 منتدى
إختر القسم Chapitre 4 : Fouille des motifs séquentiels pour les données biologiques.

طي توسيع
Chapitre 4 : Fouille des motifs séquentiels pour les données biologiques.
- إختر النشاط Objecifs du chapitre:
  
  Objectifs du chapitre
  
  Comprendre les bases de la bio-informatique.
  
  Analyser l'évolution des séquences et identifier les séquences homologues.
  
  Réaliser et évaluer des alignements de séquences.
  
  Mettre en œuvre l’algorithme de Needleman-Wunsch.
  
  Utiliser les modèles probabilistes pour l'analyse des séquences biologiques.
- إختر النشاط Contenu du chapitre
  
  Contenu du chapitre ملف
  
  Ce chapitre traite l’analyse des séquences biologiques. Il aborde les mutations, les alignements de séquences, les matrices de substitution et les algorithmes d’alignement. Il introduit également les modèles probabilistes utilisés pour identifier des régions fonctionnelles dans les génomes.
- إختر النشاط ref
  
  Références
  
  Vous pouvez consulter ces sources supplémentaires pour approfondir vos connaissances sur l'analyse et l'alignement des séquences biologiques:
  
  Rosenberg, M. S. (Ed.). (2009). Sequence alignment: methods, models, concepts, and strategies. Univ of California Press.
  
  Pearson, W. R. (2013). An introduction to sequence similarity (“homology”) searching. Current protocols in bioinformatics, 42(1), 3-1.
- طي توسيع
  Activités d'apprentissage
  
  إختر النشاط Travail Pratique sur l'analyse des séquences biologiques
  
  Travail Pratique sur l'analyse des séquences biologiques واجب
  
  فتحت: الجمعة، 14 فبراير 2025، 12:00 AM
  
  تستحق: الجمعة، 21 فبراير 2025، 12:00 AM
  
  ينبغي للطلبة
  
  التأشير بأنه منجز
  
  Nous allons utiliser dans ce TP les libraires “Biostrings” et “DECIPHER” pour aligner les séquences biologiques et analyser les motifs séquentiels.
  
  إختر النشاط Test d'acquisition
  
  Test d'acquisition إختبار
  
  ينبغي للطلبة
  
  التأشير بأنه منجز
  
  Ce test évalue votre compréhension et votre acquisition des connaissances du chapitre 4.
- إختر النشاط Forum de discussion pour chapitre 4
  
  Forum de discussion pour chapitre 4 منتدى
إختر القسم Evaluation finale

طي توسيع
Evaluation finale
- إختر النشاط Test de sortie
  
  Test de sortie إختبار
  
  ينبغي للطلبة
  
  التأشير بأنه منجز
  
  Ce test de sortie est noté pour évaluer votre compréhension globale et valider vos acquis et vous donner une idée de votre niveau de maîtrise du sujet.
إختر القسم Participer à l'amélioratrion du cours

طي توسيع
Participer à l'amélioratrion du cours
إختر القسم Bibliographie

طي توسيع
Bibliographie
- إختر النشاط ref
  
  Livres
  
  [1] Aggarwal, C. (2015). Data Mining The TextBook.
  
  [2] Han, J., Kamber, M., & Pei, J. (2011). The Morgan Kaufmann series in data management systems. Data mining concepts and techniques.
  
  [3] Rosenberg, M. S. (Ed.). (2009). Sequence alignment: methods, models, concepts, and strategies. Univ of California Press.
  
  Articles
  
  [4] Patel, P., Keogh, E., Lin, J., & Lonardi, S. (2002, December). Mining motifs in massive time series databases. In 2002 IEEE International Conference on Data Mining, 2002. Proceedings. (pp. 370-377). IEEE.
  
  [5] Gaudin, R., & Nicoloyannis, N. (2005, January). Apprentissage non supervisé de séries temporelles à l'aide des k-means et d'une nouvelle méthode d'agrégation de séries. In EGC (pp. 201-212).
  
  [6] Gabadinho, A., Ritschard, G., Studer, M., & Müller, N. S. (2011). Mining sequence data in R with the TraMineR package. A User’s Guide. Department of Econometrics and Laboratory of Demography, University of Geneva.
  
  [7] Zaki, M. J. (2001). SPADE: An efficient algorithm for mining frequent sequences. Machine learning, 42, 31-60.
  
  [8] Mooney, C. H., & Roddick, J. F. (2013). Sequential pattern mining--approaches and algorithms. ACM Computing Surveys (CSUR), 45(2), 1-39.
  
  [9] Fradkin, D., & Mörchen, F. (2015). Mining sequential patterns for classification. Knowledge and Information Systems, 45, 731-749.
  
  [10] Aoga, J. O., Guns, T., & Schaus, P. (2017). Mining time-constrained sequential patterns with constraint programming. Constraints, 22, 548-570.
  
  [11] Fournier-Viger, P., Lin, J. C. W., Kiran, R. U., Koh, Y. S., & Thomas, R. (2017). A survey of sequential pattern mining. Data Science and Pattern Recognition, 1(1), 54-77.
  
  [12] Pearson, W. R. (2013). An introduction to sequence similarity (“homology”) searching. Current protocols in bioinformatics, 42(1), 3-1.
  
  [13] Zhao, Q., & Bhowmick, S. S. (2003). Sequential pattern mining: A survey. ITechnical Report CAIS Nayang Technological University Singapore, 1(26), 135.
  
  [14] Agrawal, R., Mehta, M., Shafer, J. C., Srikant, R., Arning, A., & Bollinger, T. (1996, August). The Quest Data Mining System. In KDD (Vol. 96, pp. 244-249)

Analyse de données séquentielles

الخطوط العريضة للقسم

Présentation du cours

Brève description

Public cible

Evaluation, Crédits et coefficient

Fiche-contact

Objectifs et prérequis du cours

Objectifs généraux

Prérequis

Plan du cours détaillé

Chapitre 1 : Introduction

Chapitre 2 : Fouille des motifs séquentiels dans les bases de données transactionnelles

Chapitre 3: Fouille de séries temporelles

Chapitre 4: Fouille des motifs séquentiels pour les données biologiques

Préparation avant d'entamer le cours

Chapitre 1 : Introduction à l'analyse de données séquentielles

Objectifs du chapitre:

Références:

Activités d'apprentissage

Chapitre 2 : Fouille des motifs séquentiels dans les bases de données transactionnelles.

Objectifs du chapitre

Références:

Activités d'apprentissage

Chapitre 3 : Fouille de séries temporelles

Objectifs du chapitre

Références

Activités d'apprentissage

Chapitre 4 : Fouille des motifs séquentiels pour les données biologiques.

Objectifs du chapitre

Références

Activités d'apprentissage

Evaluation finale

Participer à l'amélioratrion du cours

Bibliographie

Livres

Articles

معلومات

إتصل بنا