Nouvelles
- 2021-05-10 les sujets pour le partiel en temps libre sont disponibles, vos réponses sont à envoyer au format PDF à loic.grobol@gmail.com au plus tard le lundi 2021-05-17 à 19h.
- 2021-04-27 les projets sont à rendre le 13 mai au plus tard, pensez bien à relire les consignes.
- 2021-03-18 les consignes pour les projets 2021 sont disponibles
- Sauf problème, les prochains cours seront intégralement sur le serveur Discord du master pluriTAL. Si vous ne pouvez pas à accéder, écrivez-moi à loic.grobol@gmail.com
- Premier cours le 2021-01-28 de 13h à 15h sur http://meet.google.com/tbb-hecp-jce
Infos pratiques
- Où serveur Discord du master PluriTAL
- Quand Le jeudi de 13h00 à 15h00 (voir aussi le calendrier de Paris 3 pour les dates)
- Contact Loïc Grobol loic.grobol@gmail.com
Documents et outils
Séances
2021-01-28 — Introduction et notion de tâche
- Slides (jusqu’à la slide 26)
- Correspondance poly: jusqu’à la page 12, à lire pour la prochaine fois
2021-02-04 — Apprentisage, évaluation et RI
2021-02-11 — Classification, Étiquetage et EI
2021-02-18 — Combinaisons de tâches et représentations des données
2021-03-04 Cours reporté
2021-03-11 — Sacs de mots, fréquences et TF⋅IDF
- Slides 5
- Correspondance poly : jusqu’à la page 46, à lire pour la prochaine fois
2021-03-18 — Représentations vectorielles, distances et similarités
- Slides 6
- Correspondance poly : jusqu’à la page 46, à lire pour la prochaine fois
- Pour la prochaine fois également : chaque groupe m’envoie un mail avec les membres du groupe et une proposition de sujets. Si vous n’avez pas de groupe ou pas de sujet, écrivez moi quand même qu’on essaie de vous aider !
2021-03-25 — Bases de la classification
- Slides 7
- Exemples de données
- Script de vectorisation
- Correspondance poly : jusqu’à la page 76, à lire pour la prochaine fois (le chapitre Recherche d’Information n’est pas au programme de ce semestre)
2021-04-01 — k-plus proches voisins et arbres de décision
- Slides 7
- Slides 8
- Exemples de données
- Correspondance poly : jusqu’à la page 85, à lire pour la prochaine fois
2021-04-08 — Naïve Bayes
2021-04-15 — Utiliser scikit-learn
2021-04-29 — SVM, modèles d’étiquetage
Twittographie
Non-exhaustive
- @bastings_nlp
- @BayesForDays
- @kirbyconrod
- @Seb_Ruder
- @harmaru
- @honnibal
- @emilymbender
- @vnfrombucharest
Licences
Copyright © 2021 Loïc Grobol <loic.grobol@gmail.com>
Sauf indication contraire, les fichiers présents dans ce dépôt sont distribués selon les termes de la licence Creative Commons Attribution 4.0 International. Voir le README pour plus de détails.
Un résumé simplifié de cette licence est disponible à https://creativecommons.org/licenses/by/4.0/.
Le texte intégral de cette licence est disponible à https://creativecommons.org/licenses/by/4.0/legalcode