Projet de fin de session
Vous ne pouvez pas sélectionner plus de 25 sujets Les noms de sujets doivent commencer par une lettre ou un nombre, peuvent contenir des tirets ('-') et peuvent comporter jusqu'à 35 caractères.
 
 
 
 
 
 
FRANCOIS PELLETIER e507d1b5f7 Merge branch 'master' of git.francoispelletier.org:francois/nlp_a2019_tp3 il y a 5 mois
data ajout des données il y a 7 mois
slides ajout création des pdf des slides automatisée il y a 7 mois
visuels slides et visuels il y a 8 mois
.gitignore ajout des données il y a 7 mois
Makefile version finale il y a 9 mois
NLP-TP3.bib version finale il y a 9 mois
README.md ajouts description algorithmes au rapport il y a 9 mois
analyse_articles.ipynb ajout analyse articles a jour il y a 5 mois
commentaires.ipynb préparation données terminée il y a 9 mois
commentaires_reseaux_sociaux.mm ajout quelques paragraphes au rapport il y a 9 mois
parsing_functions.py commit initial il y a 9 mois
pretraitement.py préparation données terminée il y a 9 mois
rapport.md version finale il y a 9 mois
textes_articles.ipynb slides et visuels il y a 8 mois
traitement_articles.ipynb version finale il y a 9 mois
traitement_commentaires.ipynb version finale il y a 9 mois
transactions-on-speech-and-language-processing.csl ajout début du rapport il y a 9 mois
wn_pos_from_ud_pos.py ajout de plusieurs graphiques et métriques dans le rapport il y a 9 mois

README.md

Travail pratique 3

Cours: IFT-7022 Session: Automne 2019 Auteur: François Pelletier

Installation des dépendances du projet

Installer Anaconda3 depuis https://www.anaconda.com/distribution/#download-section

Installer ces paquets additionnels dans l’environnement

pip install newspaper3k
pip install emoji
pip install git+https://github.com/ClaudeCoulombe/FrenchLefffLemmatizer.git

Installations des dépendances de nltk

import nltk
nltk.download('wordnet')
nltk.download('omw')

Obtenir CoreNLP

Télécharger CoreNLP depuis

https://stanfordnlp.github.io/CoreNLP/download.html

  • Le fichier principal: stanford-corenlp-full-2018-10-05.zip
  • Les fichiers de modèles pour le français, à mettre dans le même dossier que CoreNLP: stanford-french-corenlp-2018-10-05-models.jar

Démarrer le serveur CoreNLP

Exécuter cette commande dans le répertoire de CoreNLP

java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -serverProperties StanfordCoreNLP-french.properties -preload tokenize,ssplit,pos,lemma,ner,parse,depparse -status_port 9000 -port 9000 -timeout 15000 & 

Compilation du rapport en PDF (requiert pandoc et texlive, a installer depuis les paquets de la distribution linux utilisée):

make