Projet de fin de session
Nevar pievienot vairāk kā 25 tēmas Tēmai ir jāsākas ar burtu vai ciparu, tā var saturēt domu zīmes ('-') un var būt līdz 35 simboliem gara.
 
 
 
 
 
 
FRANCOIS PELLETIER e507d1b5f7 Merge branch 'master' of git.francoispelletier.org:francois/nlp_a2019_tp3 pirms 5 mēnešiem
data ajout des données pirms 7 mēnešiem
slides ajout création des pdf des slides automatisée pirms 7 mēnešiem
visuels slides et visuels pirms 8 mēnešiem
.gitignore ajout des données pirms 7 mēnešiem
Makefile version finale pirms 9 mēnešiem
NLP-TP3.bib version finale pirms 9 mēnešiem
README.md ajouts description algorithmes au rapport pirms 9 mēnešiem
analyse_articles.ipynb ajout analyse articles a jour pirms 5 mēnešiem
commentaires.ipynb préparation données terminée pirms 9 mēnešiem
commentaires_reseaux_sociaux.mm ajout quelques paragraphes au rapport pirms 9 mēnešiem
parsing_functions.py commit initial pirms 9 mēnešiem
pretraitement.py préparation données terminée pirms 9 mēnešiem
rapport.md version finale pirms 9 mēnešiem
textes_articles.ipynb slides et visuels pirms 8 mēnešiem
traitement_articles.ipynb version finale pirms 9 mēnešiem
traitement_commentaires.ipynb version finale pirms 9 mēnešiem
transactions-on-speech-and-language-processing.csl ajout début du rapport pirms 9 mēnešiem
wn_pos_from_ud_pos.py ajout de plusieurs graphiques et métriques dans le rapport pirms 9 mēnešiem

README.md

Travail pratique 3

Cours: IFT-7022 Session: Automne 2019 Auteur: François Pelletier

Installation des dépendances du projet

Installer Anaconda3 depuis https://www.anaconda.com/distribution/#download-section

Installer ces paquets additionnels dans l’environnement

pip install newspaper3k
pip install emoji
pip install git+https://github.com/ClaudeCoulombe/FrenchLefffLemmatizer.git

Installations des dépendances de nltk

import nltk
nltk.download('wordnet')
nltk.download('omw')

Obtenir CoreNLP

Télécharger CoreNLP depuis

https://stanfordnlp.github.io/CoreNLP/download.html

  • Le fichier principal: stanford-corenlp-full-2018-10-05.zip
  • Les fichiers de modèles pour le français, à mettre dans le même dossier que CoreNLP: stanford-french-corenlp-2018-10-05-models.jar

Démarrer le serveur CoreNLP

Exécuter cette commande dans le répertoire de CoreNLP

java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -serverProperties StanfordCoreNLP-french.properties -preload tokenize,ssplit,pos,lemma,ner,parse,depparse -status_port 9000 -port 9000 -timeout 15000 & 

Compilation du rapport en PDF (requiert pandoc et texlive, a installer depuis les paquets de la distribution linux utilisée):

make