±«ÓăÖ±˛Ą

Event

LACONDA workshops | Initiation à l’analyse de textes assistée par ordinateur (in French only)

Friday, February 4, 2022toFriday, June 3, 2022
Online
Price: 
Free

Le Laboratoire d’analyse des discours et des rĂ©cits collectifs (LADIREC) offrira, Ă  l’hiver et au printemps 2022, sept ateliers d’initiation aux mĂ©thodes et outils d’analyse de textes assistĂ©e par ordinateur. Ces ateliers libres sont complĂ©mentaires Ă  ceux proposĂ©s par le Digital Scholarship Hub de la Bibliothèque McLennan et par la Computational and Data Systems Initiative de la FacultĂ© des sciences de ±«ÓăÖ±˛Ą. D’une part, ils sont offerts en français; d’autre part, ils sont spĂ©cifiquement orientĂ©s vers l’acquisition, la structuration, la manipulation, l’annotation, l’analyse et la visualisation des donnĂ©es textuelles.

Les ateliers sont d’abord destinés aux étudiant·e·s et chercheur·se·s en lettres et sciences humaines, mais ils sont ouverts à toutes et à tous. Aucune formation préalable n’est requise pour y participer. Il est cependant nécessaire de disposer d’un ordinateur personnel.

La série est organisée dans une logique de continuité; les participant·e·s peuvent toutefois s’inscrire à l’un ou plusieurs des ateliers de façon indépendante. Ceux-ci se tiendront à distance (Zoom).

Ěý

Ěý


Programmation hiver-printemps 2022

La visualisation des données textuelles avec Shinyapps

DateĚý: vendredi 4 fĂ©vrier, 13Ěýh Ă  15Ěýh

ResponsableĚý: pascal.brissette [at] mcgill.ca (Pascal Brissette) (±«ÓăÖ±˛Ą)

Description

Comment manipuler les donnĂ©es sans rien connaĂ®tre de la programmation? C’est ce que les participant·e·s de l’atelier pourront faire dans cette introduction Ă  l’extension Shiny de R. Ils·elles pourront, Ă  travers un prototype d’application en dĂ©veloppement, interagir avec une base de donnĂ©es contenant plus de 30Ěý000 notices de romans français et quĂ©bĂ©cois. Ils·elles pourront observer la distribution de romans sur une carte gĂ©ographique selon le lieu oĂą se situe l’action, ou encore explorer, Ă  travers un diagramme de rĂ©seau, la force des liens entre des sujets et des types de personnages dans des sous-ensembles de documents. On regardera Ă©galement ce qui se passe derrière l’application lorsqu’on interagit avec elle Ă  travers l’interface utilisateur. Ce sera l’occasion de jeter un coup d’œil Ă  la table des donnĂ©es dont proviennent les graphiques et tableaux, et de mieux comprendre les opĂ©rations et calculs qui se font sous cette interface.

Ěý

La constitution de corpus de textes par moissonnage

DateĚý: vendredi 25 fĂ©vrier, 13Ěýh Ă  15Ěýh

ResponsablesĚý: julien.vallieres-gingras [at] mail.mcgill.ca (Julien Vallières-Gingras) et yu.c.shi [at] mail.mcgill.ca (YuĚýChenĚýShi) (±«ÓăÖ±˛Ą)

Description

Avec le développement spectaculaire des médias sociaux et la transition des médias traditionnels vers des formats numériques, des masses de documents se sont ajoutés à ceux que les sciences humaines et sociales peuvent traditionnellement utiliser pour mieux comprendre les sociétés. Mais comment extraire ces textes numériques et les verser dans des structures de données que l’ordinateur pourra traiter? C’est ce que les participant·e·s apprendront dans cet atelier. Ils·elles pourront se familiariser avec une procédure permettant de constituer rapidement un corpus de textes numériques, sans recourir à des méthodes fastidieuses comme la transcription ou encore la . Plus précisément, on verra comment produire, à l’aide de logiciels gratuits ou téléchargeables pour fin d’évaluation, une série de requêtes permettant d’extraire des contenus textuels du site d’un grand média québécois, et d’organiser ces contenus et leurs métadonnées.

Ěý

La préparation de corpus de textes pour l’analyse

DateĚý: vendredi 11 mars, 13Ěýh Ă  15Ěýh

ResponsablesĚý: julien.vallieres-gingras [at] mail.mcgill.ca (Julien Vallières-Gingras) et yu.c.shi [at] mail.mcgill.ca (YuĚýChenĚýShi) (±«ÓăÖ±˛Ą)

Description

Les textes qu’on peut extraire de sites Web ou provenant de bases de données ont généralement besoin d’être nettoyés avant d’être utilisés dans le cadre d’analyses assistées par ordinateur. Quels sont les problèmes les plus fréquents que présentent ces données, et quels sont les moyens de les résoudre? Ces deux questions serviront de fil conducteur à cet atelier qui offrira une introduction pratique à , un logiciel libre spécialisé dans la manipulation de données sous forme de tables. On y apprendra à extraire d’un lot de fichiers au format PDF les textes qu’il contient, à les réunir en une même table, à structurer la table ainsi obtenue, puis à nettoyer et à uniformiser les valeurs de ses cellules.

Ěý

L’analyse de données textuelles avec R (débutant – 1)

DateĚý: vendredi 25 mars, 13Ěýh Ă  15Ěýh

ResponsableĚý: pascal.brissette [at] mcgill.ca (Pascal Brissette) (±«ÓăÖ±˛Ą)

Description

R est un langage de programmation nĂ© dans les annĂ©es 1990 Ă  l’UniversitĂ© d’Auckland (N-Z) et largement utilisĂ© en science des donnĂ©es depuis le dĂ©but des annĂ©es 2000. C’est Ă©galement un logiciel ouvert qui bĂ©nĂ©ficie d’un environnement de dĂ©veloppement gratuit, accessible et attrayantĚý: . Dans cet atelier, on explorera les avantages et les inconvĂ©nients de travailler en langage R sous l’angle de l’analyse des donnĂ©es textuelles. On verra quelles formes le texte doit prendre pour pouvoir ĂŞtre manipulĂ© Ă  l’aide du langage R et quelles transformations il peut devoir subir. Les participant·e·s apprendront Ă  importer un jeu de donnĂ©es textuelles, Ă  l’examiner Ă  l’aide de certaines fonctions et Ă  exĂ©cuter quelques tâches simples comme le calcul de la frĂ©quence lexicale.

Ěý

L’analyse de données textuelles avec R (débutant – 2)

DateĚý: vendredi 1er avril, 13Ěýh Ă  15Ěýh

ResponsableĚý: pascal.brissette [at] mcgill.ca (Pascal Brissette) (±«ÓăÖ±˛Ą)

Description

Cet atelier initiera les participant·e·s à la manipulation des données textuelles avec R. On verra la manière de filtrer les données, d’extraire des chaînes de caractères et de les assembler pour en créer de nouvelles. Pour ce faire, on se servira aussi bien des fonctions de base de R que des fonctions plus performantes offertes par les extensions et . On apprendra à forger des expressions régulières simples et à les mettre à profit dans la manipulation des données. Les textes utilisés au cours de l’atelier proviendront du . On apprendra à importer les textes de ce riche dépôt de livres électroniques en libre accès à l’aide de l’extension .

Ěý

L’analyse de contenu assistée sur NVivo

DateĚý: vendredi 22 avril, 13Ěýh Ă  15Ěýh

ResponsableĚý: doyon.elisabeth [at] courrier.uqam.ca (Elisabeth Doyon) (UQAM)

Description

Les donnĂ©es textuelles sont rĂ©putĂ©es difficiles Ă  traiter par les algorithmes. Aussi, les chercheur·se·s ont dĂ©veloppĂ© au fil des dĂ©cennies des techniques d’annotation qui permettent d’enrichir les contenus textuels par l’ajout d’étiquettes et de catĂ©gories. Ce travail peut ĂŞtre fait Ă  la main, mais il peut Ă©galement tirer profit de puissants logiciels qui aident l’annotation et l’analyse des rĂ©sultats. L’atelier sera consacrĂ© Ă  l’un des logiciels les plus utilisĂ©s dans les laboratoires d’analyse qualitativeĚý: . NVivo donne accès Ă  une interface d’indexation, d’annotation et de navigation des donnĂ©es textuelles structurĂ©es et ne demande pas de connaissances en programmation. Son usage facilite le travail de l’analyste sans remplacer ses choix et raisonnements. On prĂ©sentera des exemples concrets d’analyses de textes dans NVivo et proposera un exercice de groupe sur un corpus commun. Celui-ci viseraĚý: 1) l’élaboration d’une grille d’analyse en groupe; 2) l’opĂ©rationnalisation de cette grille par codage dans NVivo; 3) l’élaboration de stratĂ©gies d’exploration des donnĂ©es selon les codes et les cas. Ce sera l’occasion de traduire les intĂ©rĂŞts des participant·e·s pour le contenu d’un corpus en stratĂ©gies d’exploration des donnĂ©es, et de passer d’une question de recherche Ă  l’opĂ©rationnalisation d’une chaĂ®ne de traitement.

Formation prĂ©alable recommandĂ©e, mais non obligatoireĚý: (en anglais seulement)

Ěý

La géolocalisation des données avec R

DateĚý: vendredi 3 juin, 13Ěýh Ă  15Ěýh

ResponsablesĚý: lisa.teichmann [at] mail.mcgill.ca (Lisa Teichmann) et pascal.brissette [at] mcgill.ca (PascalĚýBrissette) (±«ÓăÖ±˛Ą)

Description

La géolocalisation est un utile moyen de présenter des données et de les explorer en faisant apparaître une dimension qui échappe souvent à leur examen sous la forme de tables ou de graphiques à barres, soit leur distribution dans l’espace géographique. Ce passage de la table simple à la carte n’est pas toujours facile, cependant. Cet atelier partira d’un cas particulier, la représentation spatiale de crimes sur le territoire montréalais. On verra comment importer un jeu de données depuis le site de , puis on utilisera les extensions et pour projeter ces données sur une carte de la Ville de Montréal.


Ă€ propos du LADIREC

Le LADIREC est un laboratoire de recherche de la FacultĂ© des arts de l’UniversitĂ© ±«ÓăÖ±˛Ą. Il constitue l’un des trois modules du PĂ´le d’analyse de donnĂ©es sociales pilotĂ© par le et financĂ© par . Consultez notre page Web pour en savoir plus.

Back to top