LACONDA workshops | Initiation 脿 l鈥檃nalyse de textes assist茅e par ordinateur (in French only)

Event

LACONDA workshops | Initiation 脿 l鈥檃nalyse de textes assist茅e par ordinateur (in French only)

Friday, February 4, 2022toFriday, June 3, 2022

Online

Price:

Free

Add to calendar

Le Laboratoire d鈥檃nalyse des discours et des r茅cits collectifs (LADIREC) offrira, 脿 l鈥檋iver et au printemps 2022, sept ateliers d鈥檌nitiation aux m茅thodes et outils d鈥檃nalyse de textes assist茅e par ordinateur. Ces ateliers libres sont compl茅mentaires 脿 ceux propos茅s par le Digital Scholarship Hub de la Biblioth猫que McLennan et par la Computational and Data Systems Initiative de la Facult茅 des sciences de 鲍鱼直播. D鈥檜ne part, ils sont offerts en fran莽ais; d鈥檃utre part, ils sont sp茅cifiquement orient茅s vers l鈥檃cquisition, la structuration, la manipulation, l鈥檃nnotation, l鈥檃nalyse et la visualisation des donn茅es textuelles.

Les ateliers sont d鈥檃bord destin茅s aux 茅tudiant路e路s et chercheur路se路s en lettres et sciences humaines, mais ils sont ouverts 脿 toutes et 脿 tous. Aucune formation pr茅alable n鈥檈st requise pour y participer. Il est cependant n茅cessaire de disposer d鈥檜n ordinateur personnel.

La s茅rie est organis茅e dans une logique de continuit茅; les participant路e路s peuvent toutefois s鈥檌nscrire 脿 l鈥檜n ou plusieurs des ateliers de fa莽on ind茅pendante. Ceux-ci se tiendront 脿 distance (Zoom).

听

Formulaire d鈥檌nscription

听

Programmation hiver-printemps 2022

La visualisation des donn茅es textuelles avec Shinyapps

Date听: vendredi 4 f茅vrier, 13听h 脿 15听h

Responsable听: pascal.brissette [at] mcgill.ca (Pascal Brissette) (鲍鱼直播)

Description

Comment manipuler les donn茅es sans rien conna卯tre de la programmation? C鈥檈st ce que les participant路e路s de l鈥檃telier pourront faire dans cette introduction 脿 l鈥檈xtension Shiny de R. Ils路elles pourront, 脿 travers un prototype d鈥檃pplication en d茅veloppement, interagir avec une base de donn茅es contenant plus de 30听000 notices de romans fran莽ais et qu茅b茅cois. Ils路elles pourront observer la distribution de romans sur une carte g茅ographique selon le lieu o霉 se situe l鈥檃ction, ou encore explorer, 脿 travers un diagramme de r茅seau, la force des liens entre des sujets et des types de personnages dans des sous-ensembles de documents. On regardera 茅galement ce qui se passe derri猫re l鈥檃pplication lorsqu鈥檕n interagit avec elle 脿 travers l鈥檌nterface utilisateur. Ce sera l鈥檕ccasion de jeter un coup d鈥櫯搃l 脿 la table des donn茅es dont proviennent les graphiques et tableaux, et de mieux comprendre les op茅rations et calculs qui se font sous cette interface.

听

La constitution de corpus de textes par moissonnage

Date听: vendredi 25 f茅vrier, 13听h 脿 15听h

Responsables听: julien.vallieres-gingras [at] mail.mcgill.ca (Julien Valli猫res-Gingras) et yu.c.shi [at] mail.mcgill.ca (Yu听Chen听Shi) (鲍鱼直播)

Description

Avec le d茅veloppement spectaculaire des m茅dias sociaux et la transition des m茅dias traditionnels vers des formats num茅riques, des masses de documents se sont ajout茅s 脿 ceux que les sciences humaines et sociales peuvent traditionnellement utiliser pour mieux comprendre les soci茅t茅s. Mais comment extraire ces textes num茅riques et les verser dans des structures de donn茅es que l鈥檕rdinateur pourra traiter? C鈥檈st ce que les participant路e路s apprendront dans cet atelier. Ils路elles pourront se familiariser avec une proc茅dure permettant de constituer rapidement un corpus de textes num茅riques, sans recourir 脿 des m茅thodes fastidieuses comme la transcription ou encore la . Plus pr茅cis茅ment, on verra comment produire, 脿 l鈥檃ide de logiciels gratuits ou t茅l茅chargeables pour fin d鈥櫭﹙aluation, une s茅rie de requ锚tes permettant d鈥檈xtraire des contenus textuels du site d鈥檜n grand m茅dia qu茅b茅cois, et d鈥檕rganiser ces contenus et leurs m茅tadonn茅es.

听

La pr茅paration de corpus de textes pour l鈥檃nalyse

Date听: vendredi 11 mars, 13听h 脿 15听h

Responsables听: julien.vallieres-gingras [at] mail.mcgill.ca (Julien Valli猫res-Gingras) et yu.c.shi [at] mail.mcgill.ca (Yu听Chen听Shi) (鲍鱼直播)

Description

Les textes qu鈥檕n peut extraire de sites Web ou provenant de bases de donn茅es ont g茅n茅ralement besoin d鈥櫭猼re nettoy茅s avant d鈥櫭猼re utilis茅s dans le cadre d鈥檃nalyses assist茅es par ordinateur. Quels sont les probl猫mes les plus fr茅quents que pr茅sentent ces donn茅es, et quels sont les moyens de les r茅soudre? Ces deux questions serviront de fil conducteur 脿 cet atelier qui offrira une introduction pratique 脿 , un logiciel libre sp茅cialis茅 dans la manipulation de donn茅es sous forme de tables. On y apprendra 脿 extraire d鈥檜n lot de fichiers au format PDF les textes qu鈥檌l contient, 脿 les r茅unir en une m锚me table, 脿 structurer la table ainsi obtenue, puis 脿 nettoyer et 脿 uniformiser les valeurs de ses cellules.

听

L鈥檃nalyse de donn茅es textuelles avec R (d茅butant 鈥� 1)

Date听: vendredi 25 mars, 13听h 脿 15听h

Responsable听: pascal.brissette [at] mcgill.ca (Pascal Brissette) (鲍鱼直播)

Description

R est un langage de programmation n茅 dans les ann茅es 1990 脿 l鈥橴niversit茅 d鈥橝uckland (N-Z) et largement utilis茅 en science des donn茅es depuis le d茅but des ann茅es 2000. C鈥檈st 茅galement un logiciel ouvert qui b茅n茅ficie d鈥檜n environnement de d茅veloppement gratuit, accessible et attrayant听: . Dans cet atelier, on explorera les avantages et les inconv茅nients de travailler en langage R sous l鈥檃ngle de l鈥檃nalyse des donn茅es textuelles. On verra quelles formes le texte doit prendre pour pouvoir 锚tre manipul茅脿 l鈥檃ide du langage R et quelles transformations il peut devoir subir. Les participant路e路s apprendront 脿 importer un jeu de donn茅es textuelles, 脿 l鈥檈xaminer 脿 l鈥檃ide de certaines fonctions et 脿 ex茅cuter quelques t芒ches simples comme le calcul de la fr茅quence lexicale.

听

L鈥檃nalyse de donn茅es textuelles avec R (d茅butant 鈥� 2)

Date听: vendredi 1^er avril, 13听h 脿 15听h

Responsable听: pascal.brissette [at] mcgill.ca (Pascal Brissette) (鲍鱼直播)

Description

Cet atelier initiera les participant路e路s 脿 la manipulation des donn茅es textuelles avec R. On verra la mani猫re de filtrer les donn茅es, d鈥檈xtraire des cha卯nes de caract猫res et de les assembler pour en cr茅er de nouvelles. Pour ce faire, on se servira aussi bien des fonctions de base de R que des fonctions plus performantes offertes par les extensions et . On apprendra 脿 forger des expressions r茅guli猫res simples et 脿 les mettre 脿 profit dans la manipulation des donn茅es. Les textes utilis茅s au cours de l鈥檃telier proviendront du . On apprendra 脿 importer les textes de ce riche d茅p么t de livres 茅lectroniques en libre acc猫s 脿 l鈥檃ide de l鈥檈xtension .

听

L鈥檃nalyse de contenu assist茅e sur NVivo

Date听: vendredi 22 avril, 13听h 脿 15听h

Responsable听: doyon.elisabeth [at] courrier.uqam.ca (Elisabeth Doyon) (UQAM)

Description

Les donn茅es textuelles sont r茅put茅es difficiles 脿 traiter par les algorithmes. Aussi, les chercheur路se路s ont d茅velopp茅 au fil des d茅cennies des techniques d鈥檃nnotation qui permettent d鈥檈nrichir les contenus textuels par l鈥檃jout d鈥櫭﹖iquettes et de cat茅gories. Ce travail peut 锚tre fait 脿 la main, mais il peut 茅galement tirer profit de puissants logiciels qui aident l鈥檃nnotation et l鈥檃nalyse des r茅sultats. L鈥檃telier sera consacr茅脿 l鈥檜n des logiciels les plus utilis茅s dans les laboratoires d鈥檃nalyse qualitative听: . NVivo donne acc猫s 脿 une interface d鈥檌ndexation, d鈥檃nnotation et de navigation des donn茅es textuelles structur茅es et ne demande pas de connaissances en programmation. Son usage facilite le travail de l鈥檃nalyste sans remplacer ses choix et raisonnements. On pr茅sentera des exemples concrets d鈥檃nalyses de textes dans NVivo et proposera un exercice de groupe sur un corpus commun. Celui-ci visera听: 1) l鈥櫭﹍aboration d鈥檜ne grille d鈥檃nalyse en groupe; 2) l鈥檕p茅rationnalisation de cette grille par codage dans NVivo; 3) l鈥櫭﹍aboration de strat茅gies d鈥檈xploration des donn茅es selon les codes et les cas. Ce sera l鈥檕ccasion de traduire les int茅r锚ts des participant路e路s pour le contenu d鈥檜n corpus en strat茅gies d鈥檈xploration des donn茅es, et de passer d鈥檜ne question de recherche 脿 l鈥檕p茅rationnalisation d鈥檜ne cha卯ne de traitement.

Formation pr茅alable recommand茅e, mais non obligatoire听: (en anglais seulement)

听

La g茅olocalisation des donn茅es avec R

Date听: vendredi 3 juin, 13听h 脿 15听h

Responsables听: lisa.teichmann [at] mail.mcgill.ca (Lisa Teichmann) et pascal.brissette [at] mcgill.ca (Pascal听Brissette) (鲍鱼直播)

Description

La g茅olocalisation est un utile moyen de pr茅senter des donn茅es et de les explorer en faisant appara卯tre une dimension qui 茅chappe souvent 脿 leur examen sous la forme de tables ou de graphiques 脿 barres, soit leur distribution dans l鈥檈space g茅ographique. Ce passage de la table simple 脿 la carte n鈥檈st pas toujours facile, cependant. Cet atelier partira d鈥檜n cas particulier, la repr茅sentation spatiale de crimes sur le territoire montr茅alais. On verra comment importer un jeu de donn茅es depuis le site de , puis on utilisera les extensions et pour projeter ces donn茅es sur une carte de la Ville de Montr茅al.

脌 propos du LADIREC

Le LADIREC est un laboratoire de recherche de la Facult茅 des arts de l鈥橴niversit茅鲍鱼直播. Il constitue l鈥檜n des trois modules du P么le d鈥檃nalyse de donn茅es sociales pilot茅 par le et financ茅 par . Consultez notre page Web pour en savoir plus.