Accéder au contenu principal

#Article 3 Présentation du projet


Le sujet de notre projet est le résultat d’un débat qu’il nous semble intéressant de relater ici. Lorsque nous avons constitué notre équipe, ayant tous les trois un intérêt commun pour le gaming - les jeux vidéos -, nous avions convenu que notre projet porterait sur ce thème. Le mot « gaming » en lui-même ne nous semblant pas présenter d’intérêt linguistique particulier - en dehors de l’emprunt linguistique qu’il représente -, il nous restait donc encore à préciser le sujet. Deux idées ont alors émergé.


D’un côté, nous nous sommes intéressés à l’e-sport, une discipline en plein essor depuis la fin des années 1980 dont le statut est discuté (est-ce un sport ? Peut-on véritablement en faire son métier ?) et dont la popularité et l’image peuvent différer significativement d’un pays à l’autre.


D’un autre côté, nous avons pensé à étudier les différents mots servant à désigner les personnes en lien, de près ou de loin, avec le monde des « gamers ». Les mots « geek », « nerd », « otaku », « no-life », pour ne citer que les plus usuels, présentent l’intérêt d’être employés et compris de manières assez diverses selon les personnes, et les frontières entre ces différents mots semblent, dans l’usage, assez floues. Partant de ce constat (basé sur une expérience personnelle et donc sans valeur scientifique), il paraissait intéressant de vérifier, corpus à l’appui, si cette imprécision sémantique était avérée et si elle se retrouvait dans toutes les langues. C’est cette idée qui l’a emporté sur l’e-sport.
Quels sont les liens et recouvrements entre ces différents termes, selon les langues?

Cependant, étudier l’ensemble de ces termes nous a semblé un travail assez fastidieux et nous n’étions pas certains de pouvoir le réaliser dans le temps imparti et dans les nombreuses langues que nous avions choisies. Nous avons donc décidé de réduire notre champ de recherche au seul mot « geek ». En effet, le mot « geek » est le terme le plus employé en français et aussi le plus polyvalent, dans le sens où il a tendance à englober tous les autres mots susmentionnés. Il semble donc inévitable que nous rencontrions ces autres mots lors de notre recherche et que nous soyons amenés à les définir également, pour les distinguer ou les rapprocher du mot « geek ». Par exemple, en français, les « gamers » et « otaku » sont souvent également qualifiés de « geeks ». Quant au mot « nerd », nous pensons qu’il est beaucoup plus utilisé que « geek » en anglais, dans un sens équivalent. Il est donc plus que probable que, pour définir le mot geek dans toutes les langues, nous devions de toute façon aborder tous ces mots. Mais nous ne le ferons que dans la mesure où ils nous permettent de préciser la valeur sémantique du mot « geek ».



Une question encore non élucidée est celle du genre des textes que nous allons sélectionner. Souhaitons-nous étudier le concept de « geek » tel que vu par les geeks eux-mêmes ou bien plutôt par les « non-initiés » ? Devons-nous sélectionner des articles de blogs de gamers et autres « geeks » et assimilés, ou plutôt des articles de presse généraliste ? Nous souhaiterions pouvoir comparer les deux et donc varier nos sources. Peut-être ce projet est-il cependant un peu trop ambitieux et devrons-nous réduire notre champ de recherche. L’avenir nous le dira !

Commentaires

Posts les plus consultés de ce blog

#Article 10 : Création du Site Web

Ce dixième et dernier article du blog aura pour objet la création de notre site web associé au projet. Nous avons choisi une mise en forme personnalisée, sur la base d'un modèle trouvé en ligne, et, ayant tous les trois quelques connaissances en HTML/CSS, nous avons ajouté et modifié nous-mêmes les pages dudit site. Il reprend certaines parties de ce blog: présentation de l'équipe, du projet. Nous y avons ajouté une section traitant des programmes utilisés tout au long de notre recherche, ainsi qu'une page dédiée aux données traitée. Par la suite, une section se consacre au script et à son écriture, une aux résultats obtenus, et enfin une à l'analyse de ces résultats. Contrairement à ce blog, le site contiendra plus de visuels et sera probablement un peu plus agréable dans sa navigation. Pour pouvoir travailler ensemble sur les fichiers, ceux-ci ont été partagés sur un drive commun. En effet, il serait autrement compliqué d'y avoir accès aisément depuis différentes

#Article2 Présentation de l’équipe

Avant de vous présenter le projet lui-même et de vous expliquer ce qui nous a amenés à choisir le mot « geek » pour notre étude, laissez-nous vous faire une rapide présentation de l’équipe. Aurore : (langues : français et anglais) : Je suis titulaire d’une licence en Sciences du Langage à Nanterre. En dernière année, avec le parcours Traitement Informatique de Corpus j’ai pu suivre une initiation à la linguistique informatique et la linguistique de corpus. Ayant apprécié l’expérience, j’ai décidé d’entreprendre le Master TAL. En 3ème année de licence, dans le cadre d’une enquête sociolinguistique, mes camarades et moi-même avions travaillé sur les anglicismes dans les jeux vidéos. C’est l’envie d’entreprendre un projet sur un sujet connexe qui m’a conduite à vouloir travail sur un thème proche du gaming. Corentin : (langues : français, japonais, italien) Titulaire d’une Licence en Science du Langage à Nanterre, passionné par langues et la linguistique, et versé dans l’informatique,

#Article 7 : Finalisation du script

Lors de notre dernier billet, nous avons cherché une manière d’obtenir les encodages de toutes les pages et de convertir en UTF-8 celles qui ne l’étaient pas déjà. Nous avons vu en cours une manière plus simple et efficace que celle que nous avions trouvée : egrep -io "charset=\"?[^\",]+\"?" ./PAGES-ASPIREES/$numerotableau-$compteur.html | cut -f2 -d"=" | tr -d '("|\\|>)' | sed "s/'//g" | tr '[a-z]' '[A-Z]' L’expression régulière charset=\"?[^\",]+\"? permet de trouver l’encodage, puis nous nous débarrassons de « charset= » grâce au cut -f2 -d"=" , ainsi que des éventuels guillemets (simples et doubles) encadrant l’encodage et autre signes (barres obliques et balises) avec tr -d '("|\\|>)' | sed "s/'//g" | , et enfin nous passons le résultat en majuscules avec tr '[a-z]' '[A-Z]' .   Nous   avons ajouté à cette commande les inst