Accéder au contenu principal

#Article2 Présentation de l’équipe

Avant de vous présenter le projet lui-même et de vous expliquer ce qui nous a amenés à choisir le mot « geek » pour notre étude, laissez-nous vous faire une rapide présentation de l’équipe.



Aurore : (langues : français et anglais) : Je suis titulaire d’une licence en Sciences du Langage à Nanterre. En dernière année, avec le parcours Traitement Informatique de Corpus j’ai pu suivre une initiation à la linguistique informatique et la linguistique de corpus. Ayant apprécié l’expérience, j’ai décidé d’entreprendre le Master TAL. En 3ème année de licence, dans le cadre d’une enquête sociolinguistique, mes camarades et moi-même avions travaillé sur les anglicismes dans les jeux vidéos. C’est l’envie d’entreprendre un projet sur un sujet connexe qui m’a conduite à vouloir travail sur un thème proche du gaming.






Corentin : (langues : français, japonais, italien) Titulaire d’une Licence en Science du Langage à Nanterre, passionné par langues et la linguistique, et versé dans l’informatique, le Master TAL m’a semblé la route à suivre avant même d’entrer en licence. Après le projet de l’an dernier avec Aurore sur le thème des anglicismes dans le jeu vidéo dans plusieurs langues, le projet de ce semestre me semble une excellente opportunité de mettre mes capacités à contribution sur un thème qui m’est familier.









Solveig : Titulaire d’un Master de Lettres Classiques à Nanterre en 2010 et reçue à l’Agrégation de grammaire (spécialité langues anciennes) en 2011 mais n’étant intéressée ni par l’enseignement ni par la recherche, j’ai entamé ce Master dans le cadre d’un congé de formation dans l’espoir de trouver plus facilement du travail, dans un domaine qui mêle deux disciplines qui m’intéressent énormément, la linguistique et l’informatique. J’ai trois autres passions : l’opéra, le Japon et le gaming. C’est grâce à ces deux dernières que j’ai pu trouver mon équipe ! Je traiterai les données en français et en allemand.

Commentaires

Posts les plus consultés de ce blog

#Article 4 Quelques exercices : commandes Ubuntu

Exercices de la page 9 du pdf cours-unix-td Grâce à la commande mkdir, je crée trois nouveaux répertoires dans un dossier :TEST1, TEST2, TEST 3. Petite particularité du dernier répertoire: il contient un espace. Pour que le logiciel n’interprète pas mon instruction comme une demande de création d’un répertoire « TEST » et d’un répertoire « 3 », il est nécessaire de délimiter le nom du fichier par des guillemets. Avec la commande ls je peux vérifier l’action de ma commande précédente, « ls -t » affichant le contenu du répertoire courant trié par date de modification. J’entre ensuite dans le répertoire TEST1 grâce à la commande cd, puis je crée trois fichiers vides avec la commande touch. Avec une même ligne de commande je peux créer les trois fichiers en même temps. Ainsi j’écris « touch » suivi du nom du premier fichier (qui sera donc créé dans le répertoire courant TEST1), puis du nom du second fichier accompagné de son emplacement (. désigne le répertoire courant : ce second fichier ...

#Article 10 : Création du Site Web

Ce dixième et dernier article du blog aura pour objet la création de notre site web associé au projet. Nous avons choisi une mise en forme personnalisée, sur la base d'un modèle trouvé en ligne, et, ayant tous les trois quelques connaissances en HTML/CSS, nous avons ajouté et modifié nous-mêmes les pages dudit site. Il reprend certaines parties de ce blog: présentation de l'équipe, du projet. Nous y avons ajouté une section traitant des programmes utilisés tout au long de notre recherche, ainsi qu'une page dédiée aux données traitée. Par la suite, une section se consacre au script et à son écriture, une aux résultats obtenus, et enfin une à l'analyse de ces résultats. Contrairement à ce blog, le site contiendra plus de visuels et sera probablement un peu plus agréable dans sa navigation. Pour pouvoir travailler ensemble sur les fichiers, ceux-ci ont été partagés sur un drive commun. En effet, il serait autrement compliqué d'y avoir accès aisément depuis différentes...

#Article 9 : L’analyse textométrique du corpus

L’article 7 de notre blog s’intitulait « Finalisation du script ». Cependant, il restait dans notre script quelques petites erreurs que nous avons dû corriger. Tout d’abord, il nous a fallu retirer l’aspiration du dump (avec lynx) de notre fonction. En effet, c’est le fichier dump qui doit être converti en UTF-8 dans le cas où l’encodage est autre : ce fichier doit donc être créé avant conversion, et c’est seulement après que les autres opérations (comprises dans la fonction) peuvent être effectuées. De plus, nous n’avions pas précisé de fichier de sortie pour le fichier converti, le texte converti en UTF-8 apparaissait donc dans la console mais n’était enregistré nulle part, ce qui rendait toute l’opération totalement inutile. Ces petites erreurs d’inattention ayant été corrigées, il nous restait encore à créer pour chaque langue un fichier concaténant l’ensemble des dumps en les séparant par des balises (qui servira pour l’analyse avec le logiciel de textomé...