rapidwords.net

Planification d'un Atelier Collecte Rapide de Mots

Le modèle Collecte Rapide de Motsco est facile à suivre, mais le travail nécessaire pour le mettre en place et pour tenir un atelier qui produira plus de 10 000 mots est important. Le but de la SIL est de vous aider dans vos efforts, en s'assurant que les données lexicales que vous produisez soient disponibles gratuitement sous la licence libre Creative Commons Attribution-ShareAlike. Pour faire simple, cela signifie que les gens sont libres de copier, distribuer et diffuser les données pour un usage non commercial, et qu'ils sont libres de les adapter ou de les modifier lorsque c'est nécessaire.

Animer un atelier de collecte de mots peut coûter cher. Tandis que la motivation et l'effort doivent venir de l'intérieur de la communauté linguistique, les participants peuvent éprouver des difficultés à décrocher de leur nécessité à satisfaire à leurs besoins économiques pendant deux semaines ou plus dans le but de faire avancer l'atelier. De plus, les participants doivent être nourris, et parfois doivent être logés. La SIL International n'a pas de fonds propres pour subvenir à ces besoins, mais notre but est de mettre votre projet en lien avec une agence de fonds qui s'intéresse au développement linguistique. En remplissant un formulaire de demande de fonds, vous pouvez estimer le coût de la tenue d'un atelier CRM, et nous pouvons essayer de mettre votre projet en relation avec un donateur ainsi qu'avec un conseiller qui vous aideront à le mettre en œuvre.

Prérequis

Pour savoir si votre groupe linguistique est éligible pour cet atelier, vous devez analyser la situation linguistique. Il est important que les facteurs suivants soient présents afin de poursuivre :

1. Une communauté linguistique motivée

Il est important que la communauté linguistique soit intéressée à préserver et à promouvoir sa langue. Collecte Rapide de Mots ne peut pas être utilisé en recours de dernière minute pour préserver une langue moribonde, s'il n'existe pas suffisamment d'intérêt à la préserver. Plus la communauté est motivée, plus les résultats seront bons.

2. Une orthographe fonctionnelle

Si la langue n'a encore jamais été écrite, il n'y a aucun moyen pour vous de faire progresser celle-ci en essayant d'en deviner tous les sons et toutes les lettres. On ne dit pas que l'orthographe doive être approuvée et publiée. Elle peut-être provisoire, ou suffisamment similaire à une autre langue dont l'écriture est relativement simple pour ceux qui sont alphabétisés.

3. Un nombre suffisant de personnes alphabétisées

Il faut qu'il y ait au moins un scribe pour chacune des équipes de collecte.

4. Un nombre suffisant de personnes bilingues.

Il doit y avoir au moins huit personnes bilingues (langue vernaculaire et langue du questionnaire pour l'atelier CRM). Ils doivent servir en tant que responsables d'équipe et traducteurs. (Le questionnaire CRM a été traduit en une dizaine de langues majoritaires.)

5. Un coordinateur d'atelier

Le coordinateur d'atelier est une personne de la région qui prend la responsabilité de planifier l'atelier, d'identifier les participants, et qui organise un atelier spécifique pour une session supplémentaire de trois jours de formation précédant l'atelier principal. (Le coordinateur recevra alors une formation à ce moment-là.)

Participation

L'atelier nécessite un minimum de 31 participants qui jouent des rôles variés tels qu'ils sont décrits dans le Manuel du coordinateur d'atelier. Ils sont les suivants :

  1. Coordinateur* (1) – supervise le processus de collecte de mots
  2. Gestionnaire logistique (1) – s'occupe des besoins des participants
  3. Collecteur de données* (1) – enregistre les progrès et assure la cohérence des données
  4. Traducteurs* (2-4) – ajoutent des gloses aux mots collectés dans une langue de grande diffusion (LGD).
  5. Secrétaires* (2-3) – saisissent les mots collectés dans les ordinateurs
  6. Responsables d'équipe* (6) – gardent les équipes de collecte sur la bonne voie pour ce qui concerne l'interprétation des questions de domaines sémantiques aux membres de leur équipe.
  7. Scribes* (6) – transcrivent les mots au fur et à mesure qu'ils sont « trouvés » par les différents membres de l'équipe
  8. Experts dans la langue (12-18) – participants qui aident à la collecte de mots
  9. Experts en écriture (2-3) – quelques scribes ou experts dans la langue qui maîtrisent l'orthographe vernaculaire seront invités à rester encore une semaine pour la phase de correction.

* Les rôles marqués d'un astérisque nécessiteront trois jours de formation avant l'atelier.

L’événement

Formation préalable

Dans la plupart des cas, un conseiller viendra pour former le coordinateur de l'atelier, les responsables d'équipes, ainsi que les autres participants principaux lors des trois derniers jours qui précèdent la semaine de l'atelier. Le conseiller a déjà eu une expérience d'atelier de collecte de mots et aidera le coordinateur à mettre en œuvre les pratiques recommandées dans la documentation. Trois jours de formation sont prévus : introduction à la méthode CRM, mettre en place l'environnement et organiser le matériel. Le conseiller restera tout le temps de l'atelier de collecte de mots, et sera en charge de former les participants le premier jour. Il/elle servira en tant que personne ressource pour le coordinateur afin de résoudre toutes les questions qui émergeront pendant la phase de collecte de mots, et supervisera la correction des mots pendant la semaine qui suit la collecte de mots.

L'atelier

Tous les participants qui voyagent arriveront la veille de l'atelier, et ceux qui habitent sur place arriveront le matin même. Lors de la première demi-journée, les nouveaux participants seront introduits à la méthode de collecte de mots, et plusieurs des domaines les plus simples seront traités. Divisez les participants en six équipes de quatre ou cinq personnes, en vous assurant que chaque équipe ait un responsable et un scribe. Les domaines sémantiques et les questions sont organisés en séries de dossiers, et chaque équipe travaille sur un dossier à la fois. Les dossiers contiennent un nombre de pages tirées du questionnaire RCM qui sont agrafées ensemble, et couvrent une série de domaines sémantiques qui y sont relatifs ainsi que les questions destinées à aider faire sortir des mots en langue vernaculaire. Bien que la description du domaine et les questions soient en LGD, le responsable d'équipe va transmettre (en langue vernaculaire) le sens de la description du domaine au groupe, et la collecte de mots peut commencer, à mesure que les experts dans la langue disent les mots qui leur viennent à l'esprit dans leur propre langue. Lorsque les experts dans la langue trouvent difficile de penser à des mots supplémentaires reliés au domaine en question, le responsable d'équipe peut traduire un ou plusieurs des questions qui se trouvent dans la portion du questionnaire, dans un effort pour aider les experts dans la langue à se rappeler plus de mots qu'ils connaissent appartenir à ce domaine. Les mots sont écrits sur une feuille de résultats. Lorsque le flux de mots et expressions relatives à un domaine particulier rétrécit et que toutes les questions ont été utilisées, le groupe passe au domaine suivant, enregistrant les mots qui appartiennent à cette catégorie sur une feuille différente, afin de ne pas mélanger les contenus d'un domaine avec un autre. Lorsque tous les domaines du dossier ont été remplis, le dossier est retourné au collecteur de données.

Le collecteur de données note les progrès sur une feuille de résultats, puis donne le dossier aux traducteurs, qui ajoutent une courte description ou un mot en LGD pour chaque mot en langue vernaculaire écrit sur la feuille de résultats. Lorsque l'un des traducteurs termine son travail sur un dossier, il le transmet aux secrétaires, qui saisissent les mots et les gloses dans l'ordinateur. L'équipe est de temps en temps encouragée par des annonces publiques de leurs progrès et des projections du nombre de mots attendus à la fin de l'atelier, estimés à partir du dernier résultat. Lorsque tous les domaines sont complétés, s'il reste encore du temps, certains des premiers domaines peuvent être révisés afin d'ajouter d'autres mots. A la fin de l'atelier, un lexique provisoire est imprimé directement depuis FLEx ou WeSay, et est affiché à l'écran jusqu'à la cérémonie de clôture.

Correction

De nombreuses erreurs vont figurer dans la base de données à ce niveau. L'atelier de collecte de mots à proprement parler possède deux étapes qui vont aider à repérer les erreurs. Ceux qui définissent les gloses ne sont pas les mêmes personnes qui trouvent les mots, et doivent être en capacité de résoudre certains problèmes d'épellation pour les mots qu'ils ne comprennent pas. Ensuite, les secrétaires auront à confirmer la légitimité des mots pendant qu'ils les saisissent. Hélas, quelques erreurs passeront au travers des filtres. Ainsi, plutôt que d'arrêter l'atelier ici, quelques-uns des scribes et des experts dans la langue qui maîtrisent bien l'orthographe vernaculaire resteront une semaine de plus. Ils feront des corrections à la main sur le document provisoire, et les secrétaires saisiront ces corrections dans la base de données. A la fin de cette dernière semaine, les mots devraient être corrigés, et deux ou trois copies seront imprimées et reliées pour la communauté linguistique, en tenant compte de la nature provisoire du document. La base de données sera confiée à l'agence de parrainage ou à un intermédiaire, afin qu'elle soit diffusée sur internet dans les 30 jours qui suivent.

Travail après l’atelier

Les ordinateurs fournis pour la collecte de mots auront les programmes de base de données lexicales WeSay or FLEx installés, et ces ordinateurs resteront la propriété de la communauté linguistique à la fin de l'atelier. Le programme autorise la continuité de la collaboration sur les données lexicales, permettant l'ajout de vocalisations, d'information grammaticale, de phrases d'exemple et de définitions complètes. Le travail en cours est mis à jour sur un portail internet permettant l'édition des données à partir de n'importe quel navigateur. Comme les données sont protégées sous licence Creative Commons, elles resteront disponibles pour tout effort de développement linguistique au sein de la communauté.

Français
© SIL International: 
Creative Commons Licence