Mémoires des langues : suggestions au projet Sorosoro / 2008

Remarques contributives au Programme Sorosoro

Je suis passionné par la relation des expériences valorisées par l'UNESCO pour célébrer l'importance de la langue maternelle et le potentiel d'enrichissement culturel permis par la mise en dialogue de langues différentes. Aussi le Programme Sorosoro www.sorosoro.org apparait décisif pour capitaliser sur ces expériences en les démultipliant grâce àune combinaison originale de technologies, de médias et de plans d'action associant organismes mondiaux et locaux.

Ici, je souhaiterais contribuer au programme Sorosoro en apportant les compétences d'un sémiologue praticien, compétences issues de multiples projets de formation d'adultes et de capitalisation des connaissances dans de grandes entreprises. Dans mes compétences figurent la connaissance et la pratique des technologies de documentation électronique et de diffusion sur Internet.

Mon intérêt pour le Programme Sorosoro m'incite à suggérer des propositions sur les trois volets prévus, en précisant le dispositif d'ensemble sur certains points :

* la base de données audiovisuelles de référence sur les langues en danger, prenant la forme d'une "Encyclopédie Numérique des Langues" pérenne et sécurisée

* une "Télé des Langues" sur Internet, facilitant l'exploitation de cette base de données via une diffusion au plus grand nombre

* la restitution aux communautés des données accumulées afin qu'elles puissent s'en servir dans leur propre développement, en particulier dans le domaine de l'éducation.

Avant tout, je prends en considération les contenus et les formats des données audio*visuelles, dans la mesure où ces contenus et ces formats conditionnent les modalités d'exploitation des données.

C'est pourquoi, d'emblée, je préconise la distinction entre la base de données audiovisuelles et l'Encyclopédie, parce que l'Encyclopédie est une modalité spécifique d'accès aux données qui ne doit pas influencer les autres modalités d'accès. Donc, le formatage et l'indexation des données dans la Base commune doivent, à mon avis, être découplés du mode d'organisation de l'accès aux données dans l'Encyclopédie. Nous le verrons plus loin : ce découplage va permettre de construire deux niveaux d'Indexation.

Seconde remarque. Ces données sont indiquées comme audiovisuelles. C'est essentiel car les langues en danger vivant avant tout comme des actes de parole, il est indispensable de voir et d'entendre les performances de locuteurs. Est-ce exclure les données textuelles ? Je préconise d'envisager tous les formats de données, afin que le format du support numérique ne soit pas une contrainte par la suite.

En effet, puisque le programme Sorosoro réussira, des textes vont être produits, structurant les langues orales. Ces textes permettront leur transmission par l'éducation (listes de vocabulaire, manuels, exercices d'apprentissage) ; ils permettront le développement d'études linguistiques mettant en valeur les particularités de chaque langue.

Par ailleurs, il y aura des études thématiques explicitant les connaissances liées aux vocabulaires de chaque langue. D'emblée, il faut prévoir une gestion de référencements croisés entre les données textuelles et les données audiovisuelles.

Troisième remarque. L'univers culturel et les connaissances liés à une langue sont issus d'un territoire et de sa géographie. La donnée cartographique s'impose donc. Cela induit la nécessité de réfléchir à la gestion informatique de la nature de la donnée (donnée sonore, donnée visuelle, donnée audiovisuelle, donnée textuelle, donnée cartographique), ainsi qu'à la gestion des informations la caractérisant et la distinguant dans l'ensemble des données.

Quatrième remarque suscitée par la combinaison de la télévision numérique et d'Internet. La démocratisation de la technologie est un vecteur de la diminution de la fracture numérique. Mais les technologies utilisées seront-elles accessibles aux communautés locales concernées ?

Aussi, je m'interroge : sous quelles formes et quels supports seront restituées aux communautés locales les données accumulées. Des supports traditionnels comme les manuels scolaires papier resteront indispensables. Des technologies robustes et très peu coûteuses doivent permettent l'exploitation des contenus et des formats des données linguistiques et culturelles.

Est-il possible d'envisager la diffusion à large échelle des petites unités d'édition de CD Rom permettant aux communautés de se façonner leurs propres supports, avec en parallèle une large diffusion de lecteurs de CD avec batterie à longue autonomie ?

Schéma fonctionnel du dispositif Sorosoro

A mon niveau présent d'information, je propose le schéma que j'imagine du dispositif à bâtir :

Schéma fonctionnel d'une base mémoire des langues

L'exploitation par les communautés locales

Pour être exploitables par les communautés locales, les données linguistiques devraient se présenter comme des actes de parole complets et donc être accompagnée de l'ensemble de leur contexte sémiologique.

La compréhension de la situation de parole (transmission de savoir, coordination dans l'action, traitement d'un conflit, rituel de partage de valeurs, ..) passe par l'apprentissage d'un décryptage des caractéristiques des interlocuteurs : maître & élèves, membres d'un collectif de travail ou d'une communauté, place dans une famille, partenaires commerciaux, etc. D'autre part, l'apprentissage doit être possible sur la signification des combinaisons des signes symboliques utilisés dans ces actes de parole.

Dans ce contexte global restituant la complexité culturelle d'une situation de parole ¬ d'un événement de parole ¬ il devrait être possible de zoomer sur des détails qui s'avèrent décisifs pour comprendre le déroulement et l'issue d'un dialogue. Pour faciliter une situation d'immersion totale, il faut procéder au recueil de l'ensemble des données qui donne du sens à une activité linguistique.

La valorisation par la Télé des langues

Pour être comprise à la télévision, une donnée linguistique et culturelle doit être introduite par des repérages successifs, qui orientent et préparent progressivement le regard du téléspectateur. Cela nécessite d'ajouter à cette donnée, au moment du recueil, des informations sur le contexte de production de la donnée (où, quand, comment, par qui, pour quel projet, pour quelle institution, ..) et des Index de premier niveau sur les caractéristiques langagières (langue de référence, dialecte, variante de dialecte ..).

De plus, le producteur de l'émission devra organiser son émission selon un sujet qui fait passerelle entre l'intérêt du téléspectateur et l'enjeu des faits de parole. Cela suppose une indexation de la donnée langagière selon des critères sémiologiques.

La sémiologie étudie la vie des signes au sein de la société. Ce que la sémiologie fait apparaître est que les locuteurs engagent une série d'enjeux chaque fois qu'ils prennent la parole. Ils réaffirment ou interrogent un savoir sur un objet ou une action, des rôles sociaux à tenir, une valeur culturelle.

Par conséquent, ils restent silencieux sur ce qui va de soi à un moment, et parlent lorsqu'il y a à résoudre ce qui semble une incertitude. En parlant, les locuteurs font vivre la société.

Erik Orsenna, le 9 juin 2008, a rappelé que lorsque le français n'a besoin que du seul mot "glace", les Inuits ont trente termes différents pour distinguer les différents états de la glace. Imaginons une émission sur ces 30 termes. Ils ne peuvent être présentés et articulés dans leurs valeurs respectives de significations que si l'émission nous montre parallèlement les activités des Inuits et les décisions qu'ils sont amenés à débattre. Les termes fonctionnent comme des signes des états de la glace orientant l'interprétation du territoire.

Au terme du processus d'interprétation finale, une décision est prise : aller chasser ou pas sur un territoire ? Utiliser un traineau ou non ? Combien faut*il de chiens pour tirer un traineau si la glace présumée fragile vient à céder ? Faut*il interdire à un jeune Inuit l'utilisation d'une moto*neige trop lourde ? Ici, l'enjeu est la vie ou la mort.

Cet exemple s'applique à la lecture des caractéristiques des plantes par les Indiens d'Amazonie, ou à l'analyse de la météo et de la mer par les pécheurs d'une Ile de l'Océan Pacifique.

Pour faciliter la fabrication des émissions en fonction des différents publics cibles, il apparaît donc nécessaire d'ajouter aux Index 1/ une indexation par les enjeux des Activités, qu'elles soient opérationnelles ou culturelles ; 2/ une Indexation par les enjeux des Caractéristiques des territoires, des objets et des supports symboliques.

La valorisation par l'Encyclopédie des langues

Il est difficile d'imaginer une Encyclopédie qui ne soit pas accessible par Internet. De même, le modèle Wikipédia s'impose comme exemplaire, puisque le programme Sorosoro vivra dans la mesure où cette Encyclopédie facilitera des contributions de n'importe quel lieu du monde. C'est un défi, car en principe, pour être la preuve vivante de la diversité des langues, cette Encyclopédie devrait accueillir la contribution d'un locuteur parlant sa propre langue, quelque soit cette langue.

La maîtrise de sa langue maternelle - de sa langue familiale et communautaire - donne une place dans la société, et la possibilité d'en être un acteur. Faire vivre la société en parlant est universel. En faisant vivre sa langue dans l'Encyclopédie, le contributeur s'inscrit comme citoyen du monde. Lui et la communauté qu'il représente restaurent leur dignité et leur confiance en eux. Les exemples valorisés par l'UNESCO le montrent : la confiance en soi encourage les individus communautés à développer des projets.

Cependant, la contribution de chaque communauté doit être partageable. Est- ce que les données seront uniquement des bandes sonores ou des vidéos de faits de parole ? Les faits sonores et visuels recueillis ne peuvent pas être livrés brut. A l'évidence, il faut restituer un contexte global, géographique et social, où la parole apparaît développant des signes pour un "faire vivre une société".

Les caractéristiques sémiologiques des évènements de parole nous semblent tout à fait décisives pour construire une méthode d'exploitation des données. Il ne s'agit pas simplement de la précision dans l'accès ultérieur à une donnée, mais de la valorisation des données dans un partage universel.

Considérons les paroles accompagnant les moments de la culture d'une plante dans une langue donnée. D'un coté, il doit être possible - en extension - de rassembler et de comparer les paroles produites dans différentes langues par rapport à des plantes cultivées similaires. De l'autre, il doit être possible - en compréhension - de remonter de ces paroles vers l'organisation des travaux agricoles, vers les échéances de consommation ou d'échanges commerciaux, vers les rituels de fécondité, etc.

Le système d'Index multiples que nous proposons permet de faire apparaître les passerelles entre les langues et ce dont elles sont les signes. Nous préconisons que les Index choisis dans les différentes langues et dialectes soient traductibles en eux selon une logique du "grosso modo équivalent". Ainsi le terme Sorosoro est l'exemple d'un tel Index posant une équivalence entre les termes sorosoro, souffle, parole, langue.

Au moment où j'écris ces lignes, je viens d'assister à la retransmission télévisée de la clôture des jeux Olympiques à Pékin, retransmission suivie par deux milliards d'individus. Les figures utilisées, le cercle, la tour, le mouvement des vagues, le mélange... sont comprises universellement. A ces figures peuvent s'associer des Index quasi universels : l'Harmonie, la Mémoire, le Changement, l'Accueil de l'autre. Je fais le pari que ces mots sont traduisibles dans toutes les langues du monde.

J'ai expérimenté avec succès dans plusieurs entreprises ce système d'Index "grosso modo équivalent" afin de faire apparaître des passerelles entre différentes ressources.

De plus, ces Index pourraient être organisés en réseaux transversaux selon les enjeux de la diversité présentés par le Programme Sorosoro. Je les rappelle :

  • La diversité linguistique comme vecteur de connaissance
  • La diversité linguistique et la biodiversité
  • La reconnaissance de la diversité linguistique comme condition du développement
  • La diversité linguistique au service de l'éducation
  • La diversité linguistique et la paix

Les données linguistiques et culturelles, lorsqu'elles sont recueillies, devraient être indexées à un premier niveau de façon à permettre une indexation de second niveau qui "fasse signification" vers les enjeux du programme Sorosoro.

L'enrichissement des données par des données de type sémiologique est la phase intermédiaire pour rendre possible la construction des Index "grosso modo équivalents".

Puis pour la mise en relation entre ces Index "grosso modo équivalents" et les Enjeux du programme Sorosoro. Ceci pourrait se décrire comme un couplage d'enjeux entre le "très local" et le "plus mondial".

Je suggère que l'Encyclopédie est le lieu privilégié pour construire, à partir des Index locaux de premier niveau, des Index "grosso modo équivalents" de partage de second niveau. Voici le schéma qui illustre cette suggestion :

Deux niveaux d'indexation des données de paroles

Proposition d'un schéma type d'une donnée audiovisuelle

Je vais donc proposer maintenant le schéma type d'une donnée audiovisuelle où figure l'ensemble des éléments de contexte à recueillir dans un document audio visuel, de façon à préserver la dimension des faits de paroles comme signes.

Fondamentalement ce schéma doit être considéré comme une série d'interactions qui se développent dans un scénario entre des acteurs qui ont des positions relationnelles et sociales. Cette série d'interactions est rendue possible par une obligation légitimant la parole d'un locuteur ou une occasion amenant les uns et les autres à faire des interprétations en vue d'un choix, d'une action, de l'exécution d'un rituel culturel.

Dans mon approche sémiologique, la notion d'événement remplace la notion traditionnelle d'objet. Je m'inspire de la notion latine de causa : de quoi est-il question ? L'enjeu de la parole est, au travers de l'implication variable des traits d'un territoire, des objets, des individus, des symboles, des actions et des institutions, de permettre à des interlocuteurs de s'accorder sur la qualification et le traitement d'un événement, qu'il soit passé, présent ou futur.

La nature de l'événement est une donnée clé pour la mise en relation de contextes sémiologiques semblables. Par exemple, la fête des morts est un événement facilement comparable dans de multiples aires culturelles et langagières. Les différences n'en seront que plus frappantes.

La prise de parole peut être distincte du lieu ou du moment qui la motive. La prise de parole peut être commandée par un événement symbolique qui revient chaque année : le début d'une saison, où la date d'un décès évoquée chaque année par la fête des morts.

Il est important de distinguer deux modes de production accompagnant les actes de paroles :

* la production de signes ayant une valeur symbolique : insignes sociaux, comportements ritualisés (ou non), sons, rythme, musique, images qui module la force d'une prise de parole ou d'une réponse

* la production d'actions en conséquence des paroles, actions mettant en mettant en jeu des objets et le corps des personnes

En fait, une langue fait toujours la place à un échange avec une autre langue. Cela peut prendre la forme d'un mot "de l'autre langue" utilisé sur le mode de la citation. Cela peut prendre la forme d'une icône commune à une aire culturelle. Cela peut être un objet permettant l'échange, un rapport entre quantités échangées dans un troc, un instrument de mesure ou une unité monétaire acceptée par les deux parties.

Dans tous les dialogues commerciaux, il conviendra de mettre en valeur ces éléments. Mais, je suggère aussi de considérer comme une forme d'échange les dialogues mettant en scène les relations des hommes avec les Divinités ou les forces magiques.

Une des difficultés du recueil de données est que souvent, dans les cultures orales, la transmission de connaissances et l'explication des différents termes se fait au coup par coup, car elle se fait par imitation des "bonnes pratiques des individus expérimentés". En fait, l'explicitation conjointe des bonnes pratiques, des connaissances et du vocabulaire qui les structure se fait dans des situations d'échange entre un ethnologue et des autotochnes. Apparemment "non naturelles", ces situations d'échanges sont très importantes à filmer car elles montrent à l'œuvre les compétences sémiologiques de la culture orale des autotochnes.

Voici le schéma que je propose pour organiser tous ces éléments, selon le principe "préserver la globalité sémiologique de l'acte de parole" :

Eléments d'un acte de parole

Ce schéma permet de vérifier, lors de la construction de la donnée audiovisuelle, que l'ensemble des éléments du contexte sont effectivement recueillis, de façon à préserver la dimension signifiante des paroles échangées. Ce schéma est suggestif et indicatif : il ne prétend pas à l'exhaustivité. Sans nul doute, il y aura beaucoup de créativité de la part des contributeurs à la Base de données.

Il nous semble que les données audiovisuelles recueillies selon ce schéma permettent les trois types d'exploitation décrites auparavant :

* Communauté locale : la globalité de la situation de dialogue et son caractère familier facilite l'appropriation et l'apprentissage par la communauté.

* Télé des langues : les différents types d'éléments composant le contexte permettent de visualiser les enjeux de l'échange de paroles, ce qui facilite l'orientation du regard du spectateur et le rapproche de vocables qui semblent du coup moins incompréhensibles.

* Encyclopédie : le lien fait entre un échange de parole et un évènement, et avec l'ensemble des éléments, facilite la construction des Index "grosso modo équivalents" de l'encyclopédie puisque les évènements suscitant la parole sont à priori les mêmes dans toutes les communautés humaines.

Voici donc une série de premières réactions faites par un expert de la gestion documentaire en entreprise.

Texte en cours d'écriture

Semiodialogie l'exploitation de documents de references

Septembre 2008