25
2ième IGF-10/2007 2ième IGF-10/2007 Atelier Coalition dynamique pour la Atelier Coalition dynamique pour la diversité linguistique diversité linguistique Daniel Pimienta Daniel Pimienta UAG/FUNREDES/MAAYA UAG/FUNREDES/MAAYA Intégration de la traduction par programme Intégration de la traduction par programme dans les listes de discussion: bilan d'une dans les listes de discussion: bilan d'une expérience pionnière et perspectives expérience pionnière et perspectives

2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Embed Size (px)

DESCRIPTION

2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta UAG/FUNREDES/MAAYA Intégration de la traduction par programme dans les listes de discussion: bilan d'une expérience pionnière et perspectives. - PowerPoint PPT Presentation

Citation preview

Page 1: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

2ième IGF-10/20072ième IGF-10/2007

Atelier Coalition dynamique pour la Atelier Coalition dynamique pour la diversité linguistiquediversité linguistique

Daniel PimientaDaniel PimientaUAG/FUNREDES/MAAYAUAG/FUNREDES/MAAYA

Intégration de la traduction par programme Intégration de la traduction par programme dans les listes de discussion: bilan d'une dans les listes de discussion: bilan d'une

expérience pionnière et perspectivesexpérience pionnière et perspectives

Page 2: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Daniel PimientaDaniel PimientaUniversité Antilles-GuyaneUniversité Antilles-Guyane

[email protected]@funredes.org

ASSOCIATION ASSOCIATION RÉSEAUX & DÉVELLOPEMENTRÉSEAUX & DÉVELLOPEMENT

FUNREDESFUNREDEShttp://funredes.orghttp://funredes.org

http://funredes.org/lchttp://funredes.org/lc

Réseau MAAYARéseau MAAYAhttp://maaya.orghttp://maaya.org

Page 3: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

DONNÉES DE RÉFERENCEDONNÉES DE RÉFERENCE

Sur la base d’une page de 250 motsSur la base d’une page de 250 mots

Traduction pro. Nord = 25 – 50 $/pageTraduction pro. Nord = 25 – 50 $/page

Traduction pro. Sud = 8 – 15 $/pageTraduction pro. Sud = 8 – 15 $/page

Page 4: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

EN PEU DE CONTEXTEEN PEU DE CONTEXTE

SERVICE COÛT QUALITÉTraduction par programme sans révision 1 Extrêmement pauvre

Traduction par programme avec révision 5-10 Très pauvre

Traduction par programme avec normalisation de l’entrée

20-30 Pauvre

Traduction par programme avec normalisation de l’entrée et révision

25-35 Presque acceptable

Traduction par non professionel, assisté par programme

50-70 A peine acceptable

Traduction par non professionel 100-200 A peine acceptable

Traduction par professionel 400-2400 Bonne

Page 5: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Pourquoi tant de données Pourquoi tant de données économiques?économiques?

Parce qu’il s’agit avant tout d’une Parce qu’il s’agit avant tout d’une question de pragmatisme et de question de pragmatisme et de compromis entre qualité et coût.compromis entre qualité et coût.

Page 6: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

TRADUCTION PAR PROGRAMME DANS TRADUCTION PAR PROGRAMME DANS LES CONFÉRENCES ÉLECTRONIQUESLES CONFÉRENCES ÉLECTRONIQUES

La traduction automatique est un pis-aller La traduction automatique est un pis-aller mais c’est mieux que rien…mais c’est mieux que rien…

Il s’agit en fait d’une aide à Il s’agit en fait d’une aide à l’intercompréhension, pas d’une l’intercompréhension, pas d’une

traduction.traduction.

Page 7: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

TRADUCTION PAR PROGRAMME DANS TRADUCTION PAR PROGRAMME DANS LES CONFÉRENCES ÉLECTRONIQUESLES CONFÉRENCES ÉLECTRONIQUES

En schématisant beaucoup:En schématisant beaucoup:

Les personnes qui ont en besoin sont bien Les personnes qui ont en besoin sont bien contentes…contentes…

Les personnes qui n’ont en pas besoin se Les personnes qui n’ont en pas besoin se gausse de la mauvaise qualité… sans gausse de la mauvaise qualité… sans prendre conscience qu’elles sont les prendre conscience qu’elles sont les premières responsables!premières responsables!

Page 8: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Un exemple pour comprendre les Un exemple pour comprendre les mécanismes.mécanismes.

ORIGINAL EN FRANÇAISORIGINAL EN FRANÇAIS

Ceci n'est pas un message !Ceci n'est pas un message !C'est un texte pour faire un test de la qualité de la traduction par programme.C'est un texte pour faire un test de la qualité de la traduction par programme.Vous verrez que les fautes Vous verrez que les fautes d'ortographe et les defautsd'ortographe et les defauts de ponctuation de ponctuationprovoquent une baisse sensible de la qualité surtout l'oubli du pointprovoquent une baisse sensible de la qualité surtout l'oubli du pointà la fin de la phrase. Ne parlons pas des diacritiques: à la fin de la phrase. Ne parlons pas des diacritiques: cet ete j irais a la plagecet ete j irais a la plageavec mes ami bresiliens..avec mes ami bresiliens..

Les phrases longues et compliquées utilisant la double négation ne peuvent pasLes phrases longues et compliquées utilisant la double négation ne peuvent pasne pas faire autrement que d'engendrer des problèmes qui ne seraientne pas faire autrement que d'engendrer des problèmes qui ne seraientpas inévitables si l'on faisait l'effort nécessaire pour les éviter et les couperpas inévitables si l'on faisait l'effort nécessaire pour les éviter et les couperen phrases plus courtes de manière à ce que le programme  ne se en phrases plus courtes de manière à ce que le programme  ne se planteplante pas. pas.

Par contre, si l'on respecte correctement les règles, le résultat peut surprendrePar contre, si l'on respecte correctement les règles, le résultat peut surprendrepar sa qualité. Regardez comment la phrase précédente et celle-ci sont parfaitementpar sa qualité. Regardez comment la phrase précédente et celle-ci sont parfaitementtraduites en espagnol et anglais. Cela vous impressionne?traduites en espagnol et anglais. Cela vous impressionne?

Avec les cordiales salutations de Daniel PimientaAvec les cordiales salutations de Daniel PimientaPour l'atelier sur la diversité linguistique du Forum de Gouvernance de l'InternetPour l'atelier sur la diversité linguistique du Forum de Gouvernance de l'Internet

PS: Cet été, je vous assure que j'irai à la plage avec mes amis brésiliens,PS: Cet été, je vous assure que j'irai à la plage avec mes amis brésiliens,je ferais attention à la ponctuation, et mon orthographe sera meilleure.je ferais attention à la ponctuation, et mon orthographe sera meilleure.Tudo bom?Tudo bom?

Page 9: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Traduction à l’anglaisTraduction à l’anglaisThis is not a message: -)! It is a text to make a test of thetranslation quality by program. You will see that the faults ofortographe and the defects of punctuation cause a fall sensitive ofquality especially the lapse of memory of the point to the end of thesentence. Let us not speak about the diacritic ones: this ete J wouldgo has the beach with my friend bresiliens..

The long and complicated sentences using the double negation cannotnot make differently than to generate problems which would not beinevitable if one made the effort necessary to avoid them and cut themin shorter sentences so that the program is not planted.

On the other hand, if the rules correctly are complied with, theresult can surprise by its quality. Look at how the preceding sentenceand this one are translated perfectly into Spanish and English. Doesthat impress you?

With the cordial greetings of Daniel Pimienta For the workshop on thelinguistic diversity of the Forum of Governorship of the Internet

PS: This summer, I ensure you that I will go to the beach withmy Brazilian friends, I would pay attention to the punctuation, and myorthography will be better. Tudo bom?

Page 10: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Traduction à l’espagnolTraduction à l’espagnol¡Esto no es un mensaje: -)!Es un texto para hacer una prueba de la calidad de la traducción porprograma.Verán que las faltas de ortographe y los defauts de puntuacióncausan una reducción sensible de la calidad sobre todo el olvido delpunto al final de la frase. No hablan del diacríticos: este sido jirían tiene la gama con mi amigo bresiliens..

Las frases largas y complicadas que utilizan la doble negación nopueden no hacer diferentemente que de generar problemas que no seríaninevitables si se hacía el esfuerzo necesario para evitarlos ycortarlos en frases más cortas de tal modo que el programa no seestablece.

Por el contrario, si se respetan correctamente las normas, elresultado puede sorprender por su calidad. Observe cómo la fraseanterior y ésta se traducen perfectamente en español e inglés. ¿Esoles impresiona?

Con los cordiales saludos de Daniel Pimienta para el taller sobre ladiversidad lingüística del Foro de Gobernanza de Internet

PS: Este verano, les garantizo que iré a la gama con mis amigosbrasileños, yo tendría cuidado con la puntuación, y mi ortografíaserá mejor. ¿Tudo bom?

Page 11: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Les règles à suivre pour un bon Les règles à suivre pour un bon résultat (1/2)résultat (1/2)

Vérifiez que les textes ne contiennent ni fautes Vérifiez que les textes ne contiennent ni fautes d'orthographe, ni erreurs de syntaxe. Utilisez votre d'orthographe, ni erreurs de syntaxe. Utilisez votre correcteur d'orthographe ! correcteur d'orthographe !

Les signes de ponctuation, tels que le point et la virgule, Les signes de ponctuation, tels que le point et la virgule, aident le programme à identifier les unités de traduction. Il aident le programme à identifier les unités de traduction. Il convient, donc, de placer un point en fin de chaque phrase. convient, donc, de placer un point en fin de chaque phrase. Les signes /, *, _ et - ne doivent pas être collés à des mots. Les signes /, *, _ et - ne doivent pas être collés à des mots. Insérez une espace (mettez un blanc) pour les séparer. Par Insérez une espace (mettez un blanc) pour les séparer. Par exemple, changez homme/femme en homme / femme. exemple, changez homme/femme en homme / femme.

Utilisez des lettres majuscules et des lettres minuscules. Utilisez des lettres majuscules et des lettres minuscules. Une majuscule doit être placée en début de chaque phrase; Une majuscule doit être placée en début de chaque phrase; une phrase écrite entièrement en majuscules peut une phrase écrite entièrement en majuscules peut entraîner des erreurs de traduction. entraîner des erreurs de traduction.

Page 12: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Les règles à suivre pour un bon Les règles à suivre pour un bon résultat (2/2)résultat (2/2)

Une phrase longue et/ou complexe, devrait être réécrite afin d'apparaître sous la forme de deux, voire de plusieurs phrases plus courtes. Evitez surtout de placer des groupes de mots entre parenthèses ou entre tirets. Evitez également, dans la mesure du possible, l'utilisation des guillemets.

Quand cela est possible, évitez les structures passives, par exemple :TO : Une copie du rapport sera envoyée à tous les membres.TP : Nous enverrons une copie du rapport à tous les membres.

Évitez l'emploi de locutions idiomatiques. Exemple : TO : Il est tombé dans les pommes. TP : Il s'est évanoui.

Si le sujet d'une phrase porte sur plus d'un verbe, il vous est recommandé de répéter le sujet devant chaque verbe: TO: Il a visité la nouvelle usine, a décidé de l'acheter, puis a changé d'avis. TP : Il a visité la nouvelle usine, il a décidé de l'acheter, puis il a changé d'avis.

Page 13: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

La perte de la netiquetteLa perte de la netiquette

Est une catastrophe pour l’utilisation Est une catastrophe pour l’utilisation de la traduction automatique, sauf à de la traduction automatique, sauf à ne l’utiliser que dans des listes avec ne l’utiliser que dans des listes avec une modération pro-active qui puisse une modération pro-active qui puisse y remédier….y remédier….

Page 14: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Avec toutes ces réserves…Avec toutes ces réserves…

L’aide à l’intercompréhension par L’aide à l’intercompréhension par dispositif automatique intégré dispositif automatique intégré permet d’améliorer la permet d’améliorer la communication interculturelle et communication interculturelle et surtout d’éviter l’attitude confortable surtout d’éviter l’attitude confortable de l’autruche face au défi de la de l’autruche face au défi de la diversité linguistique dans le diversité linguistique dans le cyberespace…cyberespace…

Page 15: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

HISTORIQUE DE L’EXPÉRIENCE DE FUNREDESHISTORIQUE DE L’EXPÉRIENCE DE FUNREDES

Expérience traduction par Expérience traduction par programme manuelle (1996-2001)programme manuelle (1996-2001)

Expérience EMEC dans le cadre du Expérience EMEC dans le cadre du projet MISTICA (1999)projet MISTICA (1999)

Expérience traduction automatique Expérience traduction automatique par programme (depuis 2001)par programme (depuis 2001)

Page 16: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

Première expériencePremière expérience

Liste de discussion sue la culture de la Liste de discussion sue la culture de la Caraïbe: Caraïbe: [email protected]@funredes.org

Message concatené: original suivi des Message concatené: original suivi des traductions.traductions.

Construction manuelle au début.Construction manuelle au début.

Page 17: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

EMEC - CONTEXTEEMEC - CONTEXTE

DAND LE CADRE DU PROJET MISTICADAND LE CADRE DU PROJET MISTICA 250 personnes travaillant sur 250 personnes travaillant sur

l’impact social des TIC en ALCl’impact social des TIC en ALC Espagnol, anglais, français et Espagnol, anglais, français et

portugaisportugais Entre 9/1999 et 7/2000Entre 9/1999 et 7/2000 http://funredes.org/misticahttp://funredes.org/mistica

Page 18: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

EMEC : RESULTATSEMEC : RESULTATS

Un succès indéniableUn succès indéniable Mais un coût que personne n’a voulu Mais un coût que personne n’a voulu

assumer ensuite (trop tôt!)assumer ensuite (trop tôt!) Pas de possibilité de continuerPas de possibilité de continuer Obligation de retour à une approche Obligation de retour à une approche

beaucoup moins ambitieusebeaucoup moins ambitieuse

Page 19: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

EMEC : COÛTEMEC : COÛT

Sur la base de 4 langues, traduction Sur la base de 4 langues, traduction humaine des résumés et traduction humaine des résumés et traduction automatique avec révision des automatique avec révision des messagesmessages

Dans un premier temps, 20 Dans un premier temps, 20 US$/messageUS$/message

Après optimisation par la création Après optimisation par la création d’un logiciel de gestion: d’un logiciel de gestion: 10 US$/message10 US$/message

Page 20: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

EMEC : RÉFÉRENCESEMEC : RÉFÉRENCES

L’explication: L’explication: http://funredes.org/mistica/francais/emec/methode_emec/http://funredes.org/mistica/francais/emec/methode_emec/

Les archives EMEC:Les archives EMEC:http://funredes.org/mistica/bdd/categ.php3/idi/frhttp://funredes.org/mistica/bdd/categ.php3/idi/fr

Publication dans Journal européen:Publication dans Journal européen:http://funredes.org/mistica/english/emec/method_emec/EMEChttp://funredes.org/mistica/english/emec/method_emec/EMECmethodology.htmlmethodology.htmlouou

http://www.upgrade-cepis.org/issues/2002/1/up3-http://www.upgrade-cepis.org/issues/2002/1/up3-1Pimienta.pdf1Pimienta.pdf

Page 21: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

TRADAUTOTRADAUTO

Un service automatique offert par Un service automatique offert par FunredesFunredes

Plus de 15 listes en fonctionnementPlus de 15 listes en fonctionnement Plusieurs options (listes séparées, Plusieurs options (listes séparées,

listes concaténées, sur le web…)listes concaténées, sur le web…) Un projet en recherche de partenaireUn projet en recherche de partenaire

Page 22: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

TRADAUTO: utilisationTRADAUTO: utilisation

Utilisation interne: mistica, cardicis, salsa, Utilisation interne: mistica, cardicis, salsa, cardis, m3edt, par courrielcardis, m3edt, par courriel

Utilisation externe: bohio, wsis-plenary, Utilisation externe: bohio, wsis-plenary, wsis-acsis, I-Jumelage (8), Icann (2)…wsis-acsis, I-Jumelage (8), Icann (2)…

Listes modérées et non modéréesListes modérées et non modérées

Sorties web et sorties listesSorties web et sorties listes

Page 23: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

TRADAUTO: les défisTRADAUTO: les défis L’absence de programme de traduction L’absence de programme de traduction

sous Linux oblige à de dangereuses sous Linux oblige à de dangereuses acrobaties.acrobaties.

L’autre option est de faire un pont Linux-L’autre option est de faire un pont Linux-Windows.Windows.

Pour le moment travail sur le web.Pour le moment travail sur le web. Le services sur listes non modérées est un Le services sur listes non modérées est un

vrai problème.vrai problème. L’envie d’améliorer le service en utilisant L’envie d’améliorer le service en utilisant

de la valeur ajoutée en entrée.de la valeur ajoutée en entrée. Difficultés à monter un partenariat.Difficultés à monter un partenariat.

Page 24: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

TRADAUTO: référencesTRADAUTO: références

http://funredes.org/tradautohttp://funredes.org/tradauto http://wsis.funredes.org/plenary/http://wsis.funredes.org/plenary/

Page 25: 2ième IGF-10/2007 Atelier Coalition dynamique pour la diversité linguistique Daniel Pimienta

PERSPECTIVESPERSPECTIVES

Nous sommes des pionniers dans un sujet Nous sommes des pionniers dans un sujet qui va exploser quand les entreprises qui va exploser quand les entreprises pourront valoriser les espaces virtuels.pourront valoriser les espaces virtuels.

Le temps pour des applications de type Le temps pour des applications de type EMEC viendra.EMEC viendra.

Le temps pour TRADAUTO est déjà là…Le temps pour TRADAUTO est déjà là…