Guide d'importation des dictionnaires

English | Français | Русский

Cliquer ici pour aller à l'index de la documentation

Introduction

Ce document contient un guide d'utilisation du Wunderkammer Import Package 2 servant à convertir les dictionnaires électroniques pour leur affichage sur les téléphones mobiles à l'aide de Wunderkammer. Il y a trois étapes à suivre:

  1. S'assurer que le dictionnaire original est dans un format convenable
  2. Configurer les paramètres de conversion du dictionnaire par wkimport
  3. Transférer et installer le dictionnaire sur les téléphones mobiles

Il y a encore deux étapes optionnelles pour adapter le dictionnaire à vos besoins:

  1. Créer un thème sur mesure
  2. Créer une police spéciale (pour des utilisateurs plus expérimentés)

Notez que pour utiliser le Wunderkammer Import Package vous aurez besoin de Java. Si ce dernier n'est pas encore installé sur votre ordinateur, vous pouvez télécharger gratuitement ici des versions pour la plupart des plateformes.

Des problèmes typiques qui pourraient vous arriver pendant l'importation des dictionnaires sont répertoriés dans la section Dépannage. Si vous rencontrez un problème qui n'y est pas encore répertorié, contactez James à l'adresse james suivi d'arobase pfed point info

Format du dictionnaire source

Le Wunderkammer Import Package peut lire et convertir les dictionnaires enregistrés sous le format antislash utilisé par Shoebox/Toolbox et sous le format XML utilisé par Kirrkirr. Bien qu'il soit possible de créer un dictionnaire pour téléphones mobiles directement à partir d'un dictionnaire électronique existant, quand on importe un dictionnaire il est préférable de tenir compte de certains traits de fonctionnement de Wunderkammer pour profiter au mieux des capacités de ce logiciel.

Wunderkammer ne gère pas vraiment les sens multiples à l'intérieur d'un même article. En pratique, il est possible de suggérer un sous-groupe de sens par sens à l'intérieur d'un article par l'ordre de ces champs (à condition que wkimport soit configuré pour utiliser dans le dictionnaire de sortie le même ordre des champs que dans le dictionnaire source - cf. Onglet Correspondances infra). Cependant, ces apparents groupements de champs à l'intérieur d'un article ne sont pas reconnus comme tels par Wunderkammer, ce qui implique, par exemple, qu'on ne peut pas en faire des cibles de recherche ou des destinations des liens. En plus, de longs articles aux sens multiples peuvent être difficiles à lire sur de petits écrans des téléphones mobiles parce que pour lire un article entièrement, l'utilisateur sera obligé de défiler longuement vers le bas de l'écran. La meilleure stratégie pour formater les dictionnaires qui contiennent des articles aux sens multiples est probablement de diviser les sens entre plusieurs articles homonymes indépendants, ou bien, dans la mesure où le sémantisme le permet, de regrouper des sens différents dans un seul sens.

En convertissant le dictionnaire, le Wunderkammer Import Package rend automatiquement uniques les articles du dictionnaire source. Si le dictionnaire source contient des articles homographes, c'est-à-dire qu'il y a des articles aux entrées homographes, un numéro sera ajouté à la fin de chaque entrée pour les distinguer. La numérotation commence à 1 pour chaque groupe d'entrées identiques. Par exemple, dans un dictionnaire contenant deux articles, dont chaque a turla comme entrée, les deux entrées seront respectivement renommées turla 1 et turla 2.

Un lien vers un lemme rendu unique au cours de la conversion sera rompu. Une liste des entrées rendues uniques au cours de la conversion et des liens rompus sera créée au moment de la conversion et sera affichée dans l'onglet Console.

Quand le logiciel renomme une entrée afin de la rendre unique, il ne vérifie pas s'il existe déjà une autre entrée avec ce nouveau nom. Afin d'éviter que de nouvelles entrées homographes apparaissent à cause de cela, il est souhaitable d'éviter de faire des entrées dans le même format que celui utilisé par le logiciel pour distinguer les entrées homographes.

Configuration du dictionnaire

La conversion est effectuée par une application Java wkimport.jar. Sur la grande majorité des plates-formes où Java est déjà installé, il suffit normalement de double-cliquer sur wkimport.jar pour lancer le logiciel.

Quand wkimport est démarré pour la première fois, il identifie automatiquement la langue du système d'exploitation et essaye d'afficher l'interface utilisateur dans cette langue. Si wkimport ne connaît pas la langue du système, il s'affiche par défaut en anglais. La langue de l'interface de wkimport peut être changée dans le menu Préférences > Langue.

Afin de pouvoir convertir un dictionnaire, wkimport a besoin de savoir où le dictionnaire source se trouve et comment le contenu de ce dernier doit être affiché par Wunderkammer. Cette section contient un guide sur les paramètres qui doivent être fixés dans les trois onglets de l'interface utilisateur de wkimport:

Les paramètres de configuration saisis dans wkimport peuvent être sauvegardés et de nouveau chargés à l'aide des commandes Enregistrer la configuration et Ouvrir une configuration dans le menu Fichier. Le Wunderkammer Import Package contient les fichiers des versions démo de deux dictionnaires qui illustrent deux configurations existantes. Le dictionnaire démo du kaurna est un dictionnaire XML. Son fichier de configuration se trouve à ./demodics/kaurnademo/kaurnaconfig.cfg. Le dictionnaire démo du toura est un dictionnaire Shoebox/Toolbox. Son fichier de configuration se trouve à ./demodics/tourademo/touraconfig.cfg.

Tous les paramètres étant fixés, le dictionnaire peut être converti au format Wunderkammer à l'aide de la commande Créer le dictionnaire dans le menu Exécuter. Dès l'appel de cette commande, vous serez automatiquement transféré vers l'onglet Console où toutes les informations sur le déroulement de la conversion ainsi que les messages d'erreurs seront affichés. Les fichiers jar et jad du dictionnaire de sortie seront placés dans le répertoire de sortie que vous avez indiqué dans l'onglet Entrée/Sortie.

Onglet Entrée/Sortie

L'onglet Entrée/Sortie rassemble les informations sur les fichiers du dictionnaire source et du dictionnaire de sortie. Ces informations sont saisies dans des champs textes. Les champs textes qui exigent l'indication du chemin d'accès à un fichier ou un répertoire sont pourvus à leur droite d'un bouton pour ouvrir une boîte de dialogue de sélection de fichier. Le chemin d'accès sélectionné est automatiquement saisi dans le champ texte respectif.

Input/Output tab Figure 1. L'onglet Entrée/Sortie.

Les données à saisir dans les champs textes sont:

Onglet Correspondances

Dans l'onglet Correspondances, des correspondances peuvent être établies entre les champs du dictionnaire source et les champs du dictionnaire de sortie de sorte que wkimport sache que, par exemple, un champ lx du dictionnaire source doit être affiché comme un champ entrée dans le dictionnaire de sortie.

Lors du premier démarrage de wkimport, la liste Champs d'entrée sera vide. Pour un dictionnaire source dans le format Shoebox/Toolbox, vous pouvez alimenter la liste automatiquement à partir du dictionnaire source en cliquant sur le bouton Alimenter la liste juste au-dessous de la liste Champs d'entrée, comme illustré dans la Figure 2 ci-dessous.

Figure 2. L'onglet Correspondances avec un dictionnaire de source dans le format Shoebox/Toolbox.

Par contre, pour un dictionnaire source dans le format XML, vous devez saisir les chemins de localisation XPath des champs d'entrée manuellement en cliquant d'abord sur le bouton Ajouter un XPath et en saisissant ensuite le XPath dans la boîte de dialogue qui apparaît. Notez que les XPaths doivent être des éléments XMLS et pas des attributs. Ceci est illustré dans la Figure 3 ci-dessous.

Figure 3. L'onglet Correspondances avec un dictionnaire de source dans le format XML.

Pour les deux formats des dictionnaires, Shoebox/Toolbox et XML, vous pouvez toujours supprimer dans la liste Champs d'entrée le champ d'entrée affiché dont vous n'avez pas besoin en le sélectionnant et en cliquant ensuite sur le bouton Supprimer la sélection juste au-dessous de la liste.

Afin d'établir une correspondance, sélectionnez un champ de la liste Champs d'entrée à gauche, puis le champ Wunderkammer qui lui correspond de la liste Champs de sortie à droite et cliquez ensuite sur le bouton Établir une correspondance. La nouvelle correspondance s'affichera alors dans la liste Correspondances en bas. Vous pouvez aussi établir des correspondances multiples entre un seul Champ d'entrée et plusieurs Champs de sortie ou entre plusieurs Champs d'entrée et un seul Champ de sortie. Vous pouvez toujours supprimer la correspondance dont vous n'avez pas besoin en la sélectionnant et en cliquant ensuite sur le bouton Supprimer la sélection juste au-dessus et à droite de la liste Correspondances.

Par convention, chaque champ des Champs de sortie est associé à un certain type de données qu'on trouve d'habitude dans les dictionnaires. Ces associations sont expliquées dans la liste ci-dessous.

Notez que bien que la majorité des champs soient associés à certains types de données, pour Wunderkammer les données dans les champs champ sémantique, catégorie grammaticale, définition, ri, rii et riii ne sont que du texte brut. Ceci implique que ces champs peuvent contenir n'importe quel type de données, la seule condition étant que ce soient des données textes. Comment tous ces champs ainsi que le champ lien doivent être affichés est défini dans le fichier thème. Pour plus d'informations sur la création des fichiers thèmes sur mesure reportez-vous à Thème sur mesure infra. Tous ces champs peuvent être répétés dans le même article.

Les données de tous les autres champs sont traitées par Wunderkammer d'une manière particulière. Par conséquent, en configurant un dictionnaire, il faut tenir compte des restrictions imposées par Wunderkammer sur les types de données que ces champs peuvent contenir. Le champ entrée doit contenir l'entrée de l'article. Les champs son et image doivent contenir les noms des fichiers sons et images à utiliser dans l'article. Le champ lien doit avoir la valeur du champ entrée de l'article auquel il renvoie. Tout article ne peut contenir qu'un seul champ entrée et un seul champ son. On peut utiliser plusieurs champs image et lien dans le même article.

La case à cocher Afficher dans les articles au-dessous du bouton Établir une correspondance sert à indiquer si une certaine correspondance doit être affichée dans les articles du dictionnaire de sortie. Parfois, certains champs ne sont utilisés dans le dictionnaire source que pour servir à la création des index et de tels champs ne doivent pas être affichés dans le dictionnaire de sortie. Ainsi, un dictionnaire source peut avoir un champ d'index inversé ayant des valeurs identiques à celles d'un champ de définition ou en être simplement des modifications. Par exemple, la définition 'le français' peut être transformée dans le champ d'index inversé en 'français, langue', tandis que 'maison' peut rester sans modification comme 'maison'. Quand la case Afficher dans les articles est cochée et une correspondance est établie, le champ de sortie sera affiché dans les articles du dictionnaire de sortie. Quand la case Afficher dans les articles n'est pas cochée, le champ ne sera pas affiché dans les articles du dictionnaire de sortie. Dans la liste Correspondances, les champs qui seront affichés dans les articles sont marqués comme true et les champs qui ne seront pas affichés sont marqués comme false. Ainsi, dans les Figures 2 et 3 ci-dessus, le champ ri est marqué comme false parce qu'il ne sert dans ces dictionnaires que pour la création d'un index inversé et alors ne doit pas être affiché dans les articles.

La case à cocher Garder l'ordre des champs du dictionnaire source, juste au-dessus de la liste Correspondances, sert à indiquer si l'ordre dans lequel les champs sont affichés dans le dictionnaire de sortie doit être identique à l'ordre des champs dans le dictionnaire source ou s'il suit l'ordre des correspondances dans la liste Correspondances. Quand cette case n'est pas cochée, l'ordre des champs dans les articles du dictionnaire de sortie sera exactement le même que celui dans la liste Correspondances (sauf pour les champs entrée, qui ne font pas partie du corps des articles). On peut modifier l'ordre des champs dans la liste Correspondances à l'aide des flèches pointant vers le haut et vers le bas à gauche de la case à cocher Garder l'ordre des champs du dictionnaire source. Quand la case est cochée, l'ordre dans lequel les champs sont affichés dans le dictionnaire de sortie sera identique à l'ordre des champs dans le dictionnaire source. Dans ce cas, si l'ordre des champs dans le dictionnaire source varie d'un article à l'autre, cette variation sera aussi maintenue dans le dictionnaire de sortie. La case à cocher Garder l'ordre des champs du dictionnaire source reste inactive pour les dictionnaires XML.

L'onglet Menus permet de spécifier les menus du dictionnaire de sortie. Le système de menus de Wunderkammer a une structure arborescente. Le premier menu qui est chargé est toujours le menu racine. Ce menu racine peut comprendre un nombre illimité de sous-menus dont le nombre de niveaux est aussi illimité. Chaque sous-menu affiche une liste des données contenues dans le champ auquel ce sous-menu est associé. Par exemple, un sous-menu associé avec le champ entrée affichera une liste de toutes les entrées du dictionnaire. Un sous-menu enfant inclus dans un autre sous-menu parent n'affiche que les champs des articles qui sont délimités par l'élément sélectionné dans le sous-menu parent. Par exemple, dans le cas où il y a un menu de champs sémantiques comprenant un menu d'entrées, quand l'utilisateur sélectionne un champ sémantique dans le menu de champs sémantiques seules les entrées des articles qui sont compris dans le champ sémantique sélectionné seront affichées dans le sous-menu d'entrées. Quand l'utilisateur arrive au niveau le plus bas du système de menus, il se trouve dans l'article qui correspond au dernier élément de menu sélectionné.

Figure 3. Onglet Menus.

On peut ajouter un sous-menu à l'arborescence en sélectionnant le menu qui doit être son parent et en cliquant sur le bouton Ajouter un enfant. Le nom du menu qui sera presenté à l'utilisateur par Wunderkammer est saisi dans le champ texte Nom du menu, le champ d'article auquel ce menu est lié est sélectionné dans la boîte de sélection Champ et l'ordre de tri utilisé dans le menu est spécifié dans le champ texte Ordre de tri. La syntaxe des ordres de tri est conforme aux règles du RuleBasedCollator de Java. Pour confirmer les changements des propriétés des menus effectués, cliquez sur le bouton Actualiser le nœud. Vous pouvez toujours supprimer les menus dont vous n'avez pas besoin en sélectionnant le menu à supprimer et en cliquant sur le bouton Supprimer la sélection.

Le bouton Police spéciale sert à charger une police spéciale, déjà installée sur votre ordinateur, pour afficher l'arborescence de menus, les noms des menus et les ordres de tri. Des polices spéciales peuvent s'avérer nécessaires pour les langues dont les orthographes comprennent des symboles qui sont absents des localisations préinstallées par le fabricant sur le téléphone mobile de l'utilisateur (voir Police spéciale pour plus d'informations).

Installation du dictionnaire

Afin d'exécuter un dictionnaire Wunderkammer, on doit d'abord transférer sur un téléphone mobile les fichiers jar et jad produits pour le dictionnaire par wkimport. Selon les fonctionnalités disponibles sur le téléphone mobile et l'ordinateur, on peut transférer ces fichiers d'un ordinateur par une connexion Bluetooth, une connexion USB ou à l'aide d'une carte mémoire amovible.

Si le téléphone a accès à Internet, on peut télécharger le dictionnaire directement depuis Internet sur le téléphone. Ainsi, on peut télécharger le MIDlet de la version démo du dictionnaire kaurna à l'aide du navigateur Internet du téléphone à l'adresse http://www.pfed.info/wunderkammer.jad. Il convient de remarquer que les tarifs pour le transfert de données par les réseaux de téléphonie mobile peuvent être très élevés, tandis que le transfert direct d'un ordinateur sur un téléphone mobile selon l'une des méthodes mentionnées plus haut ne coûte rien.

Une fois que les fichiers sont transférés sur le téléphone mobile, leur installation (si elle s'avère nécessaire) et leur exécution ne doivent normalement pas poser de problèmes particuliers. Il y a trop de diversité entre les modèles de téléphones mobiles pour qu'on puisse donner des instructions détaillées ici. Les informations sur l'installation de logiciels sur un modèle de téléphone mobile spécifique peuvent probablement être trouvées dans le guide d'utilisation du téléphone ou à l'internet.

Wunderkammer étant un logiciel Java ME, on ne peut pas l'exécuter sous Java SE, qui est l'environnement Java standard sur les ordinateurs. Afin de pouvoir exécuter un dictionnaire Wunderkammer sur votre ordinateur, vous aurez besoin d'un émulateur. Parmi les divers émulateurs de Java ME disponible en ligne gratuitement, l'émulateur le plus fiable est probablement celui qui est inclus dans le Sun Java Wireless Toolkit et qui vous pouvez télécharger ici.

Thème sur mesure

Il est possible de changer l'apparence et les paramètres de localisation de Wunderkammer en modifiant le fichier thème (le "fichier ressource" avec l'extension .res) et en utilisant ce fichier modifié pour l'importation du dictionnaire en Wunderkammer. Les fichiers de thème standards se trouvent dans le répertoire ./standardfiles/themes. On peut modifier ces fichiers à l'aide de l'application ResourceEditor, qui est incluse dans la bibliothèque de fichiers LWUIT. Une fois la bibliothèque téléchargée sur votre ordinateur et extraite de son archive, vous trouverez ResourceEditor à l'adresse LWUIT/util/ResourceEditor.jar. ResourceEditor est accompagnée de la documentation nécessaire.

Afin de changer l'apparence générale de Wunderkammer, il est nécessaire de modifier le thème, les images et les animations utilisés dans le fichier thème. Afin de changer les paramètres de localisation ou le texte supplémentaire ajouté aux champs dans les articles, il est nécessaire de modifier les paramètres de localisation.

Police spéciale

Des polices spéciales peuvent s'avérer nécessaires pour les langues dont les orthographes comprennent des symboles qui sont absents des localisations préinstallées sur le téléphone mobile de l'utilisateur par le fabricant. Toute police spéciale doit être incluse dans le fichier thème de Wunderkammer. De nos jours, pour la grande majorité des téléphones mobiles, l'affichage de l'écriture latine, y compris la majorité de ses variantes utilisées pour les langues européennes, ainsi que l'écriture cyrillique ne devrait normalement pas poser de problèmes. Néanmoins, si le fabricant n'a pas préinstallé sur le téléphone mobile la localisation nécessaire, l'utilisateur ne pourra pas saisir de texte avec des caractères de cette localisation absente. Par exemple, puisque normalement un téléphone mobile acheté en dehors des pays de l'ancienne Union soviétique n'est pas fourni avec la localisation russe, l'utilisateur ne pourra pas saisir de texte en cyrillique dans le champ de recherche d'un dictionnaire où le russe est la langue d'entrée ou de sortie, même si les données en cyrillique du dictionnaire s'affichent correctement. Un grand nombre de caractères phonétiques de l'API ne font pas partie des localisations préinstallées par les fabricants des téléphones mobiles et ne s'afficheront même pas. Pour que l'utilisateur puisse faire la saisie des caractères inclus dans une police spéciale, le dictionnaire de sortie doit aussi inclure une méthode de saisie correspondante, qui devra être ajoutée au code du logiciel. Dmitry Idiatov a fourni des instructions détaillées sur la création de polices spéciales, leur intégration dans le fichier thème et la création de méthodes de saisie appropriées sur le blog PFED. Les notes en question se trouvent à 1, 2, 3 et 4.

Dépannage

wkimport a du mal à lire le fichier de dictionnaire d'entrée. L'indice typique de ce genre de problème est le message d'erreur tel que java.lang.IndexOutOfBoundsException: Index: 0, Size: 0.

Le dictionnaire d'entrée doit être enregistré avec le codage UTF-8 no BOM (UTF-8 sans Byte-Order Mark, c'est-à-dire sans "indication d'ordre des octets"). Beaucoup de logiciels Windows (dont Windows Notepad) ajoutent toujours un BOM aux fichiers UTF-8. Pour s'assurer que le BOM n'est pas ajouté, il faut ouvrir le dictionnaire dans un éditeur de texte avancé et l'enregistrer de nouveau avec le codage correct. Parmi les éditeurs de texte gratuits qui offrent cette fonctionnalité, on peut mentionner TextWrangler (pour Mac OS X) et Notepad++ (pour Windows). Les utilisateurs du Linux doivent, en principe, déjà avoir un éditeur de texte de leur choix avec cette fonctionnalité.

Dans le menu de champs sémantiques (ou tout autre menu où les articles sont répartis en groupes) du dictionnaire de sortie, le même champ sémantique se rencontre plusieurs fois, par exemple Animaux domestiques et Animaux domestiques .

Assurez-vous que dans les articles qui doivent appartenir au même champ sémantique, le texte dans les champs contenant l'information sur le champ sémantique est en effet absolument identique. wkimport est sensible à la casse, ainsi qu'aux espaces au début et en fin de la ligne dans tous les champs d'entrée (comme dans l'exemple ci-dessus). Pour enlever ces espaces, choissez Enlever les espaces superflus dans les champs d'entrée de l'onglet Entrée/Sortie.

Version 2.1 de Guide to importing dictionaries, le 15 août 2010 (traduction française par Dmitry Idiatov). Projet Wunderkammer.