Formats d’importation
Introduction
Ce document présente la structure des fichiers d’exportation et d’importation du dictionnaire personnel d’Antidote.
Structure du fichier d’exportation et d’importation
- format texte
- chaque ligne doit contenir 1, 2 ou 8 jetons séparés par des tabulations
- les lignes débutant par « // » sont ignorées sauf exception (voir les sections Langue des mots et Encodage)
- les lignes vides sont ignorées.
Langue des mots
- Pour spécifier la langue des mots à importer, on utilise un des trois identificateurs suivants :
- FR : français
- EN : anglais
- ML : multilingue (anglais et français)
-
On peut utiliser ces identificateurs à deux endroits :
-
De façon globale en indiquant entre parenthèses l’identificateur au début du fichier dans le commentaire suivant :
Nom : NOM_DU_DICO (IDENTIFICATEUR_LANGUE)
-
Pour chaque mot en indiquant comme premier attribut l’identificateur de langue (voir la section Importation à 8 jetons plus bas)
-
Si la langue n’est pas spécifiée selon les méthodes précédentes :
- Avec un Antidote multilingue, une erreur d’importation surviendra.
- Avec un Antidote monolingue, la langue par défaut sera la langue de votre Antidote.
-
Encodage
Antidote tente de deviner l’encodage du fichier d’importation selon le contenu et la plateforme de votre système. Il est aussi possible d’indiquer à Antidote l’encodage sans qu’il ait à le deviner. Avec le commentaire spécial encodage:
en début de fichier suivi de l’identificateur de l’encodage.
Les identificateurs pour l’encodage sont les suivants :
mac_roman
iso8859_15
cp1252
utf_8
utf_16_le
utf_16_be
Exemple :
// encodage: utf_8
Importation à un jeton
Si une ligne contient un seul jeton alors le jeton est considéré comme une forme canonique et Antidote infère la catégorie du mot, et (si la catégorie le requiert) la morphologie du mot ou le modèle du verbe. Dans un Antidote multilingue, la langue des mots doit être spécifiée globalement au haut du fichier avec un commentaire spécial (voir la section Langue des mots).
FORME_CANONIQUE __FIN_DE_LIGNE__
Importation à deux jetons
Si une ligne contient deux jetons alors le premier jeton est considéré comme une forme canonique, le deuxième jeton est considéré comme la catégorie. Antidote infère la morphologie du mot ou le modèle du verbe si la catégorie le requiert.
Dans un Antidote multilingue, la langue des mots doit être spécifiée globalement au haut du fichier avec un commentaire spécial (voir la section Langue des mots)
FORME_CANONIQUE __TAB__ CATÉGORIE __FIN_DE_LIGNE__
Importation à 8 jetons
Si une ligne contient huit jetons, les jetons sont considérés dans l’ordre comme suit :
- Forme canonique
- Catégorie
- Champ de flexion 1
- Champ de flexion 2
- Champ de flexion 3
- Champ de flexion 4
- Attributs séparés par des +
-
Définition
- pour introduire une nouvelle définition, insérer le caractère « ◊ »
- pour introduire un nouveau paragraphe, insérer les caractères « \r »
-
pour un mot multilingue, on peut spécifier une définition pour chaque langue. Les définitions sont spécifiées dans le même champ. La définition française doit être précédée du mot-clé
|FR|
et la définition anglaise, du mot-clé|EN|
.Exemple :
|FR|Définition de « ABCDEFG »|EN|Definition of “ABCDEFG”
Catégories acceptées
Mots français
Acronyme
(sigle ou acronyme)Adj
(adjectif)Adv
(adverbe)Interj
(interjection)LocutionLatine
(locution latine)Nom
(nom commun)NP
(nom propre)Verbe
(verbe)Pref
(préfixe)
Mots anglais
Acronym
(sigle ou acronyme)Adj
(adjectif)Adv
(adverbe)Interj
(interjection)Noun
(nom commun)PN
(nom propre)Verb
(verbe)
Mots multilingues
Acronyme
(sigle ou acronyme)Acronym
(sigle ou acronyme)NP
(nom propre)PN
(nom propre)
Champs de flexion
Mots français
- Acronyme, adjectif, locution latine adjectivale, nom, nom propre
- Champ de flexion 1 : Masculin singulier
- Champ de flexion 2 : Masculin pluriel
- Champ de flexion 3 : Féminin singulier
- Champ de flexion 4 : Féminin pluriel
- Verbe
- Champ de flexion 1 : Modèle du verbe
- Champ de flexion 2 : À laisser vide
- Champ de flexion 3 : À laisser vide
- Champ de flexion 4 : À laisser vide
- Adverbe, locution latine adverbiale, interjection, préfixe
- Champ de flexion 1 : À laisser vide
- Champ de flexion 2 : À laisser vide
- Champ de flexion 3 : À laisser vide
- Champ de flexion 4 : À laisser vide
Mots anglais
- Nom, acronyme
- Champ de flexion 1 : Singulier
- Champ de flexion 2 : Pluriel
- Champ de flexion 3 : À laisser vide
- Champ de flexion 4 : À laisser vide
- Adjectif
- Champ de flexion 1 : Singulier
- Champ de flexion 2 : Comparatif
- Champ de flexion 3 : Superlatif
- Champ de flexion 4 : À laisser vide
- Verbe
- Champ de flexion 1 : 3e personne
- Champ de flexion 2 : Passé
- Champ de flexion 3 : Participe passé
- Champ de flexion 4 : Participe présent
- Adverbe, interjection, nom propre
- Champ de flexion 1 : À laisser vide
- Champ de flexion 2 : À laisser vide
- Champ de flexion 3 : À laisser vide
- Champ de flexion 4 : À laisser vide
Mots multilingues
- Acronyme, nom propre
- Champ de flexion 1 : Masculin singulier
- Champ de flexion 2 : Masculin pluriel
- Champ de flexion 3 : Féminin singulier
- Champ de flexion 4 : Féminin pluriel
Attributs acceptés pour chaque catégorie
Mots français
- Nom
Chose
Entite
Diplome
Personne
Fonction
Animal
- Adjectif
Habitant
Langue
- Interjection
Sensation
Message
Bruit
- Adverbe
Maniere
Temps
Lieu
- Locution latine
Adjectif
Adverbe
- Nom propre
Famille
Prenom
Compagnie
Marque
Lieu
VoieDeCirculation
Ville
Ile
Region
CoursDeau
CorpsCeleste
Habitant
Langue
TitreOeuvre
Autre
- Acronyme
Compagnie
Chose
NonComptable
Diplome
Personne
FonctionSociale
- Verbe
- Aucun attribut n’est accepté
- Modèles acceptés
Aimer
Finir
Courir
Rendre
- Préfixe
FacultTDU
BesoinTDU
ErreurTDU
FacultTDUReforme
BesoinTDUReforme
ErreurTDUReforme
Mots anglais
- Nom
Thing
Entity
Diploma
Person
Profession
Animal
Group
- Adjectif
Demonym
Language
- Interjection
Emotional
Message
Sound
- Adverbe
Manner
Time
Place
- Nom propre
LastName
FirstName
Company
Brand
Place
Street
Town
Island
Region
CourseOfWater
CelestialBody
Demonym
Language
TitleOfAWork
Other
- Acronyme
Company
Thing
Uncountable
Diploma
Person
Profession
- Verbe
- Aucun attribut n’est accepté
Mots multilingues
- Nom propre
Famille
,LastName
Prenom
,FirstName
Compagnie
,Company
Marque
,Brand
Lieu
,Place
VoieDeCirculation
,Street
Ville
,Town
Ile
,Island
Region
,Region
CorpsCeleste
,CelestialBody
Habitant
,Demonym
Langue
,Language
TitreOeuvre
,TitleOfAWork
Autre
,Other
- Acronyme
Compagnie
,Company
Chose
,Thing
NonComptable
,Uncountable
Diplome
,Diploma
Personne
,Person
FonctionSociale
,Profession