Réparer un fichier doc corrompu : Différence entre versions

De Asso Val Libre
Aller à : navigation, rechercher
(Page créée avec « = Problème = Un fichier traitement de texte odt, doc, docx est en fait une archive ("zip") contenant un ensemble de fichiers xml. Il peut arriver que l'un de ces fichie... »)
 
Ligne 1 : Ligne 1 :
 
 
= Problème =
 
= Problème =
  
Ligne 6 : Ligne 5 :
 
L'erreur provient généralement de ce que la structure du format XML d'une partie du document n'est plus valide, ne correspond donc plus à ce que le logiciel est capable de traiter, comprendre.
 
L'erreur provient généralement de ce que la structure du format XML d'une partie du document n'est plus valide, ne correspond donc plus à ce que le logiciel est capable de traiter, comprendre.
  
L'ouverture échoue avec éventuellement un message d'erreur indiquant une localisation précise du problème (nom du fichier xml, numéro de ligne, numéro de colonne, descriptif du problème.
+
L'ouverture échoue avec éventuellement un message d'erreur indiquant une localisation précise du problème (nom du fichier xml, numéro de ligne, numéro de colonne, descriptif du problème).
 
 
  
 
= Solution =
 
= Solution =
Ligne 13 : Ligne 11 :
 
== Principe ==
 
== Principe ==
  
== Mise en œuvre ==
+
La méthode est générique :
 +
# ouvrir le document texte comme archive zip pour accéder aux différents répertoires et documents en XML
 +
# accéder au documents XML où se trouve l'erreur signalée
 +
# extraire le document pour le traiter en dehors de l'archive
 +
# corriger le problème XML décrit (!??)
 +
# ré-injecter le document XML corrigé dans son archive
 +
# sauvegarder l'archive et l'ouvrir avec le logiciel (libreoffice ou word)
 +
# et ça marche... (en théorie ;-)
 +
 
 +
== Pratique ==
  
  
 
{{Comment}}
 
{{Comment}}

Version du 27 août 2021 à 10:54

Problème

Un fichier traitement de texte odt, doc, docx est en fait une archive ("zip") contenant un ensemble de fichiers xml. Il peut arriver que l'un de ces fichier soit corrompu et le logiciel LibreOffice ou Word refuse alors d'ouvrir le document. L'erreur provient généralement de ce que la structure du format XML d'une partie du document n'est plus valide, ne correspond donc plus à ce que le logiciel est capable de traiter, comprendre.

L'ouverture échoue avec éventuellement un message d'erreur indiquant une localisation précise du problème (nom du fichier xml, numéro de ligne, numéro de colonne, descriptif du problème).

Solution

Principe

La méthode est générique :

  1. ouvrir le document texte comme archive zip pour accéder aux différents répertoires et documents en XML
  2. accéder au documents XML où se trouve l'erreur signalée
  3. extraire le document pour le traiter en dehors de l'archive
  4. corriger le problème XML décrit (!??)
  5. ré-injecter le document XML corrigé dans son archive
  6. sauvegarder l'archive et l'ouvrir avec le logiciel (libreoffice ou word)
  7. et ça marche... (en théorie ;-)

Pratique