[MAJ 09/03/2017] En tant que PFE, je suis amené à écrire beaucoup de documentations à destination des clients. Il m’arrive même de devoir écrire des supports de formations. Souvent le cycle de vie de cette documentation s’étend sur plusieurs années et m’amène à procèder régulièrement à des mises à jour. Or toute bonne documentation renvoie forcément vers des liens connexes et rien n’est plus fastidieux que de devoir valider les liens un par un pour savoir s’ils sont toujours valides (Surtout quand le document/formation comprend plusieurs centaines de liens hypertextes). Pour cela j’ai développé le script suivant qui liste tous les liens hypertextes présent dans un ou plusieurs documents Word (Nom du document, Page, URI, Texte du lien) et indique de manière optionelle le statut HTTP du lien ainsi que le titre de la page en question. Le script est disponible ici.
Le résultat sera un fichier CSV similaire à celui-ci :
Ci-après la signification des colonnes :
- TextToDisplay : Le texte du lien tel qu’affiché dans le document
- StatusCode : Le statut de la réponse HTTP
- Page : La page où se trouve le lien dans le document
- Document : Le chemin complet du document Word
- Title : Le titre de la page HTTP (balise HTML <title></title>)