Lister et tester les liens Hypertexte dans un document Word / List and test Hypertext links in a Word document

[MAJ 09/03/2017] En tant que PFE, je suis amené à écrire beaucoup de documentations à destination des clients. Il m’arrive même de devoir écrire des supports de formations. Souvent le cycle de vie de cette documentation s’étend sur plusieurs années et m’amène à procèder régulièrement à des mises à jour. Or toute bonne documentation renvoie forcément vers des liens connexes et rien n’est plus fastidieux que de devoir valider les liens un par un pour savoir s’ils sont toujours valides (Surtout quand le document/formation comprend plusieurs centaines de liens hypertextes). Pour cela j’ai développé le script suivant qui liste tous les liens hypertextes présent dans un ou plusieurs documents Word (Nom du document, Page, URI, Texte du lien) et indique de manière optionelle le statut HTTP du lien ainsi que le titre de la page en question. Le script est disponible ici.

 

Le résultat sera un fichier CSV similaire à celui-ci :

Get-WordHyperLinks

Ci-après la signification des colonnes :

  • TextToDisplay : Le texte du lien tel qu’affiché dans le document
  • StatusCode : Le statut de la réponse HTTP
  • Page : La page où se trouve le lien dans le document
  • Document : Le chemin complet du document Word
  • Title : Le titre de la page HTTP (balise HTML <title></title>)

 


 
[Updated 03/09/2017] As PFE, I have to write a lot of documentation from customers. I even have to write training materials. Often the life cycle of this material extends over several years and brings me to proceed to regular updates. But good documentation necessarily refers to related links and nothing is more tedious than having to validate the links one by one to see if they are still valid (Especially when the document / training includes hundreds of hyperlinks). For this I developed the following script that lists all hyperlinks present in one or more Word documents (Document name, Page, URI, text link) and so indicates optional HTTP status and the page title of the URI. The script is available here.

 

The result will be a CSV file similar to this one:

Get-WordHyperLinks

Below the meaning of the columns:

  • TextToDisplay: The link text as displayed in the document
  • StatusCode: The status of the HTTP response
  • Page: The page where the link in the document was found
  • Document: Full file path of the Word document
  • Title: The title of the HTTP page (HTML <title></title>)

Laurent.

Feel free to share:)