Script pour changer encodage de fichiers iso-8859-1 vers utf-8
Par alex206, lundi 11 août 2008 à 16:36 :: Informatique :: #24 :: rss
Un script bash de 8 lignes pour convertir des fichiers de type texte étant encodé par exemple en latin1 (iso-8859-1) en utf-8. Le classique usage de ce type de script c'est bien entendu les pages web en html que pour différentes raisons on est amené à changer le charset.
Le script fait appel à l'utilitaire iconv pour la conversion ainsi qu'a sed pour remplacer la définition du charset à l'intérieur de la page dans la mesure ou il en serait fait mention à l'intérieur de cette dernière. Pour exécuter le script, je vous conseille fortement de regrouper les fichiers à convertir dans un dossier spécifique, dossier dans lequel vous aurez pris soin de mettre le script, et avant de lancer la commande ./le_script, placez vous en console dans le fameux dossier : cd le_dossier.
#!/bin/bash mkdir news for i in $(ls) do if test -f $i then iconv -f iso-8859-1 -t utf-8 $i -o news/$i sed -i 's/iso-8859-1/utf-8/g' news/$i fi donevous trouverez les fichiers convertis dans le sous répertoire news du dossier courant
Commentaires
1. Le dimanche 19 octobre 2008 à 10:26, par Fred
2. Le jeudi 18 décembre 2008 à 15:35, par lucile
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.