Software » caractères spéciaux
Catégorie:  
« Sujet précédent
Lien direct vers ce messageEditer Citer Ajouter ce message en quote multiple Supprimer Haut Bas
caractères spéciaux
Publié le 25/10/2007 @ 14:20:24, Par kortenberg
J'ai un fichier xml indiqué comme de l'utf-8 (BOM et encoding="utf-8") mais qui ne l'est pas vraiment.

J'ai les caractères "E7 9F 8D" qui ne sont pas compréhensible (la valeur désiré est "é M" ou "e9 20 4d" en latin1 ) .

gVim et wordpad arrive à les décoder mais notepad, ultraedit et moi n'arrivons à le faire.

Le problème c'est que de dois récuper ce genre de fichier plusieurs fois par jour et les inclure automatiquement dans une db.

Lachez les comz

Dernière édition: 25/10/2007 @ 14:22:24
zion
Haut  Bas
ProfilPrivéEmailSite InternetBlog
Lien direct vers ce messageEditer Citer Ajouter ce message en quote multiple Supprimer Haut Bas
caractères spéciaux
Publié le 25/10/2007 @ 14:24:10, Par zion
notepad ouvrira ton fichier en UTF-8 si il y a le header kivabien dans ton fichier texte.

Ouvre un fichier texte avec notepad, demande lui de le sauver explicitement en UTF-8, tu verras qu'il y a un byte en plus.

Parce que notepad supporte très bien l'utf-8 :figti:
Lien direct vers ce messageEditer Citer Ajouter ce message en quote multiple Supprimer Haut Bas
caractères spéciaux
Publié le 25/10/2007 @ 14:33:58, Par kortenberg
ce n'est justement pas de l'utf-8.
j'ai 3 caractères (E7 9F 8D) qui code 3 caractère (é M)


PS: un fichier texte n'a pas de headerQuiVaBien puisqu'il n'y a pas de header. Le seul header c'est 3 caractères au début mais qui ne sert que pour l'unicode(c'est ça le BOM Byte Order Mark)

Dernière édition: 25/10/2007 @ 14:44:14
zion
Haut  Bas
ProfilPrivéEmailSite InternetBlog
Lien direct vers ce messageEditer Citer Ajouter ce message en quote multiple Supprimer Haut Bas
caractères spéciaux
Publié le 25/10/2007 @ 14:42:33, Par zion
Ok donc ton XML est tout foireux il est mal encodé, youpie :oh:

Tu peux toujours passer par un logiciel kivabien pour changer l'encodage du fichier, il s'en fout lui que c'est du WinIso alors qu'il est écrit dans le XML que c'est de l'UTF-8 :grin:
Non? :grin:
Lien direct vers ce messageEditer Citer Ajouter ce message en quote multiple Supprimer Haut Bas
caractères spéciaux
Publié le 25/10/2007 @ 14:48:28, Par kortenberg
le problème c'est que je ne sais pas ce que c'est comme encodage. C'est pas de l'utf-8 et pas de l'iso 8859.
De plus, l'espace est encodé avec deux codes différents !? (20 "normal" et 9F "annormal")
zion
Haut  Bas
ProfilPrivéEmailSite InternetBlog
Lien direct vers ce messageEditer Citer Ajouter ce message en quote multiple Supprimer Haut Bas
caractères spéciaux
Publié le 25/10/2007 @ 14:51:08, Par zion
http://www.bogofilter.org/pipermail/bogofilter/2003-March/001889.html

U+0020 SPACE
UTF-8: 20 UTF-16BE: 0020 Decimal: & # 32;

Le seul espace qui contient un 9F est le :

U+205F MEDIUM MATHEMATICAL SPACE
UTF-8: e2 81 9f UTF-16BE: 205f Decimal: & # 8287;

:figti:
Lien direct vers ce messageEditer Citer Ajouter ce message en quote multiple Supprimer Haut Bas
caractères spéciaux
Publié le 25/10/2007 @ 14:58:06, Par kortenberg
c'est bien ce que je dis, c'est un encodage àLaCon.
Répondre - Catégorie:  
Répondre
Gras [b]Texte[/b]Italique [i]Italique[/i]Souligné [u]Souligné[/u]Barré [strike]Barré[/strike]
Courriel [email=nobody@nobody.org]Nom[/email]Lien [url=http://www.website.com]Texte[/url]Ancre [anchor]Nom[/anchor]Image [img]http://www.website.com/image.jpg[/img]Insérer une image en provenance du site
Aligné à gauche [align=left]Texte[/align]Centré [align=center]Texte[/align]Aligné à droite [align=right]Texte[/align]Toute la largeur [align=justify]Texte[/text]
Couleur [color=#000000]Text[/color]Mise en forme [highlight=pascal]Texte[/highlight]WidgetsEmoticons :code: [:code]
PrévisualisationVérification de l'orthographe

Se connecter
Inscription
Mot de passe perdu


Connexion:
Utilisateur
Mot de passe
 






Ada
CSS
Cobol
CPP
HTML
Fortran
Java
JavaScript
Pascal
Perl
PHP
Python
SQL
VB
XML
Anon URL
DailyMotion
eBay
Flickr
FLV
Google Video
Google Maps
Metacafe
MP3
SeeqPod
Veoh
Yahoo Video
YouTube
Informaticien.be (Version PDA) - © 2004-2008 Akretio Powered by Kelare Sponsored by Intico Designed by The Art Company
The Akretio Network: Akretio - Kelare - OpenEvent - KelCommunity - KelCommerce - KelBlogs - PhotOsez