Se débarasser des caractères UTF-8 invalides

Les caractères UTF-8 invalides sont une source importante de désagrément : les RSS s'affichent mal, et les pirates en profitent pour passer de nombreux caractères indésirables au nez et à la barbe des regex. Pour s'en sortir, voici un truc avec iconv, qui supprime les caractères mal codés.

http://blog.bitflux.ch/archive/2005/01/24/how-to-get-rid-of-invalid-utf-8-characters.html

Vous pouvez essayez aussi Utrac :

http://utrac.sourceforge.net/index.html

Documentation en français :

http://utrac.sourceforge.net/other_doc/uu.html
______________________________________________________________________________

0 commentaires :

Enregistrer un commentaire