Decodificando desde ASCII, ISO 8859-1 o UTF-8

May 9th, 2008

A todo programador PHP le llega el momento de lidiar con la temible codificación de caracteres al crear una web. Cosas llamadas ISO 8859, UTF, Latin1, JIS. etc… pueden volverte loco si no se ha tenido en cuenta a la hora de crear las BBDD, incluir script de terceros, wordpress, google maps, etc…

Como ayuda hemos tratado de crear una pequeña función para ayudarte a despreocuparte de todo. Ella sólo detecta la codificación del texto pasado y obra en consecuencia, lo cual puede ser muy util si estamos trabajando con caracteres de los que desconocemos su codificación, o peor aún, ¡Tienen codificaciones mezcladas!

<?php
	
# Probamos 3 cadenas de texto con diferentes codificaciones
# la primera con caracteres ASCII (hasta el 128)
# la segunda ISO 8859-1 latin1 (con una eñe)
# y la tercera con el caracter copuright en formato utf8
#
	
//Array donde almacenaremos el resultado de la funcion:
$salida	=	array();
$salida[]	=	decode_for_web("2mdc");
$salida[]	=	decode_for_web("diseño");
$salida[]	=	decode_for_web("WEB ©");
	
//Pintamos la tabla:
echo '<table border="1">';
foreach($salida AS $valor){
	
	echo	'<tr><td>'.$valor[0].'</td>';
	echo	'<td>'.$valor[1].'</td></tr>';
	
}
echo '</table>';
	
# Funcion decodificadora desde ASCII, Latin1 o UTF-8
# Es muy importante conservar el orden del 2do parametro
# en mb_detect_encoding para su correcto funcionamiento.
#
	
function decode_for_web($texto){
	
	$tipo = mb_detect_encoding($texto, "ASCII,UTF-8,
		ISO-8859-1");
	
	switch($tipo){
	
		case "ASCII":
	
		break;
		case "UTF-8":
			$texto	=	utf8_decode($texto);
		break;
		case "ISO-8859-1":
	
		break;
		default:
	
		break;
	
	}
	
	//array con el texto decodificado y su tipo.
	return array($texto,$tipo);
	
}
	
?>

Como se puede ver utilizamos la nativa mb_detect_encoding() la cual es algo rara a la hora de configurar.
Se puede añadir código en las diferentes casos del switch o al final para por ejemplo convertir a entidades HTML antes retornar.

El resultado sería éste:

2mdc ASCII
diseño ISO-8859-1
WEB © UTF-8

Categorí­a: PHP - MySQL

Deja tu comentario

Requerido

Requerido, hidden



Tags HTML Permitidos:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>

Trackback this post  |  Subscribe to the comments via RSS Feed

  Sabías que...
 
Sabías que...

... ya somos más de 1000 millones de internautas.

Hace tan solo 3 años se estimaban en poco más de 600 millones el número de internautas, lo que supone una tasa de incremento anual del 18%.

¿Aún sigue pensando que su empresa puede vivir de espaldas a Internet?

 
 
2mdc.com diseño web     C/ Matias Turrión, 24, 1º, Madrid 28043      Tel: 91 759 00 24       Fax 91 759 15 18     Diseño web