string utf8_encode(string data);
Cette fonction code la chaîne data au format UTF-8, et retourne la version codée. UTF-8 est un mécanisme standardisé utilisé par Unicode pour coder les caractère de grande taille dans des flots d'octets. UTF-8 est transparent pour les caractères ASCII, il est auto-synchronisé (c'est à dire qu'un programme peut toujours savoir dans un flot d'octet où un caractère commence), et peut être utilisé pour faire des comparaisons de chaînes standard, comme pour le tri.. PHP utilise l' UTF-8 pour coder les caractères jusqu'à 4 octets comme ceci :
Table 1. UTF-8
ocets |
bits |
représentation |
1 |
7 |
0bbbbbbb |
2 |
11 |
110bbbbb 10bbbbbb |
3 |
16 |
1110bbbb 10bbbbbb 10bbbbbb |
4 |
21 |
11110bbb 10bbbbbb 10bbbbbb 10bbbbbb |