get_html_translation_table

(PHP 4, PHP 5, PHP 7, PHP 8)

get_html_translation_tableReturns the translation table used by htmlspecialchars() and htmlentities()

Descrição

get_html_translation_table(int$table = HTML_SPECIALCHARS, int$flags = ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401, string$encoding = "UTF-8"): array

get_html_translation_table() will return the translation table that is used internally for htmlspecialchars() and htmlentities().

Nota:

Special characters can be encoded in several ways. E.g. " can be encoded as ", " or &#x22. get_html_translation_table() returns only the form used by htmlspecialchars() and htmlentities().

Parâmetros

table

Which table to return. Either HTML_ENTITIES or HTML_SPECIALCHARS.

flags

A bitmask of one or more of the following flags, which specify which quotes the table will contain as well as which document type the table is for. The default is ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401.

Available flags constants
Constant NameDescription
ENT_COMPATTable will contain entities for double-quotes, but not for single-quotes.
ENT_QUOTESTable will contain entities for both double and single quotes.
ENT_NOQUOTESTable will neither contain entities for single quotes nor for double quotes.
ENT_SUBSTITUTE Replace invalid code unit sequences with a Unicode Replacement Character U+FFFD (UTF-8) or � (otherwise) instead of returning an empty string.
ENT_HTML401Table for HTML 4.01.
ENT_XML1Table for XML 1.
ENT_XHTMLTable for XHTML.
ENT_HTML5Table for HTML 5.
encoding

Encoding to use. If omitted, the default value for this argument is UTF-8.

Os seguintes conjuntos de caracteres são suportados:

Conjuntos de caracteres suportados
Conjunto de caracteresApelidosDescrição
ISO-8859-1ISO8859-1 Western European, Latin-1.
ISO-8859-5ISO8859-5 Conjunto de caracteres cirílicos pouco usado (Latim/Cirílico).
ISO-8859-15ISO8859-15 Western European, Latin-9. Adiciona o símbolo do Euro, letras Francesas e Filandesas faltando no Latin-1 (ISO-8859-1).
UTF-8  Código de multi-byte 8-bit Unicode compatível com ASCII.
cp866ibm866, 866 Conjunto de caracteres do DOS específico para o Russo.
cp1251Windows-1251, win-1251, 1251 Conjunto de caracteres do Windows específico para o Russo.
cp1252Windows-1252, 1252 Conjunto de caracteres do Windows específico para a Europa Ocidental.
KOI8-Rkoi8-ru, koi8r Russo.
BIG5950 Chinês Tradicional, usado principalmente em Taiwan.
GB2312936 Chins Simplificado, conjunto de caracteres padrão nacional.
BIG5-HKSCS  Big5 com extenções de Hong Kong, Chinês Tradicional.
Shift_JISSJIS, SJIS-win, cp932, 932 Japonês
EUC-JPEUCJP, eucJP-win Japonês
MacRoman  Conjunto de caracteres que era usado pelo Mac OS.
''  Uma string vazia ativa a detecção a partir de codificação de script (multibyte Zend), conjunto padrão de caracteres e localidade atual (consulte nl_langinfo() e setlocale()), nesta ordem. Não recomendado.

Nota: Nenhum outro conjunto de caracteres é reconhecido. A codificação padrão será usada no lugar e um alerta será emitido.

Valor Retornado

Returns the translation table as an array, with the original characters as keys and entities as values.

Registro de Alterações

VersãoDescrição
8.1.0flags changed from ENT_COMPAT to ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401.

Exemplos

Exemplo #1 Translation Table Example

<?php
var_dump
(get_html_translation_table(HTML_ENTITIES, ENT_QUOTES | ENT_HTML5));
?>

O exemplo acima produzirá algo semelhante a:

array(1510) { [" "]=> string(9) "&NewLine;" ["!"]=> string(6) "&excl;" ["""]=> string(6) "&quot;" ["#"]=> string(5) "&num;" ["$"]=> string(8) "&dollar;" ["%"]=> string(8) "&percnt;" ["&"]=> string(5) "&amp;" ["'"]=> string(6) "&apos;"}

Veja Também

To Top