get_html_translation_table

(PHP 4, PHP 5, PHP 7, PHP 8)

get_html_translation_table Liefert die Umwandlungstabelle, die von htmlspecialchars() und htmlentities() verwendet wird

Beschreibung

get_html_translation_table(int$table = HTML_SPECIALCHARS, int$flags = ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401, string$encoding = "UTF-8"): array

get_html_translation_table() gibt die Umwandlungs-Tabelle zurück, die intern in den Funktionen htmlspecialchars() und htmlentities() verwendet wird.

Hinweis:

Sonderzeichen können auf unterschiedliche Weise kodiert werden. " kann kodiert werden als ", " oder &#x22. get_html_translation_table() gibt nur die von htmlspecialchars() und htmlentities() genutzte Form zurück.

Parameter-Liste

table

Die Tabelle, die zurückgegeben werden soll. Entweder HTML_ENTITIES oder HTML_SPECIALCHARS.

flags

Eine Bitmaske von einem oder mehreren der folgenden Flags, die festlegen, welche Anführungszeichen die Tabelle enthalten wird, sowie für welchen Dokumenttyp sie ist. Der Standardwert ist ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401.

Verfügbare flags-Konstanten
Name der KonstanteBeschreibung
ENT_COMPAT Die Tabelle soll Entities für doppelte Anführungszeichen enthalten, aber nicht für einfache.
ENT_QUOTES Die Tabelle soll Entities sowohl für einfache als auch doppelte Anführungszeichen enthalten.
ENT_NOQUOTES Die Tabelle soll weder Entities für einfache noch für doppelte Anführungszeichen enthalten.
ENT_SUBSTITUTE Ersetzt ungültige Code-Unit-Sequenzen mit dem Unicode-Ersatzzeichen U+FFFD (UTF-8) oder � (andernfalls), anstatt eine leere Zeichenkette zurückzugeben.
ENT_HTML401Die Tabelle für HTML 4.01.
ENT_XML1Die Tabelle für XML 1.
ENT_XHTMLDie Tabelle für XHTML.
ENT_HTML5Die Tabelle für HTML 5.
encoding

Definiert die zu verwendende Zeichenkodierung. Wenn nicht angegeben, ist der Standardwert für dieses Argument UTF-8.

Die folgenden Zeichensätze werden unterstützt:

Unterstützte Zeichensätze
ZeichensatzAliasBeschreibung
ISO-8859-1ISO8859-1 Westeuropäisch, Latin-1.
ISO-8859-5ISO8859-5 Wenig verwendeter kyrillischer Zeichensatz (Latin/Cyrillic).
ISO-8859-15ISO8859-15 Westeuropäisch, Latin-9. Enthält das Euro-Zeichen sowie französische und finnische Buchstaben, die in Latin-1(ISO-8859-1) fehlen.
UTF-8  ASCII-kompatibles Multi-Byte 8-Bit Unicode.
cp866ibm866, 866 DOS-spezifischer kyrillischer Zeichensatz.
cp1251Windows-1251, win-1251, 1251 Windows-spezifischer kyrillischer Zeichensatz.
cp1252Windows-1252, 1252 Windows spezifischer Zeichensatz für westeuropäische Sprachen.
KOI8-Rkoi8-ru, koi8r Russisch.
BIG5950 Traditionelles Chinesisch, hauptsächlich in Taiwan verwendet.
GB2312936 Vereinfachtes Chinesisch, nationaler Standard-Zeichensatz.
BIG5-HKSCS  Big5 mit Hongkong-spezifischen Erweiterungen; traditionelles Chinesisch.
Shift_JISSJIS, SJIS-win, cp932, 932 Japanisch
EUC-JPEUCJP, eucJP-win Japanisch
MacRoman  Zeichensatz, der von Mac OS verwendet wurde.
''  Eine leere Zeichenkette aktiviert die Erkennung durch die Kodierung des Skripts (Zend multibyte), default_charset und die aktuelle Sprachumgebung (siehe nl_langinfo() und setlocale()), in dieser Reihenfolge. Nicht empfehlenswert.

Hinweis: Weitere Zeichensätze sind nicht implementiert. Statt dessen wird die Standard-Kodierung verwendet und eine Warnung ausgegeben.

Rückgabewerte

Gibt die Umwandlungstabelle als Array zurück, wobei die ursprünglichen Zeichen die Schlüssel sind und die Entities die Werte.

Changelog

VersionBeschreibung
8.1.0flags geändert von ENT_COMPAT zu ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401.

Beispiele

Beispiel #1 Beispiel für eine Umwandlungstabelle

<?php
var_dump
(get_html_translation_table(HTML_ENTITIES, ENT_QUOTES | ENT_HTML5));
?>

Das oben gezeigte Beispiel erzeugt eine ähnliche Ausgabe wie:

array(1510) { [" "]=> string(9) "&NewLine;" ["!"]=> string(6) "&excl;" ["""]=> string(6) "&quot;" ["#"]=> string(5) "&num;" ["$"]=> string(8) "&dollar;" ["%"]=> string(8) "&percnt;" ["&"]=> string(5) "&amp;" ["'"]=> string(6) "&apos;"}

Siehe auch

To Top