ISO-10646-UCS-4 | ISO 10646 | O Conjunto de Caracteres Universal com espaço de código de 31 bits, padronizado como UCS-4 pela ISO/IEC 10646. Mantido sincronizado com a versão mais recente do mapa de códigos Unicode. | Se este nome for usado na facilidade de conversão de codificação, o conversor tenta identificar pelo BOM precedente (marcador de ordem de byte) em qual endian os bytes subsequentes estão representados. |
ISO-10646-UCS-4 | UCS-4 | Ver acima. | Ao contrário do UCS-4 , as strings são sempre assumidas estar na forma big endian. |
ISO-10646-UCS-4 | UCS-4 | Ver acima. | Ao contrário do UCS-4 , as strings são sempre assumidas estar na forma little endian. |
ISO-10646-UCS-2 | UCS-2 | O Conjunto de Caracteres Universal com espaço de código de 16 bits, padronizado como UCS-2 pela ISO/IEC 10646. Mantido sincronizado com a versão mais recente do mapa de códigos Unicode. | Se este nome for usado na facilidade de conversão de codificação, o conversor tenta identificar pelo BOM precedente (marcador de ordem de byte) em qual endian os bytes subsequentes estão representados. |
ISO-10646-UCS-2 | UCS-2 | Ver acima. | Ao contrário do UCS-2 , as strings são sempre assumidas estar na forma big endian. |
ISO-10646-UCS-2 | UCS-2 | Ver acima. | Ao contrário do UCS-2 , as strings são sempre assumidas estar na forma big endian. |
UTF-32 | Unicode | Formato de Transformação Unicode de largura de unidade de 32 bits, cujo espaço de codificação refere-se ao padrão de conjunto de códigos Unicode. Este esquema de codificação não era idêntico ao UCS-4 porque o espaço de código do Unicode era limitado a um valor de 21 bits. | Se este nome for usado na facilidade de conversão de codificação, o conversor tenta identificar pelo BOM precedente (marcador de ordem de byte) em qual endian os bytes subsequentes estão representados. |
UTF-32BE | Unicode | Ver acima | Ao contrário do UTF-32 , as strings são sempre assumidas estar na forma big endian. |
UTF-32LE | Unicode | Ver acima | Ao contrário do UTF-32 , as strings são sempre assumidas estar na forma little endian. |
UTF-16 | Unicode | Formato de Transformação Unicode de largura de unidade de 16 bits. Vale a pena observar que o UTF-16 não é mais a mesma especificação que UCS-2 porque o mecanismo de substituição foi introduzido desde o Unicode 2.0 e UTF-16 agora se refere a um espaço de código de 21 bits. | Se este nome for usado na facilidade de conversão de codificação, o conversor tenta identificar pelo BOM precedente (marcador de ordem de byte) em qual endian os bytes subsequentes estão representados. |
UTF-16BE | Unicode | Ver acima. | Ao contrário do UTF-16 , as strings são sempre assumidas estar na forma big endian. |
UTF-16LE | Unicode | Ver acima. | Ao contrário do UTF-16 , as strings são sempre assumidas estar na forma little endian. |
UTF-8 | Unicode / UCS | Formato de Transformação Unicode de largura de unidade de 8 bits. | none |
UTF-7 | Unicode | Um formato de transformação seguro para e-mails do Unicode, especificado em » RFC2152. | none |
(none) | Unicode | Uma variante de UTF-7 especializada para uso no » protocolo IMAP. | none |
US-ASCII (preferred MIME name) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII | ASCII / ISO 646 | Código Padrão Americano para Intercâmbio de Informações é uma codificação comumente usada de 7 bits. Também padronizado como um padrão internacional, ISO 646. | (none) |
EUC-JP (preferred MIME name) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese | Compound of US-ASCII / JIS X0201:1997 (hankaku kana part) / JIS X0208:1990 / JIS X0212:1990 | Como você pode ver, o nome é derivado de uma abreviação de Formato Padrão de Código UNIX Packed para Japonês, esta codificação é principalmente usada em UNIX ou plataformas semelhantes. O esquema de codificação original, Extended UNIX Code, é projetado com base no ISO 2022. | O conjunto de caracteres referido pelo EUC-JP é diferente do IBM932 / CP932, que são usados pelo OS/2® e Microsoft® Windows®. Para a troca de informações com essas plataformas, use EUCJP-WIN em vez disso. |
Shift_JIS (preferred MIME name) / MS_Kanji / csShift_JIS | Compound of JIS X0201:1997 / JIS X0208:1997 | Shift_JIS foi desenvolvido no início dos anos 80, na época dos processadores de palavras japoneses pessoais foram lançados no mercado, a fim de manter compatibilidades com o esquema de codificação legado JIS X 0201:1976. De acordo com a definição da IANA, o conjunto de códigos do Shift_JIS é ligeiramente diferente de IBM932 / CP932. No entanto, os nomes "SJIS" / "Shift_JIS" são frequentemente usados erroneamente para se referir a esses conjuntos de códigos. | Para o mapa de código CP932, use SJIS-WIN em vez disso. |
(nenhum) | Composto de JIS X0201:1997 / JIS X0208:1997 / extensões IBM / extensões NEC | Embora esta "codificação" use o mesmo esquema de codificação que EUC-JP, o conjunto de caracteres subjacente é diferente. Ou seja, alguns pontos de código mapeiam para caracteres diferentes do EUC-JP. | nenhum |
Windows-31J / csWindows31J | Composto de JIS X0201:1997 / JIS X0208:1997 / extensões IBM / extensões NEC | Embora esta "codificação" use o mesmo esquema de codificação que Shift_JIS, o conjunto de caracteres subjacente é diferente. Isso significa que alguns códigos pontos mapeiam para caracteres diferentes do Shift_JIS. | (none) |
ISO-2022-JP (preferred MIME name) / csISO2022JP | US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 | » RFC1468 | (nenhum) |
JIS | | | |
ISO-8859-1 | | | |
ISO-8859-2 | | | |
ISO-8859-3 | | | |
ISO-8859-4 | | | |
ISO-8859-5 | | | |
ISO-8859-6 | | | |
ISO-8859-7 | | | |
ISO-8859-8 | | | |
ISO-8859-9 | | | |
ISO-8859-10 | | | |
ISO-8859-13 | | | |
ISO-8859-14 | | | |
ISO-8859-15 | | | |
ISO-8859-16 | | | |
byte2be | | | |
byte2le | | | |
byte4be | | | |
byte4le | | | |
BASE64 | | | |
HTML-ENTITIES | | | |
7bit | | | |
8bit | | | |
EUC-CN | | | |
CP936 | | | |
HZ | | | |
EUC-TW | | | |
CP950 | | | |
BIG-5 | | | |
EUC-KR | | | |
UHC (CP949) | | | |
ISO-2022-KR | | | |
Windows-1251 (CP1251) | | | |
Windows-1252 (CP1252) | | | |
CP866 (IBM866) | | | |
KOI8-R | | | |
KOI8-U | | | |