UTF-16とは?
超初心者
1999/11/27(土) 04:18:31
UnicodeとUTF-8とUTF-16の違いを教えてください。
mizzy
1999/11/29(月) 13:02:30
文字コードの規格には、UnicodeとISO/IEC 10646というものが
あります。そして、ISO/IEC 10646にはUCS-2とUCS-4という
2つのコードが定めれています。UCS-2はUnicodeとほぼ同じ
ものになります。UCS-2は2オクテット、USC-4は4オクテット
の固定長のコードとして定められています。
また、ISO/IEC 10646に規格外の部分では、UTFという表現
形式についての記述があります。UTFはASCIIコードをその
まま1バイトで表現するとともに、マルチバイト表現のコード
が制御文字と重ならないように配慮して、可変長のコードを
定めています。この仕様をベースにして作られたのが、
UTF-8とUTF-16であり、UTF-8はUCS-2の文字集合を、UTF-16
はUCS-2+UCS-4の一部の文字集合を表現することができます。
私自身の理解も完璧ではありませんので、間違い等あれば
ご指摘頂けると幸いです。