JavaマスターJavaプログラムサンプル集文字列, 日本語処理のサンプル → 文字を文字コードに変換する

文字を文字コードに変換する

ある文字を10進数表記または16進数表記の文字コードに変換する方法です。

Javaの内部では、文字列はすべてUnicodeとして格納されています。 char型として取り出した1文字をintにキャストを行うことで、その文字の 文字コードを得ることができます。

また、IntegerクラスのtoHexStringメソッドを使うことにより、 int型の整数を16進数に変換することができます。

samples/string/Unicode1.java - Eclipse SDK
package samples.string;
public class Unicode1 {
  public static void main(String[] args) {

    // 文字「あ」です。
    char c = 'あ';
    
    // 文字に対応するUnicodeコードを取得します。
    int code = (int)c;
    
    // 文字コードを表示します。
    System.out.println(code);

    // 文字コードを16進数で表示します。
    System.out.println(Integer.toHexString(code));
    
  }
}

コマンド プロンプト

C:\JavaMaster\bin>java -cp . samples.string.Unicode1 
12354
3042

文字の一覧からUnicode番号を調べる方法

上記の方法を使えば、どんな文字の文字コードでも得ることができますが、 そもそもキーボードから入力できない難しい漢字や記号もあります。

そのような場合は、Windowsパソコンであれば、「文字コード表」 スタート>プログラム>アクセサリ>システムツール>文字コード表) というツールを利用して、一覧から文字を選んだり、 文字コードを調べることができます。