DICOM/Value Representation/PN
PA(語源:Parson Name)とは、DICOMタグのうちデータ部分が氏名であることを表すVR(データ型)である。
概要
PAは氏名を表す文字列である。
エレメント
日本でいえば「姓」と「名」の間にスペースをいれることが多いが、DICOMではスペースではなくエレメントの区切り文字に「^」(文字コード0x5E)を使う。 たとえば「山本 太郎」であれば「山本^太郎」となる。
1グループは最大5エレメントまで許されている これはDICOM発祥の地である米国の姓名が以下のような感じだからである。 各要素の出現順序は以下のように定められている。
- family name (姓)
- given name (名)
- middle name
- name prefix (名前接頭辞)
- name suffix (名前接尾辞)
上記は日本ではミドルネームもミスターやミス、ミセス、サーなどの接頭辞や接尾辞も使わない。そのため以下のような形式になっていることが多い。
- 姓
- 名
また、獣医学の世界で5個を使って飼い主の名前と伴侶動物の名前の両方を格納していることが多い。
グループ
上記のエレメント群は複数あっても良いことになっている。 いわゆる配列である。 ただし、このVRだけ特殊で文字列の区切り文字に「=」(文字コード0x3H)を使う(他のタグの区切り文字はバックスラッシュ(文字コード0x5C)である)。
たとえば日本人の名前であれば以下のような感じになる。
- YAMAMOTO^TARO=ヤマモト^タロウ=山本^太郎
この出現順序も決まっている。 大雑把にいえばシングルバイト文字を優先しマルチバイト文字が後にくる。そして表意文字表現が表音文字表現より優先される。 つまりバイト数の少ない方から記述する。
- 単一バイト文字表現 - 日本語でいえばローマ字
- 表意文字表現 - 日本語でいえば漢字
- 表音文字表現 - 日本語でいえばカナ
ここで注意が必要なのは日本で一般的に使われている文字コード(0008,0005)はISO 2022 IR 13とISO 2022 IR 87(ローマ字とJIS半角カナとJIS漢字)であるという点で、日本語の表音文字表現(JIS半角カナ)が1バイトであるため表意文字表現(漢字)より優先されるという点である。よって日本語の場合は以下のようになる。
- 単一バイト文字表現 - ローマ字(1バイト文字)
- 表音文字表現 - 半角カナ(1バイト文字)
- 表意文字表現 - 全角漢字(2バイト文字)
文字コード(0008,0005)にISO_IR 192(UTF-8)を使う場合は表音文字のカタカナが全角カナとなるため本来の記述方法となる。 つまりカタカナが半角のときは漢字より前、カタカナが全角の場合は漢字より後ろとなる。
なお、JIS漢字(ISO 2022 IR 87)はシフトJISと異なり全角カナは含まれていない点に注意する必要がある。 全角カナは文字コード(0008,0005)がISO_IR 192(UTF-8)の場合しかありえない。
その他
PNのデータ長は各グループで64文字となっている。 64文字であり64バイトではない点に注意する必要がある。 また、全体のデータ長ではなく、各グループのデータ長である点にも注意する必要がある。
主なDAを用いているDICOMタグ
- (0010,0010) - Patient Name, 患者名
その他
VRの詳細はDICOMの規格書の5巻6章2節(PS3.5 6.2)を参照。