MJ文字情報一覧表Ver.002.02の「戸籍統一文字番号」と「対応するUCS」のデータを GlyphWikiのkoseki-*に対する関連字と比較してみました。
戸籍統一文字 | 関連字 | 対応するUCS | 備考 |
koseki-058970 | u6de4 | u21327 | 誤字形、修正済み |
koseki-068450 | u2164b | u21650 | 誤字形 |
koseki-077120 | u218b6 | u2189d | 誤字形 |
koseki-077540 | u5b37 | u5b24 | 誤字形 |
koseki-241530 | u7501 | u24b74 | 誤字形 |
koseki-456730 | u91dc | u2894f | 誤字形 |
koseki-038080 | u5460 | u5406 | 16進数の入力ミスか、修正済み |
koseki-198350 | u3d94 | u3d04 | 16進数の入力ミスか、修正済み |
koseki-303520 | u424b | u42ab | 16進数の入力ミスか、修正済み |
koseki-307880 | u7ad8 | u7da8 | 16進数の入力ミスか、修正済み |
koseki-398760 | u27819 | u278f9 | 16進数の入力ミスか、修正済み |
koseki-487720 | u2835a | u2935a | 16進数の入力ミスか、修正済み |
koseki-518440 | u20cbb | u29cbb | 16進数の入力ミスか、修正済み |
「要変更」部分は変更した方が良さそうに思えたかどうか(個人の感想)ですが、 IVSがあるものは基底文字に合わせるのが良さそうです。
IVSはMJ文字情報から「平成明朝(参考)」のデータを取得して IVD_Sequences.txtから対応するものを選びました。 戸籍統一文字とは字体が異なる可能性はあります。
戸籍統一文字 | 関連字 | 対応するUCS | 要変更 | 備考 |
koseki-155270 | u66f6 | u3ada | ? | 同形異字→koseki-155440=u66f6 |
koseki-161410 | u80f6 | u3b35 | ? | 同形異字→koseki-328490=u80f6 |
koseki-327740 | u670f | u80d0 | ? | 同形異字→koseki-161310=u670f |
koseki-169720 | u204f2 | u23515 | ? | UCS重複収録の文字 |
koseki-219540 | u24425 | u2444b | ? | UCS重複収録の文字 |
koseki-455900 | u2028d | u28940 | ? | UCS重複収録の文字 |
koseki-543420 | u24bd2 | u2a415 | ? | UCS重複収録の文字 |
koseki-446160 | u2866c | u9094 | × | UCS重複収録の文字 |
koseki-035610 | u4e1f | u53be | ? | |
koseki-067660 | u5177 | u72ca | ? | |
koseki-085670 | u5c22 | u21bc1 | ? | |
koseki-101570 | u5e36 | u5e2f | ? | |
koseki-108400 | u20500 | u2232c | ? | |
koseki-131140 | u229e3 | u229fa | ? | |
koseki-150390 | u23006 | u23004 | ? | |
koseki-177820 | u236fe | u23765 | ? | |
koseki-188950 | u23aa3 | u23ab4 | ? | 異体字とするデータなし |
koseki-189660 | u6bd2 | u21e46 | ? | |
koseki-195810 | u6cf2 | u6ccd | ? | u6ccdと包摂できるのか不明 |
koseki-197120 | u23dea | u23ceb | ? | |
koseki-205240 | u6df9 | u23f1c | ? | 互換補助のエイリアスu2f90e=u6df9 |
koseki-233180 | u248c8 | u248c6 | ? | 異体字とするデータなし |
koseki-312690 | u26187 | u2618f | ? | |
koseki-395080 | u800e | u4672 | ? | 異体字とするデータなし |
koseki-435230 | u2837a | u2837f | ? | 異体字とするデータなし |
koseki-443340 | u9077 | u285c7 | ? | |
koseki-455610 | u22a00 | u22a12 | ? |
koseki-001340 | u4e44 | u3006 | × | 非漢字 |
koseki-000680 | u26b07 | u26b20 | × | →koseki-108520=u26b20-ue0100 |
koseki-046280 | u20df0 | u555a | × | |
koseki-079600 | u21978 | u21caa | × | |
koseki-088000 | u21c8f | u21c79 | × | |
koseki-089070 | u21d14 | u21d12 | × | 異体字とするデータなし |
koseki-103960 | u221a9 | u221a2 | × | 異体字とするデータなし |
koseki-141960 | u22cd7 | u22d4d | × | |
koseki-166530 | u23445 | u2347e | × | |
koseki-185410 | u23991 | u23998 | × | |
koseki-210670 | u240e8 | u29240 | × | |
koseki-258460 | u2721a | u250d3 | × | |
koseki-286440 | u259d1 | u7ab4 | × | |
koseki-329570 | u266e2 | u8158 | × | (点の有無) |
koseki-348040 | u26bb6 | u35b4 | × | |
koseki-374700 | u27249 | u27276 | × | 異体字とするデータなし、データ上は11画 |
koseki-380610 | u273dc | u27369 | × | 異体字とするデータなし |
koseki-397730 | u278b0 | u278af | × | (羽×1.5の画数) |
koseki-482470 | u24bde | u24bdd | × | T字形風 |
koseki-490050 | u29410 | u29413 | × | 異体字データが3段階離れている |
koseki-508980 | u29946 | u2995c | × | 異体字とするデータなし |
IVSにも関連字が割り当てられていない場合が多い。 基本的に対応付けて問題ないでしょう。
戸籍統一文字 | 関連字 | 備考 |
koseki-000800 | u6240 | u2b742-ue0101 |
koseki-000810 | u6240 | u2b742-ue0102 |
koseki-001630 | u72ae | u53d0-ue0101IVS関連字がベースと異なる |
koseki-073700 | u5a41 | u21764-ue0101IVS関連字がベースと異なる |
koseki-084760 | u58fd | u5900-ue0100IVS関連字がベースと異なる |
koseki-084770 | u58fd | u5900-ue0101IVS関連字がベースと異なる |
koseki-086810 | u5c3c | u21c31-ue0100IVS関連字がベースと異なる |
koseki-100790 | u5e25 | u5e2b-ue0102IVS関連字がベースと異なる |
koseki-106250 | u5ea7 | u2b777-ue0101IVS関連字がベースと異なる |
koseki-149900 | u657b | u5910-ue0102IVS関連字がベースと異なる |
koseki-222480 | u2b743 | u24568-ue0101IVS関連字がベースと異なる |
koseki-261060 | u770b | u3e14-ue0101IVS関連字がベースと異なる |
koseki-284520 | u7a7a | u2b7b9-ue0102IVS関連字がベースと異なる |
koseki-338660 | u821b | u2b762-ue0101IVS関連字がベースと異なる |
ここから下はIVSのベースと関連字が一致しています。
MJ文字情報でわざわざ「対応するUCS」を削除しているものです。
別字扱いしたいのか、類似する文字間で同定ができないのかはわかりません。
備考欄にある文字は戸籍統一文字情報で「親字・正字」にあるものです。