使用言語
lang. | read | write |
ja | 100 | 100 |
en | 90 | 50 |
zh | 0 | 0 |
ko | 0 | 0 |
開設日・自己紹介
- ユーザー名は「字様」。初心者の日本人です。--2014年9月8日(月) 22:48
- 「です」体に変えます。--2014年9月10日(水) 22:13
リンク
Sandboxでの作業
小書きの仮名での作業
- 符合化されていない小書きの仮名(25字)(グループ:ziyang_sandbox@80)
- 小書きの仮名9字が符号化提案されましたので,GlyphWikiにある,符号化されていない小書きの仮名をまとめました。命名がそろっておらず,命名ルール違反のグリフも5字あります。厳格に運用するなら,現状で認められている「hiragana-S」「katakana-S」に沿う命名に変更することになります。 --2016年12月24日(土) 13:03
- ISO/IEC 10646:2017 PDAM2に基づき更新しました。 --2018年2月4日(日) 12:33
北大漢簡蒼頡篇での作業
西夏文字での作業
- グループ:Working-TangutNewBuild
- 西夏文字が符号化されたので,既存のtangutグリフからUCSグリフを作字しました。筆画用のtangutグリフが古い符号化提案に基づいており,今後の支障になるかもしれないので,異例の字体変更になりますが,最新の提案に沿ったものに直しました。 --2016年5月8日(日) 23:47
- グループ:ziyang_sandbox@70
- BabelStone Han PUAに含まれる,『番漢合時掌中珠』他の西夏文字に関連する36字をまとめました。 --2016年8月20日(土) 12:14
- グループ:西夏文字
- このページに連なる文字一覧ページで,符号化されたtangutグリフをUCSグリフに置換しました。 --2016年12月24日(土) 13:03
- N4896に基づき更新しました。 --2018年2月4日(日) 12:33
平安時代漢字字書での作業
グリフの整理での作業
- グループ:Working-SawnNewBuild
- グループ:Working-SawnNewBuild-05
- SAWN外字の代表的な利用法は古壮字字典の外字と思われますので,「古壮字字典-文字一覧」を作成してみました。
この段階で未作成のsawnグリフが多いですが,依頼している機械処理による作字ができると概成します(ほぼ完成予想図(グループ-ノート:Working-SawnNewBuild-05)も作成してみました。機械的な突合によるので,完全には正確ではなく,細かな検証が必要ですが,GlyphWikiで勝手に直っていくことを期待します。
GlyphWikiでの「古壮字字典-文字一覧」は,ACT版(sawnグリフ)とKDP版(sawdグリフ)の2つができました。土台のACTデータにミスが多いのでKDP版の方が優れていると思われますが,ACT版は先行して概成したことが利点で,KDP版の足掛かりになることでしょう。 --2015年8月7日(金) 00:11
- 関連した作業ですが,グループ:古壮字一覧の補足として,古壮字字典以外を出典としている古壮字関係の符号化提案字とsawnグリフの対応表を作成しました。IRG資料にあるIDSを使って, 电子方块壮字
で検索しました。 --2015年12月9日(水) 19:36
- 古壮字字典を出典としたExt.F,IRG Working Set 2015への提案字と照合して,齟齬が生じた箇所の修正をおこない,sawdグリフをベースに,G字形,J字形と対照させた「古壮字字典-文字一覧」を作成してみました。KDPデータとは付番もかなり変わっています。 --2016年1月24日(日) 11:11
- グループ:ziyang_sandbox@42
- GlyphWiki:グリフの整理で検討対象とされたグリフの対応策(すでにとられているものと私案)をまとめてみました。 --2015年7月27日(月) 00:24
大漢和辞典での作業
(旧版)なんちゃって大漢和(GlyphWiki:サンドボックス@142)
島根県立大学のe漢字サーバが休止して,大漢和辞典掲載字の検索ができなくなりました。その代わりになるかどうかわかりませんが,主に戸籍統一文字を使って大漢和を組んでみました。いわば「なんちゃって大漢和」です。
戸籍統一文字の多くが大漢和辞典から採録されていることを利用しています。別のフォントを使って文字集合を表すという考え方は,グループ:ziyang_sandbox@27が常用漢字表でグループ:常用漢字@4が平成明朝を使って常用漢字表を組む,という風にGlyphWikiでは前例が色々あります。字形差(場合によっては字体差)も生じますが,大体似ていれば良いという大らかな気持ちになれば利用価値はあるかと思います。
未作成字については,MJ文字情報一覧表の戸籍統一文字,住基統一文字と大漢和辞典の対応表を使っています。該当する対応のないものは,漢字データベースプロジェクトのUnicodeと大漢和辞典の対応表を使っています。グループ:ziyang_sandbox@40では,どちらの資料でもUnicodeに対応しない文字が106字あり,そのうち戸籍統一文字と住基統一文字のどちらにも対応しない文字が31字あることがわかります。この31字を作字すると,「なんちゃって大漢和」が全字埋まるはずです。
ところで,漢字データベースプロジェクトに基づき,大漢和辞典掲載字を51,110字としていますが,Wikipedia
では51,109字,と1字少ないです。ダッシュ付番号がこちらが513字で,Wikipediaが512字というのが違いです。はたしてどちらが正しいのでしょうか。--2015年7月11日(土) 12:09
なんちゃって大漢和(グループ:sandbox@44)
- MJ文字情報一覧表Ver.005.02でMJ文字図形名と大漢和番号の対応が改訂されました。これまではMJ文字図形名をできるだけ大漢和番号と対応づける1対多対応だったのが,大漢和に近いものを1つ選ぶ1対1対応になりました。この変化で,なんちゃって大漢和の作成手順も簡単になりました。まず,漢字データベースプロジェクトの対応表をもとに,大漢和番号を欠番,Unicodeに対応するもの,対応しないもの,重出の4種類に分類します(missing,moved,removedの情報があるのが欠番ですが,自由形式の欄を調べるので注意が必要です)。欠番以外の大漢和番号について,GlyphWikiでの作成文字,MJ文字情報一覧表で対応する戸籍統一文字・住基統一文字,漢字データベースプロジェクトで対応するUCSグリフ,重出は同じグリフを当てはめていきます。どれにも当てはまられない番号は未作成のdkwグリフが当てはめられますが,今回はそのようなグリフは先回りして作字してあるので,全字にグリフが当てはまっています。ちなみに最後に作字されたグリフは
dkw-h0115でした。この字形は「奯」に翻刻してもよかったようにも思います。--2018年2月18日(日) 09:56
- dkwグリフが作字完了しましたので,なんちゃって大漢和は役割を終えました。 --2020年11月14日(土) 18:08
- グループ:ziyang_sandbox-デザイン@5
- 大漢和辞典(石井明朝)作成字について,対応をつけた戸籍統一文字,平成明朝の字形の違いを調べてみました。--2015年7月11日(土) 12:09
- グループ:ziyang_sandbox@84
- 符号化されていない大漢和辞典の掲載字をまとめました。 --2020年11月14日(土) 18:08
国字での作業
- 国字一覧表(試作版)(GlyphWiki:サンドボックス@147)
- GlyphWikiにある,国字を採録した4辞書の掲載字を整理してみました。角川大字源国字一覧が全字作成されていないことと,同字を同じ行にまとめる作業は機械的に処理できる分のみであるため,「試作版」です。
表は3,372行ありますが,関連字がある字が2,041行,関連字がない字が1,331行になっています。国字の符号化は以下のような流れで進んでいます。CJK統合漢字拡張C,Eに収録されたJKソース782字が国字の字典を典拠としています。拡張Dに収録されたJHソースと拡張F以降に収録されようとするJMJソースが住基統一文字と戸籍統一文字を典拠とし,戸籍統一文字が角川大字源国字一覧から採録し,大字源が国字の字典と日本人の作った漢字から多くを採録しています。汎用電子情報交換環境整備プログラムの「辞書非掲載字」資料
は大漢和辞典等の辞書に非掲載で,角川大字源国字一覧に掲載されている958字の典拠を示しています。GlyphWikiの関連字設定は,この2つの情報とグループ:汎用電子・国字の情報に沿っています。
- 4辞書掲載字を集める趣旨で,角川大字源国字一覧の全字が作字された段階で再度作表することを考えています。当面は作字に当たって適したグリフを探すのに,この表は役立つと思います。
同字を完全にまとめるには,関連字がなく同じグリフでない同字の情報を追加することが必要です(例えば,
waseikanji-no-jiten-0104と
kokuji-no-jiten-0053)。これは目視による手作業になりますが,情報を集約する場所をどこかに作り,気づいた方に書き込んでもらう形式が良いのでしょうか。
- 当初は2分割するつもりだったのですが,1頁に収まる分量が予測より少なくて,4分割になり,作成途中で5分割になりました。転送データ量を抑えるために1頁のグリフ数を抑えることは念頭にあったのですが,国字のグリフ名が長いので記事の文字数が多くなることが考慮に入っていませんでした。--2014年12月10日(水) 21:54
- 角川大字源国字一覧が全字作成されたので,試作版(GlyphWiki:サンドボックス@120)を改訂しました。今回は,大字源の部首のデータを独自調査で補いました(データはグループ-ノート:角川大字源国字一覧@1に置きました)。国字の字典と収録字はかなり重なりますが,国字の字典はおもに通用体,大字源はいわゆる康煕字典体(国字は康煕字典には載りませんが)が使われています。戸籍統一文字が大字源の字体を取り入れていることから,戸籍統一文字の字体の研究に大字源のグリフが役に立つと思われます。4辞書掲載字すべてを収録しましたが,和製漢字の辞典の新版を現在作字中ですので,「試作版」のままとしました。関連字がなく同じグリフでない同字をまとめる作業は進展がないので,一覧表の目的としないように今は考えています。和製漢字の辞典の新版を収録したところで,一区切りをつけるつもりです。
表は3,367行ありますが,関連字がある字が1,998行,関連字がない字が1,369行になっています。関連字のある字が前回版より減っていることにいま気がつきましたが,取りこぼしがある可能性があり,要調査です。 --2015年7月16日(木) 23:25
- 収録対象の和製漢字の辞典2,747字,角川大字源国字一覧1,453字,国字の字典1,556字,日本人の作った漢字723字(合計6,479字)がすべて入っていましたので,幸い取りこぼしはありませんでした。前回は関連字でのまとめが中途半端だった可能性がありますが,調査はここまでとします。 --2015年7月18日(土) 14:48
- JKソース提案字(970字)(グループ:ziyang_sandbox@50)
- 国字の字典(1,556字)→JKソース提案字→CJK統合漢字拡張C,E(782字)の流れをまとめてみました。国字に関連字をつける作業と関係していますので,GlyphWikiの関連字も示してあります。 --2015年6月6日(土) 11:16
- 提案予告(IRGN862)と正式提案(IRGN895)の関係を明確にするように,記述を直しました。 --2015年11月2日(月) 01:43
関連字での作業
未作成文字
- 登記固有文字のCodeChartを作成しました。戸籍統一文字の形式にそろえています。 --2014年12月10日(水) 21:54
Sandbox-デザインでの作業
- MJ文字情報一覧表では,戸籍統一文字が常用漢字とする字形を常用漢字と違う字形と見ています。文字情報基盤を使って戸籍システムと住基システムで電子情報を交換すると,常用漢字でさえも問題が生じることになるのでしょうか。 --2015年6月7日(日) 23:24
- 本来はこちらのページに作成するものでした。
Ken Lundeさん
によれば,JIS2000で漢字3,685字が追加され,そのうち2,741字が補助漢字(J1ソース)と同じUnicode符号位置をもち,そのうち29字の字形が違います(安岡孝一さん
によれば,住民基本台帳ネットワーク文字では27字の字形が違うと見なしています)。さらにJIS2004で表外漢字字体表に対応するために168字の字形変更と漢字10字の追加がありました。前者168字のうち補助漢字と同じ符号位置にある1字(U+5C62)が字形変更となり,後者10字のうち2字が補助漢字と同じ符号位置をもち,そのうち1字(U+7626)の字形が違います。結局,JIS2004とJ1ソースの間で31字の字形が違います。
また,Ken Lundeさん
によれば,JIS2000で追加された漢字のうち,85字がJAソースと同じ符号位置をもち,そのうち7字の字形が違います。
また,JIS2004で字形変更された168字のうち,90JIS(J0ソース)の167字が変更になりました。
J0ソースで167字,J1ソースで31字,JAソースで7字の合計205字の字形がJIS2004では違っており,GlyphWikiではすでにJIS2004字形に更新されていますが,元のコード表では変わっていません。GlyphWiki:命名ガイドラインでは,字形変更前のグリフにはJ1ソースで接尾辞-js,JAソースで接尾辞-jaをつけることになっていますが,J0ソースは指定がありません。J1ソース分も作字されていませんので,これらはJISのグリフ名で代用しました。 --2015年6月7日(日) 08:29
- 作成したページには「書体別グリフ分類」と表記しましたが,書体よりはフォント,グリフよりは文字集合と呼ぶのが適切のようです。文字集合の例示字形にどのフォントが使われているか,の情報を整理しました。--2015年1月4日(日) 00:11
- デザイン関係のページを別に作成しました。「㐄」が出発点でしたが,常用漢字である「違」の違いを見ることにしました。「口」と「㐄」について,小塚明朝ははなすで統一,IPA明朝はつけるで統一,平成明朝は混在です。Hanyo-DenshiコレクションもIPA明朝でサポートしたくなります。 --2014年11月24日(月) 23:49
- extfグリフの作業中にGlyphWikiのなかでの「欠」の不統一に気づいたのですが,統一基準に沿う部品を使えるようにする作業も大変で,根が深い問題でした。第3画の墨ダマリの扱いは平成明朝(Unicodeの規格票)で統一されておらず,いちいち再現する(労力をかけてフォントの品質を落とす)よりは,規格票にとらわれず扱いを統一する(労力を減らしフォントの品質を上げる)が方が得策のように思いました。 --2014年10月19日(日) 23:53
デザイン-平成明朝とIPA明朝
常用漢字表での作業
- グループ:常用漢字は無印UCSグリフ(暗黙にUCS-jグリフ,平成明朝)で組まれていますが,本物の常用漢字表はIPAex明朝で組まれています。そこで,MJ文字情報一覧表の情報に基づき,同系のIPAmj明朝であるjmjグリフで常用漢字表を再現してみました。常用漢字表の例示字形をより忠実に再現することが期待できますが,現状では作成されたグリフが非常に少ないため,この表が活きてくるのはまだ先のことです。--2015年1月4日(日) 00:11
- つぎにMJ文字情報一覧表の情報を用いて戸籍統一文字で人名用漢字表を再現する作業を始めたところ,人名用漢字9字が戸籍統一文字に対応していません。このため,作業は中断しました。法務省が示す人名用漢字の字形と文字情報基盤の示す字形が違うことになりますが,大丈夫なのでしょうか。
- 関連して,グループ:表外漢字が3字欠落していたので,それを補い,印刷標準字体,簡易慣用字体別に表外漢字字体表に沿って並べ替えました。表外漢字は平成明朝で組まれているので,「UCS」と「字形」の2つのグループを作る必要はありません。 --2015年3月9日(月) 00:07
- jmjグリフでの常用漢字2,136字が作字され,常用漢字表と照合できましたので,グループ:常用漢字-字形にまとめました。人名用漢字,表外漢字とともにグループの関係は,以下のようになります。 --2016年12月24日(土) 13:03
人名用漢字表での作業
周期表での作業
- グループ:中国語周期表,グループ:元素記号の内容を更新・修正しました。 --2016年12月24日(土) 13:03
- 新しく決定された第113,115,117,118番元素を追加しました。 --2018年2月4日(日) 12:33
契丹文字での作業
- 符号化提案された契丹小字484字をunstableグリフを使って,まとめました。 --2016年12月24日(土) 13:03
- ISO/IEC 10646:2017 PDAM2に基づき,470字に変更しました。 --2018年2月4日(日) 12:33
CDP外字での作業
- CDP外字関連のページに重複,欠落がありましたので,修正しました。CDP外字1,402字の状況についてはグループ-ノート:CDP外字にまとめてあります。 --2016年12月24日(土) 13:03
- 漢字データペースプロジェクトと同期させる方向で修正しました。現在違っているのは,無印UCSグリフと同じ5字が漢字データベースで符号化されていない扱いであるところを,GlyphWikiでは符号化された扱いとしているところです。 --2017年2月2日(木) 00:25
- CJK統合漢字拡張Fにともなう漢字データベースプロジェクトでの改訂を反映させました。GlyphWikiと扱いの違う5字はそのままです。符号化された24字はグループ:ziyang_sandbox@81にまとめてあります。 --2018年2月4日(日) 12:33
PipelineTableでの作業
図書寮本類聚名義抄での作業
- グループ:図書寮本類聚名義抄
- 高山寺本篆隷万象名義に続き,池田証寿・北海道大学教授の作成された図書寮本類聚名義抄掲出字索引から,図書寮本類聚名義抄を再現してみました。dkwグリフ(2016年2月16日現在)とその代用品を使用します。また,大漢和辞典にない外字はguritzさんが作成したmyogisho-zグリフを利用します。
「図書寮本類聚名義抄掲出字索引(myogisho.txt)説明書」によれば掲載字は7,114字になりますが,1つの掲出項の字数情報を3字から2字に補正したことが原因なのか,補正作業後で7,113字となって1字のずれがあります。 --2016年3月11日(金) 23:34
- 大漢和辞典に対応づけられていない100字は,かならずしもmyogisho-zグリフで表せないことがわかりました。まず,データベースがJIS漢字への翻刻を指向して,大漢和辞典に対応づけていない字があります。この場合,外字を作成せずUCSグリフを使うことができます。また,myogisho-zグリフは,大漢和辞典への翻刻ではなく,原本に近い字形を指向しています。このため,大漢和辞典の番号の末尾が90の字は,対応するUCSグリフを使うことにしました。それ以外の字でも,UCSグリフ(およびextfグリフ)を使える場合は,そちらを使うようにしました。使用できるmyogisho-zグリフを作字した後,該当するグリフが作字されていない字は残り12字です。 --2016年4月24日(日) 22:29
- 色々なグリフ名を使い,全字作字しました。 --2016年5月8日(日) 23:47
- グループ:guritz_ZRM-entry@2で追加の補正が指摘されていたので,グループ:図書寮本類聚名義抄に取り入れました。1字追加され,7,114字となりました。 --2017年2月2日(木) 00:25
- 作業が遅くなりましたが,なんちゃって大漢和を卒業して,大漢和辞典に対応する文字はすべてdkwグリフを使用しました。
また,符号化された文字はUCSグリフに置換しました。 --2023年5月11日(木) 22:55
高山寺本篆隷万象名義での作業
- グループ:高山寺本篆隷万象名義
- なんちゃって大漢和(GlyphWiki:サンドボックス@142)の応用として,池田証寿・北海道大学教授の作成された篆隷万象名義データベースから,高山寺本篆隷万象名義を再現してみました。データベースは大漢和辞典と対応づけていますので,UCSグリフではなく,dkwグリフ(2016年2月16日現在)とその代用品を使用します。
また,大漢和辞典にない外字をグループ:prefix-tenreiで定義しました。同種の外字にannabelleさんが作成されているbsmgグリフがありますが,通用体で作字されているようなので,池田先生による字典体への翻刻とは両立せず,新しいグリフが必要です。
「篆隷万象名義データベースの改訂
」によれば,掲載字は16,901字とされていますが,ここでの補正作業後で16,900字となって1字のずれがあります。また,大漢和辞典にない字は46字とされていますが,ここでの作業では45字となって1字のずれがあります。
平安時代漢字字書研究
サイトでは,篆隷万象名義はKTBと略されており,hdic-ktbのようなグリフ接頭辞が便利かもしれません。ただし,現在のところ当該サイトで篆隷万象名義のデータは公開されていないため,出典がないことから命名はできないと思われます。 --2016年3月2日(水) 00:09
- 所在が不明で削除した1字が,部首と宋本玉篇との対応情報を使って所在が見つかりましたので,一覧に加え,16,901字となりました。 --2016年3月28日(月) 02:13
- 原本玉篇に沿う1字を除き,外字の作字を終えました。 --2016年4月2日(土) 23:52
- データベースの情報から,篆隷万象名義にない原本玉篇の外字をTENREI外字で表せることがわかったので,5字をグループ:prefix-tenreiに追加しました。他に1字(3014a411)は,データベースが宋本玉篇(a084a084「謻」)の字体で大漢和辞典に対応づけられていますが,原本玉篇(Y09101080「⿲言衤多」)は字体が違って外字を必要とします。3014a411をどちらの字体と対応させるべきかを検討中で,この字の作字を保留しています。 --2016年4月24日(日) 22:29
- 部首目録にある543字を削除し,16,358字としました。平安時代漢字字書研究
サイトに,篆隷万象名義のデータが公開されましたが,こちらと体裁を合わせたものです。新しい研究を踏まえて,文字の同定に変更があるようですが,大漢和字典番号が含まれていないので,どのように対応するかはこれから検討します。
なお,新しいデータベースは複数の辞書を含みますが,IDは重複してないようなので,グリフ名はhdicにIDをつける形で十分そうです。ただし,篆隷万象名義については,TENREI外字がそのまま使える可能性があります。
また,グループ:サンドボックス@29で,GlyphWikiで整理対象の5字が新規の外字となることを示しました。 --2016年5月8日(日) 23:47
- グループ:サンドボックス@29をグループ:サンドボックス@38に改訂し,整理対象の2字は注文にあることを示し,IDSで作字しました。 --2016年12月24日(土) 13:03
- 記録が遅くなりましたが,なんちゃって大漢和を卒業して,大漢和辞典に対応する文字はすべてdkwグリフを使用しました。 --ziyang 2023年5月5日(金) 16:39
- グループ:サンドボックス@38をグループ:ziyang_sandbox@89に改訂し,白紙化されたグリフを初版グリフに置換しました。 --ziyang 2023年5月5日(金) 16:39
今日の大漢和2015での作業
- グループ:今日の大漢和2015
- 大漢和辞典掲載の340字の字形が一覧できる資料でしたので,GlyphWikiで再現してみました。ただし細部が不鮮明で,この資料だけでは作字できないものがあります。 --2016年2月15日(月) 23:33
- 全字作字しました。 --2016年8月20日(土) 12:14
忍びいろはでの作業
- グループ:忍びいろは
- 復号フォントほど芸はないですが,暗号フォントも一応,作ってみました。 --2016年2月15日(月) 23:33
忍びいろは復号での作業
- グループ:忍びいろは復号
- BabelStone Han PUA(version 1.020)に,符号化されていない忍びいろは12字が収録されたので,「文字化け」によって暗号を復号するフォントを作ってみました。お正月のお遊びです。 --2016年1月24日(日) 11:11
IVDでの作業
- グループ:prefix-hka
- 香港から提案予定の4番目のIVDコレクションのグリフの作成希望が井戸端に書かれていたので,命名規則を定義するグループを作成しました。Qin Luさんの解説
では約9,000字が提案予定のようですが,現在の資料(Working Document Version 1.0)に掲載されているのは2,746字です。--2014年12月28日(日) 23:47
- IVDへの登録申請はなさそうです。 --2016年9月14日(水) 00:50
- グループ:IVD-MSARG
- マカオから申請された4番目のIVDコレクションがIVD2016-08-15に登録されたので,花園明朝生成用のグループを作成しました。基底文字が含まれないとフォントが生成されないので,花園明朝Aに収録されるときには,SIPにある基底文字のグループグループ:IVD-MSARG-SIPベースコードを同時に含める必要があります。 --2016年9月14日(水) 00:50
- 新たに133字がIVD2020-11-06に登録されたので,ページを更新しました。 --2020年11月23日(月) 23:15
- IVDコレクションに関係するグループ名は,フォント生成は「IVD」が始めに,文字一覧は「IVD」が終わりにつく傾向にあるので,それに沿って新しいコレクションの文字一覧ページを命名しました。ただし,コレクションによって名称,形式はばらばらです。
関連字-検証での作業
- グループ:関連字-検証
- 以下の見直し作業に一区切りをつけ,MJ文字情報一覧表よりもGlyphWikiの関連字設定の方が適切に思える26字をまとめました。広く関連字の検証用に利用してもらえるよう,新しいページとしました。文字情報一覧表の情報は,コレクション「388 MOJI-JOHO-KIBAN IDEOGRAPHS-2014」としてISO/IEC 10646:2014/Amd.2に追加提案がされており,重要なものになっています。 --2014年11月16日(日) 08:18
- tweさんのツール問題のあるグリフの一覧
の助けを借りて,MJ文字情報一覧表の「対応するUCS」に沿って,GlyphWikiの関連字設定の見直し作業をしています(まだ積み残しがあります)。関連字が適切に設定されていないことで,IVSにも混乱を生じている箇所もあったりして,品質の向上に有益な作業です。ただし機械的にMJ文字情報一覧表に沿って直せばよいわけではなく,字形から見てGlyphWikiの関連字設定の方が適切に思える例も下の表のように見つかりました(積み残しの分からもっと見つかるかもしれません)。表は,戸籍統一文字,GlyphWikiの関連字,文字情報一覧表の「対応するUCS」の字形です。 --2014年11月8日(土) 23:36 (今日の作業で追加がありました。 --2014年11月9日(日) 18:45)
- itaij,IVSのグリフ名に含まれる符号位置と関連字の符号位置がずれることがあります。そのときの関連字のつけ方が複雑ですが,文字情報基盤漢字がそれのエイリアスになっているときにはさらに複雑になります。itaijiの字形が新しい符号位置に統合されるようになったら,itaijiは白紙化すると,関連字の一覧も見やすくなり,関連字の検証もしやすくなるように思います。
- 関連字を修正したときに,そのエイリアスが自身で関連字を設定していると,置き去りになってしまいます。エイリアスの関連字は「〓」の方が都合が良いように思います。
- MJ文字情報一覧表Ver.005.01を参照するように更新しました。 --2016年8月20日(土) 12:14
ソース別漢字一覧での作業
文字情報基盤での作業
- 「人名用漢字表-字形」での作業の副産物で,戸籍統一文字と文字情報基盤が一致しない人名用漢字12字をまとめました。 --2015年4月13日(月) 23:26
- MJ文字情報一覧表Ver.005.01を参照するように更新しました。 --2016年8月20日(土) 12:14
- MJ文字情報一覧表Ver.005.01に基づき更新しました。 --2016年8月20日(土) 12:14
- MJ文字情報一覧表Ver.005.02に基づき更新しました。 --2018年2月4日(日) 12:33
- MJ文字情報一覧表Ver.006.01に基づき更新しました。MJ文字図形名のうち符号化された文字を文字情報基盤漢字と呼ぶようにしました。文字情報基盤整備事業成果物は情報処理推進機構から文字情報技術促進協議会に移管されたので,これ以上の進展はなさそうに思います。 --2020年11月14日(土) 18:08
文字情報基盤漢字 CJK統合漢字拡張F(1,645字)での作業
- グループ:文字情報基盤-CJK統合漢字拡張F
- CJK統合漢字拡張Fの日本提案は,文字情報基盤を典拠とし,文字情報基盤は戸籍統一文字と住基統一文字を典拠としています。このことから,下の表では1行に同じグリフが入ることが期待されますが,この表の5行はそうならない5つの事情をそれぞれ示しています。
- [21 対応済] 「也」の草書体に符号位置を与えるかという問題は措く。koseki-001330は,
dkw-00117@1のエイリアスとされた。しかし,この文字が典拠とする戸籍統一文字001330
は,dkw-00117が典拠とする大漢和辞典117
よりも,
extd-00088@2に近い。extd-00088のエイリアスに変更の上,こちらを実体とした。--[注1 編集規準1,2,4] ziyang 2014年9月9日(火) 22:10
- [25他 検討中] extf-00118は,Ext.Fv1.0(IRGN1921)の00118(
z-sat03202@1)の例示字形を典拠とします。00118はExt.F1v1.0(IRGN1945)で00115(
jmj-056863@1)を統合しましたが,例示字形が00115のものに変更されました。このため,extf-00118が現状の字形とずれてしまいました。逆の方向に統合されていれば,このような事態にならなかったのでしょうが。
extfグリフはExt.Fv1.0の例示字形を指すとともに,最終的に規格化されたときのuグリフの準備の役割もあるでしょう。いま変更するのがいいか,規格が固まる最終段階で変更するがいいか,あるいは変更しないか。複雑な問題なのでしばらく考えます。--2014年9月10日(水) 22:13
- [159他 静観] jmjグリフ,extfグリフが未実装です。この表の作成時,796字のextfグリフとimjグリフ(合計1,592グリフ)のうち,1,162グリフが未実装でした。[GlyphWikiを見て回るうちに,jmjグリフはかならずしもすべて実装する必要はないと思うようになりましたので,以下は削除します。--2014年10月18日(土) 00:31]]
jmjグリフの対象は58,814字ありますので,典拠資料を確認して手作業で実装していくと,すべて実装するのはいつになるのでしょうか。文字情報基盤漢字に対応する戸籍統一文字と住基統一文字はすべて実装されていますので,割り切って,対応するグリフのエイリアスとする機械処理をすることも考えらます。新参者で恐縮ですが,Wikipediaは「とりあえず使うようにして,後で修正する」やり方が合っているのではないかと思います。新参者がいきなり提案しても聞いてもらえないものですので,とりあえず提案書を下書きし,この件は(とりあえず2015年3月まで)寝かせます。
(提案の案) 未実装のjmjグリフ,およびjmjグリフに対応する未実装のextfグリフを機械処理で生成することを提案します。手順は以下の通りです。まず,混乱を招かないように,すでに実装されているjmjグリフ,extfグリフには触りません。処理対象となるjmjグリフは,MJ文字情報一覧表Ver.004.01で対応する戸籍統一文字がある場合はkosekiグリフ(エイリアスである場合はその実体)のエイリアスとし,それ以外は対応するjukiグリフ(エイリアスである場合は,それらの実体)のエイリアスとします。処理対象となるextfグリフは,Ext.F1v1で対応するjmjグリフがある場合,それ(それがエイリアスである場合はその実体)のエイリアスとします。すべてのjmjグリフについてのkosekiグリフまたはjukiグリフの対応表,jmjグリフと対応するすべてのextfグリフについてのjmjグリフとの対応表をお渡しすることができます(ただし,実装か未実装かの区別はできません)。--2014年9月10日(水) 22:13
- [161 対応済] extf-00803は,Ext.Fv1.0(IRGN1921)の00803の例示字形(その典拠は文字情報基盤漢字MJ057087
)を典拠とします。MJ057087は戸籍統一文字030020
に対応しますが,区別すべき字形差があるものと判断して,
koseki-030020@4とは別に作られたと思われます。--[注2] ziyang 2014年9月10日(水) 22:53
jmj-057087は,文字情報基盤漢字MJ057087
を典拠とし,すでに作成されていたextf-00803のエイリアスとして作成されました。extf-00803は,Ext.Fv1.0(IRGN1921)の00803の例示字形(その典拠は文字情報基盤漢字MJ057087 )を典拠とします。MJ057087は戸籍統一文字030020
に対応しますが,区別すべき字形差があるものと判断して,
extf-00803@1は
koseki-030020@4とは別に作られたと思われます。拡張F日本提案は,文字情報基盤を典拠としているので,こちらを実体としました。--[注3 編集規準2,5] ziyang 2014年9月11日(木) 07:39
私が最初にextf-00803を作成するなら文字情報基盤漢字と戸籍統一文字を作り分けないですが,すでに作り分けられていたので,編集規準2の例外適用としました。初心者なので,エイリアスの作成に手間取りました。ziyang 2014年9月11日(木) 07:59
- [708 静観] GlyphWiki:仮想J字形のガイドラインで,UCSでJソースがある符号位置について「ただし、草冠は常に
u8279を使い、
ufa5d、
ufa5eは使いません。」がextfグリフに適用されています。ノート の「Ext FのJソースの4画草冠について(GlyphWiki-talk:仮想J字形のガイドライン@115)」の議論では,このただし書きは,UCSでJソースがある符号位置については適用されませんが,extfグリフについては適用されるということになっています。extfグリフは規格化されたときのuグリフ作成の準備作業でもあるのですが,extf-が符号化されたときには,4画草冠に作り直さないといけません。ただし書きをつけて面倒なことをしているので,私はこのただし書きは必要ないと考えます。しかし,現在のガイドラインですので,ガイドラインの文章にノートを参照するように加筆する他は,そのままにしておきます。
グリフの「編集内容の要約」記入方針
記憶に頼っているとぶれてしまうので,記入の(個人的)方針をまとめてみました。 --2014年12月19日(金) 23:54
- 大きな区分は,「修正」と「調整」です。客観的にあるべき字形に変更するときは「修正」,主観的に良いと思う字形に変更するときは「調整」。
- 「修正」に属するもの
- 「字体修正」。何等かの理由で元字と字体が違っているときに,元字の字体に変更する。
- 「字形修正」。同字体であるが,あるべき字形と違っているときに,あるべき字形に変更する(例:IVSで作り分けないといけない箇所が作り分けられていない。あるいは元字の意図と違う箇所を違いとしたため,意図がずれている)。
- 「関連字修正」。広く支持されている資料と合致するものに変更する。
- 「調整」に属するもの
- 「調整」。デザインの改良(と個人で思うもの)。他の人がそう思わないなかったら,さらに「調整」されるかもしれない。
- 「部品変更」。字形差を部品の違いで表したいときで,かならずしもデザイン改良が目的でない(部品を変更する「調整」を「部品変更」にしていることもある)。
- 「旧部品の更新」。最新版の部品を使用する。
- 「グリフ統合」。同じグリフにしても支障がないのに別々にグリフが作られているとき,1つのグリフにまとめる(編集前後のグリフを見ると「調整」か「部品変更」に見えますが,別の意図があるので別の表現)。
- 「関連字変更」。個人的により良いと思う関連字に変更する(資料に基づくこともある)。
- 「関連字設定」。個人的に良いと思う関連字を設定する(資料に基づくこともある)。
- 「字形修正」が誤解を招きやすいかもしれません。例えば,人足が上の横画につく,はなれるのような違いは細かすぎて無視したいところですが,それぞれの部品があれば,IVSのように細かく区別するグリフではきちんと元字にしたがう必要があります。しかし,「最近更新したページ」に表示されるグリフは小さくて,変更部分が判別できません。また,変更部分がわかっても,区別しようとした他のグリフが見えないと,変更の意図が伝わらずに「調整」のように思われてしまいます。
- 関連字関係の編集は,「修正」と「調整」を区別せず,「関連字変更」にまとめても支障はないかもしれません。
編集規準
番号 | 規準 | 根拠 | 例外事項 | 例外事項適用 | 備考 |
1 | CJK漢字は,楷書体を対象とする。 | | その他の書体にも符号位置が与えられる。 | | 2014年9月9日(火) 21:23制定 |
2 | jmjグリフは,対応するkosekiまたはjukiグリフ(エイリアスである場合は,それらの実体)のエイリアスとする。 | 文字情報基盤は,戸籍統一文字と住基統一文字を典拠とする。 | 区別すべき字形差が存在する場合。 | [注3] | 2014年9月9日(火) 21:23制定 |
3 | jukiグリフのうちMJ文字情報一覧表によりkosekiグリフに対応づけられたものは,kosekiグリフ(エイリアスである場合は,それの実体)のエイリアスとする。 | 戸籍統一文字の字形はWebで公開されているが,住基統一文字の仕様は非公開である。 | 区別すべき字形差が存在する場合。 | | 2014年9月9日(火) 21:23制定 |
4 | extdグリフのうち対応するkosekiグリフがあるものは,それ(エイリアスである場合はそれらの実体)のエイリアスとする。 | 戸籍統一文字の字形はWebで公開されている。 | | | 2014年9月9日(火) 21:23制定 |
5 | extfグリフでJソースのあるものは,対応するjmjグリフ(エイリアスである場合は,その実体)のエイリアスとする。 | 拡張F日本提案は,文字情報基盤を典拠としている。 | 区別すべき字形差が存在する場合 | | 2014年9月10日(水) 22:13制定 |
6 | extfグリフは,CJKExt.Fv1に基づき作成し,その後に資料の例示字形が変更された場合, (案1)適宜変更する。 (案2)最終段階で変更する。 (案3)変更しない。 | | | | 2014年9月10日(水) 22:13提案 |
7 | 「GlyphWiki:仮想J字形のガイドライン」で,UCSでJソースがある符号位置について「ただし、草冠は常に u8279を使い、 ufa5d、 ufa5eは使いません。」は疑問である。 | | ガイドラインにしたがう。 | | 2014年9月12日(金) 18:27 |
備忘録
エイリアスの作り方
例えば,グリフ名xxxxのエイリアスを作るには,グリフの編集画面でデータに
[[xxxx]]
を入力する。関連字は〓で良い。
命名の制約
()_は使えない。
IVD
Ken Lundeさんの
つぶやき 
によれば,Adobe-Japan1コレクションと対応するMoji_Johoコレクションは,Hanyo-Denshi 2010-11-14登録2,522字,HanyoーDenshi 2012-03-02登録1,394,Moji_Joho固有402字の合計4,318字。