Skip to content

Latest commit

 

History

History
53 lines (27 loc) · 2.52 KB

main.md

File metadata and controls

53 lines (27 loc) · 2.52 KB

人工言語人工文字界隈符号化文字群国際コンソーシアム

定義及び概念

前提事項

文字集合…コンピュータ上で文字を扱う為の文字群の集合体。unicode,TRON コード,Big5,など

地域字形…異体字のうち、地域ごとに異なるもの。旧字体,新字体,繁体字,簡体字,韓文漢字,香港字形,澳門字形,越南字形,など

異体字 ... 同一の文字に対する別の字体

地域字形問題 ... 地域字形をどの様にして文字集合に定義づけるのか、という問題。現状のところ未解決問題。既存の案は Han-unification(CJK 統合漢字)(unicode 式),直接配列方式(TRON 式)

コードポイント(符号点) ... 文字集合において、それぞれの文字を割り当てるための位置

マトリックス(行列) ... 数学におけるマトリックス(行列)と同様

マトリックスコードポイント(三次元行列方式符号点)

本式

マトリックスコードポイント(三次元行列方式符号点)は、新たな文字集合のコードポイントをマトリックス状に配列すること。従来形式のコードポイントと、地域字形の識別符号をそれぞれ行及び列に割り当てるものである。

漢字の地域字形問題に対する閃きから創成された。

以下のツイートが初出である。

マトリックスコードポイント!

— À la recherche des forces perdues : 和澄陽花 / 藍徽陽 (@Takuya_M_Somese) May 11, 2020

また、具体的事項の初公開は 語学言語学界隈凡人部 Discord サーバ において行われた。

同投稿先頭部

地域字形識別符号 ... 地域字形を

界(ドメイン) ...

劣式

本式から地域字形縛りを解いたもの。仕様・構造は本式に同じ。

地域字形識別符号の呼称が異体字識別符号に変化する。

分式

本式・劣式から異体字縛りを解いて同一文字体系占有率を減じ収容可能文字容量を増加させたるために用いたもの。

仕様及び構造

Unicode 使用可能空間

U4C 符号空間