三文漢字數據
三文字是三文漢字數據的互聯網版.
《三文漢字數據》是由三個電腦數據所組成的:文獻,文物,文字。『文獻』儲藏現今二百多年關於文字的書籍和刊物, 如 字典, 辭典, 學術刊報。這些涵蓋文字現在的體際和資料。『文物』則收集有銘文的古代物件的資料用來記錄漢字已往幾千年字的體與義。『文字』則將前兩個數據的資料儲入以楷體漢字為單位的數據裏。這些資料包括 字音, 筆順, 字齡, 聯合碼, 異體字, 重要字典的頁碼, 相關詞 等。漢字在三四千年造字的過程中累積了很多重復字。《三文漢字數據》就列了十萬多字為異體字; 將同義的異體字放在一起方便用者核對
《三文漢字數據》現收十六多萬楷體漢字, 大多數是取自現今三百多年的文獻。最早參考的文獻是《玉篇》 (摛藻堂欽定四庫全書, 1779)。《玉篇》是顧野王 (公元543年) 所著的第一本以楷體為收字對象的字典。亦參考 《說文通訓定聲》(1850)。許慎的《説文解字》雖然是以隸書為體, 然而是最早 (公元121年) 分析字形和解析字義的大型字書。亦收三部不同年齡出版的《康煕字典》 (1784, 1900, 2003), 用來參考近年漢字字形的演變。《康煕字典》是近代自《説文解字》以來對漢字寫法,音讀和義訓之集大成作品
亦收錄十篇北魏至隋朝(公元508-612年)的墓誌銘拓本, 這是由隸變楷的轉接時期。
中國大陸現用的字形可見於現在收字最多的《中华字海》(2008。85,568字) 和《漢语大字典》(2018。 60,370字)。臺灣的《精編活用辭典》(2019) 則保存楷體傳統的字形。香港的《當代漢英詞典》(1972) 亦然。而《学研新漢和大字典》(2017) 有日本所創的漢字字體。電䐉和互聯網用的漢字是由 Unicode Corporation 管理, 現有九萬多字, 其不止包括中國漢字, 亦有日本,韓國和越南現在和以前用過的漢字
在現收錄的十六萬字裏,十萬多是列為異體字。資料除了由上述的字書所取錄之外,也輸入了《正字通》(1685) 和《漢語異體字大字典》(2018) 的全部異體字。
筆順, 即筆畫在字裏的次序, 是畫向序排字法極重要的環節。參考了大陸(《现代汉语通用字笔顺规范》1997;《新华写字字典》2010) 臺灣(《遠東漢字三千字典》2009; 《新編標準筆順字典》2017) 香港(《多功能漢字學習字典》2008) 和 日本 (《学研新漢和大字典》2017) 的筆順規律, 發覺是大同小異, 即『由左至右,由上而下, 先外後内才關門』。
拼音的資料是出自《康煕字典》(2003)。而粤音是取自於《同音字彙》(1979) 和《香港粵語大詞典》(2018)。
漢字楷體可分為三種, 第一種是現在用於台灣,香港和澳門的傳統楷體, 在此稱為『舊楷體』。第二種是《康熙字典:标点整理本》(2003) 所提議畫一傳統楷體的寫法, 在此稱為『新楷體』。第三種是現在用於大陸的簡體字, 在此稱為『簡楷體』。(例: 舊楷體=『
,
』; 新楷體=『
』; 簡楷體=『
』)。《三文漢字數據》是以新楷體為正體而其他為異體。異體亦可分為兩類, 一是同義不同體, 在此稱為異體字 (例: 針/鍼), 二是同字不同寫, 在此稱為異寫字 (例: 针/針)。
漢字是現今世界上唯一的表意文字。即從字的結構就可大概明白字的意義。許慎二千年前在《説文解字》裏已發表了六書的造字系統, 即『假借,轉注,象形,指事,會意,形聲』。假借與轉注準確來説是用字法, 其他四個是真正的造字法。 在這個每省每縣都有自己方言的中國, 而能『文遺百代則禮樂可知,驛宣萬里則心言可述』《玉篇, 顧野王》, 亦因此能使中國統一的, 應歸功這表意文字。相對來説歐州大陸是用表音的拉丁文為造字法, 即文字祇是用來表達語言的工具, 因此 造成現今歐州四分五列的局面。
在這無數語言的世界裏,祇有用表意制度才能造出一個國際文字。在互聯網上有稱為『繪文字』的程式 (Emoji), 是用圖畫來表達情感, 譬如
是表示困惑。由圖畫變為書寫方案, 漢字就有幾千年的經驗, 所以中國應與現在或以往有用方塊文字的國家 (如日本,韓國, 越南) 一起研究製造一個全新的, 以現代思維的國際表意文字, 這才是漢字應有的抱負
這個國際文字應稱為『表意字』(ideoword). 為發起這運動,在此提意五個表意字以資參考如下:
在此宣報:
漢字現在應走的道路可用『修齊治平』為總結。
修身: 從現今的文獻和以往的碑碣和出土文物, 記錄每個漢字的出處和字的異寫以便審查字義和字形的演變。
齊家: 搜集所有同義異體字, 選擇最合適的字來表達字義, 來減少漢字幾千年重複造字的沉澱。
治國: 建立一個公開透明的制度來解決現有的分歧使中國漢字回復統一。
平天下: 參與製造全新的國際表意文字。
三文漢字數據
畫向序排字法
畫向序
筆畫序
動作走向序
排字法
文字數據
找字鍵盤
畫向序找字法
813 字件
拼音找字
粤音找字
聯合碼找字
列其他字體
常用字表
資料篇
資訊頁
異體頁
字齡頁
相關詞頁
搜資料
文物數據
文獻數據
Abstract