簡介

「小學堂文字學資料庫」(Xiaoxuetang Wenzixue Database,簡稱Xiaoxuetang)是一個形、音、義綜合的文字學資料庫,可提供使用者根據文字的形、音等屬性先檢索出字頭,再透過字頭連接到個別的形、音、義資料庫或字書索引。

本資料庫由行政院國家科學委員會經費補助,臺灣大學中國文學系、中央研究院歷史語言研究所、資訊科學研究所、數位文化中心共同開發;臺灣大學整合聲韻資料,中央研究院整合字形資料及開發檢索系統。本資料庫目前由中央研究院數位文化中心維運

本資料庫收錄的字形涵蓋甲骨文、金文、戰國文字、小篆及楷書,總數超過22萬字;收錄的聲韻資料涵蓋上古、中古、近代及現代,總數超過134萬筆;收錄的字書索引資料則超過36萬筆。

本資料庫主要由漢字古今字資料庫及漢字古今音資料庫組成。漢字古今字資料庫由甲骨文、金文、戰國文字、小篆資料庫組成,而漢字古今音資料庫則由上古音、中古音、近代音、現代音資料庫組成,各資料庫除可互相連結外,也可獨立使用。

本資料庫是一個整合型的資料庫,期望能以單一查詢界面,透過檢索出的字頭,銜接網際網路上不同的形、音、義資料庫。目前銜接的資料庫包括教育部的異體字字典、中華開放古籍協會的「開放康熙字典」、「數位典藏與數位學習國家型科技計畫」的「國際電腦漢字與異體字知識庫」、香港中文大學人文電算研究中心的「漢語多功能字庫」。