古籍漢字字頻統(tǒng)計
作者:張軸才 整理日期:2021-12-15 08:16:07
本書的編寫源于五年前書同文公司向國家語委申請的古籍漢字信息處理攻關(guān)研究成果。該成果以ISO/IEC 10646 CJK標(biāo)準(zhǔn)與《康熙字典》字頭建立一一對應(yīng)作為字頻統(tǒng)計的基礎(chǔ)綱目,以《文淵閣四庫全書》和《四部叢刊》全文數(shù)碼數(shù)據(jù)作為統(tǒng)計對象(超過八億古籍漢字語料),最終得出每個漢字的字頻排序、出現(xiàn)次數(shù)、出現(xiàn)頻率,同時也揭示了中文古籍漢字用字量、用字臨界點等奧秘,使過去一直模糊不清的技術(shù)和應(yīng)用參數(shù)得到明確的驗證。 該書的成書發(fā)行將為海內(nèi)外古籍出版業(yè)者、中文數(shù)字化工程、中文信息處理工作者提供強有力的幫助以及權(quán)威性的理論和實用性依據(jù)。
|
若本书不能下载,请微信扫描右下角二维码 关注公众号“别院书香”,书友将给您分享本书。 若下载压缩包有密码,同样扫码关注,回复“解压密码”即可。
|