前言(当当)
文信息处理技术,是我国特有的、利用计算机系统来处理中文信息的技术。 从最早发现的甲骨文到现在,中文已有三千多年的历史,可以说中文的历史就是中华民族灿烂文化的历史。目前,人类已经跨入21世纪,当前的社会是一个信息社会,是计算机科学、通信技术、Internet等众多先进技术和学科快速、普及发展的时代。作为当今世界上人口最多、国民经济快速发展的国家,怎样抓住机遇,大力发展信息技术,进一步提升我国的综合竞争力,缩小与发达国家的技术差距,已成为我国政府亟待解决的问题。面对如此众多的中文人口,要想在我国普及计算机信息系统,解决好中文信息的计算机处理问题是必要的基础和先导。 中文信息处理技术不仅涉及到计算机体系结构、操作系统、程序设计语言、数据库和网络通信技术,还涉及到语言文字学、语音学、词汇学、人工智能机器学习、文字识别技术、语音识别技术、排版印刷技术等,是一门多学科交叉的科学。 目前,中文信息的处理已经在很多方面取得了不小的进展,而且还在不断完善与发展,如汉字编码输入处理技术、汉字字形压缩与还原技术、光学汉字识别技术、中文文字与词语处理系统、汉字设备、中文通信系统、机器翻译系统、中西文兼容处理技术、电子排版印刷系统、办公自动化系统、Internet搜索引擎、智能检索系统等。 目前,不少高校已经开设了“中文信息处理技术”课程,但由于各种原因,有关“中文信息处理技术”课程的教材非常缺乏,特别是由于中文信息处理技术是伴随着计算机技术的发展而不断变化的,能够紧跟计算机技术的发展,反映最新研究和应用成果的专著或教材就更少了。笔者根据多年来从事“汉字信息处理”课程的教学实践、技术研究和实际应用开发的经验,编写了《中文信息处理技术——原理与应用》一书,一方面可作为大专院校的教材,另一方面可以满足从事计算机系统研究与开发的广大科研、工程技术人员的需要,供大家参考。 全书共七章:第1章中文信息处理技术概论,介绍信息处理的实质、汉字编码的种类与变换、汉字内码体系、Unicode与Unicode汉字、中西文兼容处理问题、中文信息处理系统五层结构模型等;第2章汉字编码输入原理,对汉字及汉字的属性进行深入地分析与刻画,介绍汉字编码输入方法的分类,给出汉字键盘码的笛卡