汉字
汉字(拼音拼音:Hànzì,注音符号:ㄏㄢˋㄗˋ),又称中文字、中国字、方块字,属于表意文字的词素音节文字。汉字是汉语的书写用文字,也被借用于书写日语、朝鲜语/韩语等语言,是汉字文化圈广泛使用的一种文字,也是目前世界上唯一仍被广泛使用的高度发展的语素文字。
中文名:汉字/漢字
外文名:ChineseCharacters(英文)/かんじ(假名)/한자(谚文)
所属学科:文字学
分类:语素文字
演变:上古-甲骨文-金文-隶书+楷书
官方文字:中国,新加坡,日本
使用简化字区:*,新加坡,马来西亚
使用繁体字区:港澳台地区及多数海外华人社区
最早出现历史:商代之前
拼音:hànzì
注音:ㄏㄢˋㄗˋ
历史使用地区:朝鲜、韩国、越南、蒙古等
子书写系统:假名、喃字、西夏文等
最早成熟系统:甲骨文
1、概述
广义的汉字指从甲骨文、大篆、金文、籀文、小篆,至隶书、草书、楷书(以及派生的行书)等的文字,狭义指以正楷作为标准写法的汉字,也是今日普遍使用的现代汉字。汉字为上古时代的华夏族人所发明创制并作改进,目前确切历史可追溯至约公元前1300年商朝的甲骨文、籀文、金文。再到秦朝的小篆,发展至汉朝隶变,至唐朝楷化为今日所用的手写字体标准—正楷。汉字是迄今为止连续使用时间最长的文字,也是上古时期各大文字体系中唯一传承至今的文字,中国历代皆以汉字为主要官方文字。汉字在古代已发展至高度完备的水准,不单中国使用,在很长时期内还充当东亚地区唯一的国际交流文字,20世纪前都是日本、朝鲜半岛、越南、琉球等国家官方的书面规范文字,东亚诸国都有一定程度地自行创制汉字。
2、简介
汉字是意音文字,不是拼音文字。是用表意体系的符号来表示汉语的词或语素的。
一个汉字通常表示汉语里的一个词或一个语素,这就形成了音、形、义统一的特点。汉字是由笔画构成的方块状字,所以又叫方块字。如“车”“上”“明”等,“车”“上”“明”用字的形体来直接表达语言里的词义;“问”既能表意又能表音,“门”表音,“口”表意。
汉字经过了几千年的演变,逐渐形成了“汉字七体”,即:甲骨文、金文、篆书、隶书、草书、楷书、行书。
名称·官话
-汉语拼音:Hànzì
-威妥玛拼音:Han4-tzu4
-注音符号:ㄏㄢˋㄗˋ
·闽语
-闽南语白话字:hàn-jī
-潮州话拼音:hang3ri7
·吴语
-上海话拼音:
·粤语
-粤拼hon3zi6
·赣语
-赣语白话字hon5ci5
·客家语
-客家话拼音hon55sii55
·中古汉语
-中古汉语xanCdz?C
历史
商周时期,通用的文字是甲骨文。这是最早的成熟而系统的汉字,为后世的汉字发展奠定了基础。之后流行的青铜铭文(金文)虽有字数的增加,但形体并无大的变化。
春秋以后,由于诸侯割据,“文字异形”。秦统一后,为巩固统治,始皇帝令丞相李斯、中车府令赵高、太史令胡毋敬等整理文字,以原秦国字为基础制定出小篆,作为标准字体,通令全国使用。稍后,普遍又依当时民间流行的字体,整理出更简便的字体隶书,并作为日用文字在全国广为流传。
曹魏时,钟繇创立真书(楷书)。至此汉字的演化已臻完善。不仅如此,自东汉末年,汉字的书写已成一种专门的艺术即书法。
中国史学界较普遍的一种说法是:中国文字源始于殷商。实际上,殷商时代的甲骨文已很成熟,在此之前,应该有一个从发生、发展到渐趋成熟的过程,因此有人主张推至夏末;也有人主张推至夏以前,各执己见。郭沫若在《古代文字之辩证的发展》指出:“汉字究竟源始于何时呢?我认为,这可以从西安半坡村遗址距今的年代为指标。”,“半坡遗址年代距今有六千年左右。”,“半坡遗址是新石器时代仰韶文化的典型”,“半坡彩陶上每每有一些类似文字的简单刻划,和器上的花纹判然不同。”“虽然刻划的意义至今尚未阐明,但无疑是具有文字性质的符号。”“可以肯定地说就是中国文字的起源,或者中国原始文字的孑(jié)遗。”如按此说,中国文明则应算成近六千年。中国文字之源始,究竟在何时?最古老的文字产生于什么时代?分别代表什么含义?至今仍未达成一致意见,有待于大量的材料来说明。
数量
汉字的数量并没有准确数字,大约将近十万个(北京国安咨讯设备公司汉字字库收入有出处汉字91251个),日常所使用的汉字只有几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字则已到99%,简体与繁体的统计结果相差不大。
关于汉字的数量,根据古代的字书和词书的记载,可以看出其发展情况。
秦代的《仓颉》、《博学》、《爰历》三篇共有3300字;汉代扬雄作《训纂篇》有5340字,到许慎作《说文解字》就有9353字了;据唐代封演《闻见记·文字篇》所记,晋吕忱作《字林》有12824字,后魏杨承庆作《字统》有13734字,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字;唐代孙强增字本《玉篇》有22561字。宋代司马光修《类篇》多至31319字,宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书;清代《康熙字典》有47000多字了;915年欧阳博存等编著的《中华大字典》有48000多字;1959年日本诸桥辙次主编的《大汉和辞典》有49964字;1971年张其昀主编的《中文大辞典》有49888字;1990年徐仲舒主编的《汉语大字典》有54678字;1994年冷玉龙等编著的《中华字海》有85000字。*地区教育主管机关编撰的《异体字字典》第五版,内容含正字与异体字,共106230字,是收录最多汉字的字典。
历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为异体字和罕用字。绝大多数异体字和罕用字已被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“二简字”,已被废除,但仍有少数字在社会上流行。
如果学习和使用汉字真的需要掌握七八万个汉字的音形义的话,那汉字将是世界上没人能够也没人愿意学习和使用的文字了。但是《中华字海》一类字书里收录的汉字绝大部分是“死字”,也就是历史上存在过而今天的书面语里已经废置不用的字。据统计,十三经(《易经》、《尚书》、《公羊传》、《论语》、《孟子》等13部典籍)全部字数为589283个字,其中不相同的单字字数为6544个字。因此,实际上人们在日常使用的汉字不过六千多而已。
在汉字计算机编码标准中,最大的汉字编码是*地区的CNS11643,5.0版全字库可供查询的字共87,047个汉字、10771个拼音文字及894个符号。台港民间通用的大五码收录繁体汉字13053个。GB18030是*现时最新的内码字集,GBK收录汉字简体、繁体及20912个,而早期的GB2312收录简体汉字6763个。Unicode的中日朝(韩)统一表意文字基本字集则收录汉字20902个,总数亦高达七万多字。
初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。汉字数量的过度增加又引发了汉字学习的困难,单一汉字能表示的意义有限,于是有许多单一的汉语意义是用汉语词语表示,例如常见的双字词。汉语书写的发展多朝向造新词而非造新字。殷墟的甲骨文更早、与汉字起源有关的出土资料。这些资料主要是指原始社会晚期及有史社会早期出现在陶器上面的刻画或彩绘符号,另外还包括少量的刻写在甲骨、玉器、石器等上面的符号。可以说,它们共同为解释汉字的起源提供了新的依据。
构造
汉字是“形、音、义”的结合体,大多数汉字是由形旁和声旁组成的。
六书是汉字构字的基本原理。在《周礼》中就提到了六书,只是没有说明具体内容。到了东汉,许慎在《说文解字》中,详细阐述了“六书”构造原理:象形、指事、会意、形声、转注、假借。
象形:这种造字法是依照物体的外貌特征来描绘出来,所谓“画成其物,随体诘诎”是也。如日、月、山、水等四个字,最早就是描绘日、月、山、水之图案,后来逐渐演化变成如今的造型。
瓜是一个象形字。“瓜”字中,两撇表示藤,中间竖钩表示瓜,捺表示叶。“葫芦科植物的统称”就是“瓜”的本义。“形状像瓜”,在现实生活中有很多东西像瓜形的,比如,“瓜皮帽”是帽子的一种;“瓜皮船”是船的一种。“像切瓜一样”,瓜的命运是要被切分的,由此引申出此义。人们用“瓜分”表示分割或分配。又指若干强国联合起来分割弱小或不发达国家的土地。“傻瓜”,表示不聪明,这一词来自古代的“瓜子族”,春秋时期生活在瓜州(甘肃敦煌一带)姜姓人被称为“瓜子族”,他们十分勤劳,受人雇佣时总是一刻不停地干活,可是有些人把他们这种老实的习俗看作“傻”,于是就有了“傻瓜”了。
指事:这是指表现抽象事情的方法,用象征的符号,或在象形字上加上符号来表示某个词。所谓“各指其事以为之”是也。如人在其上写作“上”,人在其下写作“下”,“刃”,在刀口上加一点,表示这里最锋利,这就是刀刃,等等。自大一点就是“臭”,“富”有田的人,“穷”靠用“力”打工,“贱”的繁体是“贱”,右边两个“戈”,为钱而争斗,自然是“贱”。
形声:就是文字内以特定形状(字根)表特有的音。例如胡。这个字也可为一个字根,结合不同的属性字根,可合成为:蝴、蝴、湖、葫、瑚、醐等等,而以同样的发音(也有的只有声母一样),表达不同的事物。形声是汉字里造字最多的方法和神韵。
形声字的形旁和声旁有四种组合方式:
左形右声:情、忆、哼、犷、构、描……
右形左声:期、战、鹦、鸠、领、飘……
上形下声:宇、笆、雾、草、景、符……
下形上声:盂、货、娶、基、裘、盒……
内形外声:闻、问、闷、瓣、辫、辩……
外形内声:园、囤、病、衷、阁、匣……
形占一角:疆、腾、栽、裁、载……
有些形声字,随着汉字的改革表音部分的读音有了变化,已经不起表音的作用了,如果再读半边就要闹笑话。“秀才识字读半边”又成了对“秀才”们读错字的讽刺。
会意:这种造字法,是用两个或几个字组成一个字,把这几个字的意义合成一个意义。如“日”和“月”组起来,就是日光加月光变成“明”。“人”字和“言”字合成“信”字,意思就是人过去所言有信,就是这个人很遵守自己说过的话,“休”,“人”和“木”合在一起,一个人靠在树上,表示休息。
有些会意字是两个或几个同样的字重叠组成的。二字重叠的多是左右的并列结构,三字重叠的多是塔型的上下结构,看起来像体操活动中的叠罗汉。例如三个“人”组成“众”;三个“火”组成“焱”;三个“木”组成“森”;三个“日”组成“晶”;三个“直”组成“矗”;三个“水”组成“淼”;三个“口”组成“品”等。
会意字由于字形的变化太大,已看不出它们的字源了。例如妇女的妇字,为什么在女旁加个歪山呢?正确的字源分析只能从繁体字“妇”中才能看出。这个“妇”字左边的“女”旁指妇女,女旁的“帚”是扫帚,前后合在一起的意思是妇女拿着扫帚在家里劳动。“女、帚为妇”和“力、田为男”是符合当时的“女内男外”、“男耕女织”的社会情况的。这类不容易看出字源的字相当多,人们叫作“破体字”。
“她”是现代汉语里常用的一个人称代词,专指第三者的女性。此字是古代“姐”字的异体,20世纪20年代由刘半农首先作为第三人称女性代词使用,并非新造字。
转注:这是用于两个字互为注释,彼此同义而不同形,汉代许慎解释道:“建类一首,同意相受,考、老是也。”这怎么说呢?此二字,古时“考”可作“长寿”讲,“老”、“考”相通,意义一致,即所谓老者考也,考者老也。《诗经·大雅·棫朴》亦云:“周王寿考”。
假借:此法简言之,就是借用一字,去表达别的事物。一般来说,有一个无法描述的新事物,就借用一个发音接近或是属性近似的字根,来表达这个新事物。例如“又”,本来是指右手(最早见于甲骨文),但后来被假借当作“也是”的意思。又如“闻”,本意是用耳朵听的意思,《大学》中就有“视而不见,听而不闻,食而不知其味”,后来被假借成嗅觉动词。
总结以上六书——前两项,“造字法”也;中两项,“组字法”也;后两项,“用字法”也。总而言之,以上原理是古代文字学学者们群策群力归纳出来的文字学理论,其所含的汉字构成法则,并非一人独创,是人们在使用过程中长期演化而成,是一代又一代集体智慧的结晶。
字形
汉字由表意象形字根,如金、木、水、火、土等,像积木一样组合而成。因形状方正,有“方块字”的别称,从结构上来看,汉字有以下特色:
规整的字体(如楷书、宋体、隶书、篆书等)书写下的汉字是一种方块字,每个字占据同样的空间。汉字包括独体字和合体字,独体字不能分割,如“文”、“中”等;合体字由基础部件组合构成,占了汉字的90%以上。合体字的常见组合方式有:上下结构,如“笑”、“尖”;左右结构,如“词”、“科”;半包围结构,如“同”、“趋”;全包围结构,如“团”、“回”;上中下结构,如“赢”;左中右结构,如“斑”;“品”字形结构,如“品”。汉字的基础部件包括独体字、偏旁部首和其他不成字部件。
汉字的最小构成单位是笔画,笔画也具有一定的含义,如横画(一),可表示地平线(如旦字中的一横)等。
书写汉字时,笔画的走向和出现的先后次序,即“笔顺”,是比较固定的。基本规则是,先横后竖,先撇后捺,从上到下,从左到右,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。
从字体上分,可将各类汉字的字体分为三大类型。第一类是从宋代活字印刷发展起来的宋体、黑体(包括粗、细等线体)等;第二类是由书法演变而来的字体,如楷体、仿宋体、行楷、隶体、魏体、舒体、颜体、瘦金体以及钢笔书写的字体等;第三类是属于美术字体,如综艺、美黑、琥珀、水柱等。其他字体多是属于以上三类字体的变异,例如:由宋体演变的大标宋、小标宋、报宋、长宋、中宋、姚体等;由黑体演变而成的大黑、平黑、粗黑、等线体(包括粗、中、细等线体,后又演变出粗、准、细圆体)等;由楷体、仿宋体等演变而来的中楷和细仿宋等;由黑体和宋体演变而来的美黑;由隶体演变而来的隶变体等。
笔画最少的汉字只有一划。有的字在书面上没有,只在民间流传“biang”是笔画较多的汉字,有56笔,异体字共有45笔,繁体字共有59笔。“biangbiang面”是源于陕西的一种面,也是一家面馆的品牌,还在使用这个字,流传不广,近几年方才流行,声称只能在康熙字典中查到“biang”字写法。事实上,在康熙字典中查不到“biang”字的写法。
关于biang,有一个字谜:
一点飞上天,黄河两道弯,八字大张口,言字往里走。
东一扭,西一扭。左一长,右一长,中间坐了个马大王。
心字底,月字旁,打个勾勾挂麻糖,
推个车车逛咸阳。
笔划最多的汉字
笔划最多的汉字
日文汉字有一个字有84画之多,日语读作“たいと”(Tai-To)。
注音
汉字是汉语的书写文字,每个字代表一个音节。*现今以普通话作为标准读音,普通话的音节由一个声母、一个韵母及声调确定,实际用到1300多个音节。由于汉字数目庞大,因而有明显的同音字现象;同时还有同一字多音的情形,称为多音字。这一情况在汉语各种方言中是普遍存在的。
汉字虽然以表意为主,但并非没有表音成分,最常见的是人名、地名,其次就是外来词的音译,比如沙发。此外,还有部分原有的表音词,如一命“呜呼”、“哈哈”大笑等。但即使如此,还是有一定表意成分,特别是该国国内的人名、地名。而即使是国外的人名、地名,也存在某些表意的底线,比如“Bush”绝不能音译成“不死”。
有学者经研究认为:汉朝之前,一个汉字发音为两个音节,次要音节和主要音节。由于汉字本身不表音,自汉朝到20世纪汉字在数量上、写法上虽有变迁,但无法看出发音的变化。必须进行专门的研究才能推测它们在上古汉语和中古汉语的发音。汉字在日语中的读音有“音读”和“训读”之分,往往一个字有很多读法,原因来自中国不同时期传入日本的发音。
除了日本以外,其他汉字使用地区也有使用了一些多音节的字,如“浬”(海里)、“嗧”(加仑)、“瓩”(千瓦)等。但是在大陆地区由于官方废除已基本不使用,*仍在使用,一般人也明了其意思。
最早的注音方法是读若法和直注法。读若法就是用音近的字来注音,许慎的《说文解字》就采用这种注音方法,如“埻,射臬也,读若准”。直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。
以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以起到注音的作用,例如“袜音韈”等。
魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以通过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的韵母及声调所拼成。
近代以来,又发展出了汉字形式的注音符号以及很多拉丁字母注音方法。注音符号仍是*地区教学的一部分,而目前*最为广泛使用的是汉语拼音。
由于汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度。例如“庞”从“龙”而得声,但今日北京话前者读“páng”,后者为“lóng”。如何解释这样的差异,就是音韵学所探讨的课题。需要注意的还有声调:阴平,阳平,上声,去声,轻声(元音āáǎàaōóǒòoēéěèeīíǐìiūúǔùuǖǘǚǜü)
词语
语素是汉文表意的最小单位,类比于英语的“词汇”和“词组”的总称。绝大多数汉字可以独立构成语素,比如“我”,类比于英语中的单一字母构成的词汇,比如“I”。现在白话文大多数词语都是由两个以上的汉字构成的,不过,和英语中“词汇”和“字母”的关系不同,语素的意思往往和其中各个汉字独立构成语素时的意思有相关性,因此相当程度上简化了记忆。词语包括语素和若干个语素形成的短语。
汉字的高效率,体现在几百个基本象形字,可以合成表示天上地下的各种事物的上万汉字;几千个常用字,又可以轻松组合出数十万词语。
偏旁
偏旁又叫部首,人们习惯合称偏旁部首。在汉字的结构中,偏旁是比笔画大的构字部件,是构成汉字的基本单位。如“坡”中的“皮”是表示读音的偏旁,“土”是表意的偏旁。
辞典
中国古代称“字书”,直到《康熙字典》问世才称“字典”。最早的汉语字典是东汉许慎编的《说文解字》。近代大致可分为两类,一类是综合性的,如《新华字典》;一类是专门性的,如《异体字字典》。1915年,中华书局出版了《中华大字典》。
世界三大汉语词典分别是*的《汉语大词典》(共13册,5.6万词条,37万单词)、中国*的《中文大辞典》(共10册,5万词条,40万单词)以及日本的《大汉和辞典》(共13册,4.9万词条,40万单词)。汉字是记录汉语的文字,它已有六千年左右的历史,是世界上最古老的文字之一。
“最中国”汉字“和”:2008年北京奥运会开幕式上,几百名演员扮演的活字印刷字模通过不断变幻,用大篆、小篆、楷书三种不同字体展现了同一个汉字――“和”。这一幕至今让人津津乐道,而这个包含“和谐”“和平”“和睦”等意义的汉字,再度被评选为“最中国”的汉字。最新一期的《中华遗产》杂志发布了该社组织的“100个最具中华文化意义的汉字”评选结果。“和”字赢得了网上投票的最高票数,也获得了*“*研究院”历史语言研究所研究员李贞德等专家的大力推荐。
3、起源
考古发现
中国考古界先后发布了一系列较殷墟甲骨文更早、与文字起源有关的出土资料。贾湖刻符经碳14物理测定,距今约7762年(±128年)历史;还有七千年前的双墩刻符、六千年前的半坡陶符、五千多年前青墩遗址刻符、连字成句的庄桥坟遗址文字、大汶口陶尊符号、尧舜时代的陶寺遗址朱文、夏墟的水书。早期的骨刻文就是丰富的文字系统,后期的属于初步成熟阶段。这些考古发现可能是汉字起源的重要线索,也可能是各种文字发展的不同源流。
20世纪80年代初,在河南登封夏文化遗址发掘出的陶器上,发现了更完备的文字。这是被学者们确认的迄今为止我国有确切时代的最早的文字。
旧说
从仓颉造字的古老传说到100多年前甲骨文的发现,历代中国学者一直致力于揭开汉字起源之谜。汉字起源的旧说法有五种,即结绳说、八卦说、河图洛书说、仓颉造字说和图画说。
结绳说:《北史·魏本纪》说:北朝魏的先世“射猎为业,淳朴为俗,简易为化;不为文字,刻木结绳而已。”记录了一些原始社会部落,在文字出现之前,以结绳记事的方法,把战争、猎获、会盟、选举、庆典、联姻、生育、疾病和灾害等大大小小的事件记录下来。
过去亦有学者据《周易·系辞下》“上古结绳而治,后世圣人易之以书契,百官以治,万民以察。”的论说,推断“文字起源于结绳”。
八卦说:孔安国《尚书》序(属伪作,但年代甚古)里说:“古者庖牺氏之王天下也,始画八卦,造书契,以代结绳之政,由是文籍生焉。”
河图说:《易·系辞上》:河出图,洛出书,圣人则之。《河图·玉版》:仓颉为帝,南巡狩,发阳虚之山,临于元扈洛之水,灵龟负书,丹甲青文,以授之。
揭开此说的神秘面纱,不难发现,它真实的核心就是算数,能对照“九宫”算法。所谓“九宫”,在谶纬家来说,是八卦加上*,合为九(“五”位于*,还可以和五行联系起来);在术数家眼中,则其数横、竖、斜偏、相加得数恒为15。
仓颉造字:传说仓颉是黄帝的史官,黄帝是古代中原部落联盟的领袖,由于社会进入较大规模的部落联盟阶段,联盟之间外交事务日益频繁,故迫切需要建立一套各盟联共享的交际符号,于是搜集及整理共享文字的工作便交在史官仓颉的手上了。
“仓颉造字说”在战国时即已流行。《吕氏春秋·君守》说:“仓颉作书,后稷作稼。”到了秦汉时代,这种传说更加盛行。许慎《说文解字·叙》:“仓颉之初作书,盖依类象形。”
现代学者认为,成系统的文字工具不可能完全由一个人创造出来,仓颉如果确有其人,应该是文字整理者或颁布者。
图画说:现代学者认为:汉字真正起源于原始图画。一些出土文物上刻划的图形,很可能与文字有渊源关系。
郑州大学博士生导师王蕴智认为:中国最早的刻划符号出现在河南舞阳贾湖遗址,距今已有8000多年的历史。对这些原始材料做一番全面的整理,从而爬梳排比出商代文字之前汉字发生、发展的一些头绪。然而情况并不那么简单,除了已有郑州商城遗址、小双桥遗址(该遗址先后发现10余例商代早期朱书陶文)的小宗材料可以直接和殷墟文字相比序之外,其它商以前的符号则零星分散,彼此缺环较多,大多数符号且与商代文字构形不合。还有一些符号地域色彩较重、背景复杂。
王蕴智认为,汉字体系的正式形成应该是在中原地区。汉字是独立起源的一种文字体系,不依存于任何一种外族文字而存在,但它的起源不是单一的,经过了多元的、长期的磨合,大概在进入夏纪年之际,先民们在广泛吸收、运用早期符号的经验基础上,创造性地发明了用来记录语言的文字符号系统,在那个时代,汉字体系较快地成熟起来。
据悉,从考古发掘的出土文字资料来看,中国至少在虞夏时期已经有了正式的文字,如考古工作者曾经在山西襄汾陶寺遗址所出的一件扁陶壶上,发现有毛笔朱书的“文”字。这些符号都属于早期文字系统中的基本构形,可惜这样的出土文字信息迄今仍然稀少。
大约在距今六千年的半坡遗址等仰韶文化遗址的陶器外壁,已经出现刻划符号,共达五十多种。它们整齐规划,并有一定规律性,具备简单文字的特征,可能是我国文字的萌芽。
在距今约四五千年的大汉口文化遗址晚期和良渚文化遗址的陶器上,发现有更整齐规则的图形刻划,是早期的图形文字。
4、演变
汉字后来的演变经历了几千年的漫长历程,经历了甲骨文、金文、篆书、隶书、楷书、草书、行书等阶段,至今普遍使用楷书,但仍未完全定型。
古文字阶段的汉字,汉代以前的文字。更具有形象性。
战国文字:“诸侯力政,不统于王,恶礼乐之害己而皆去其典籍。”“田畴异亩,车涂异轨,律令异法,衣冠异制,言语异声,文字异形。”具有很强的地域性。秦国文字是汉字发展的主流。六国文字,地域差异大,不反映汉字发展轨迹,是支流。
甲骨文
甲骨文主要指殷墟甲骨文,是中国商代后期(前14~前11世纪)王室用于占卜记事而刻(或写)在龟甲和兽骨上的文字。
发现有大约15万片甲骨,4500多个单字。这些甲骨文所记载的内容极为丰富,涉及到商代社会生活的诸多方面,不仅包括政治、军事、文化、社会习俗等内容,而且涉及天文、历法、医药等科学技术。从甲骨文已识别的约1500个单字来看,它已具备了“象形、会意、形声、指事、转注、假借”的造字方法,展现了中国文字的独特魅力。中国商代和西周早期(约公元前16~前10世纪)以龟甲、兽骨为载体的文献。
金文
金文是指铸刻在殷周青铜器上的文字,也叫钟鼎文。商周是青铜器的时代,青铜器的礼器以鼎为代表,乐器以钟为代表,“钟鼎”是青铜器的代名词。所以,钟鼎文或金文就是指铸在或刻在青铜器上的铭文。
所谓青铜,就是铜和锡的合金。中国在夏代就已进入青铜时代,铜的冶炼和铜器的制造十分发达。因为周以前把铜也叫金,所以铜器上的铭文就叫作“金文”或“吉金文字”;又因为这类铜器以钟鼎上的字数最多,所以过去又叫作“钟鼎文”。
金文应用的年代,上自商代的早期,下至秦灭六国,约1200多年。金文的字数,据容庚《金文编》记载,共计3722个,其中可以识别的字有2420个。
铜器上的铭文,字数多少不等。所记内容也很不相同。其主要内容大多是颂扬祖先及王侯们的功绩,同时也记录重大历史事件。如著名的毛公鼎有497个字,记事涉及面很宽,反映了当时的社会生活。
大篆
大篆起于西周晚年,春秋战国时期行于秦国。字体与秦篆相近,但字形的构形多重叠。代表为今存的石鼓文,以周宣王时的太史籀所书而得名。他在原有文字的基础上进行了改革,因刻于石鼓上而得名,是流传至今最早的刻石文字,为石刻之祖。
小篆
小篆也叫“秦篆”。秦朝李斯受命统一文字,这种文字就是小篆。通行于秦代。形体偏长,匀圆齐整,由大篆衍变而成。东汉许慎《说文解字·叙》称:“秦始皇帝初兼天下……罢其不与秦文合者。”李斯作《仓颉篇》,中车府令赵高作《爱历篇》,太史令胡毋敬作《博学篇》,“皆取史籀大篆,或颇省改,所谓小篆者也。”今存《琅琊台刻石》、《泰山刻石》残石,即小篆代表作。秦权上刻制的小篆,据说是李斯在秦始皇统一中国后,推行“书同文,车同轨”,统一度量衡的政策,由宰相李斯负责,在秦国原来使用的大篆籀文的基础上,进行简化,取消其他六国的异体字,创制的统一文字汉字书写形式。一直在中国流行到西汉末年,才逐渐被隶书所取代。但由于其字体优美,始终被书法家所青睐。又因为其笔画复杂,形式奇古,而且可以随意添加曲折,印章刻制上,尤其是需要防伪的官方印章,一直采用篆书,直到封建王朝覆灭,近代新防伪技术出现。康熙字典上对所有的字还注有小篆写法。
隶书
隶书基本是由篆书演化来的,主要将篆书圆转的笔划改为方折,书写速度更快,在木简上用漆写字很难画出圆转的笔划。
隶书也叫“隶字”、“古书”。是在篆书基础上,为适应书写便捷的需要产生的字体就小篆加以简化,又把小篆匀圆的线条变成平直方正的笔画,便于书写,分秦隶(古隶)和汉隶(今隶)。隶书的出现,是古代文字与书法的一大变革。隶书是汉字中常见的一种庄重的字体,书写效果略微宽扁,横画长而直画短,讲究“蚕头燕尾”、“一波三折”。它起源于秦朝,在东汉时期达到顶峰,书法界有“汉隶唐楷”之称。也有说法称隶书起源于战国时期。
隶书是相对于篆书而言的,隶书之名源于东汉。隶书的出现是中国文字的又一次大改革,使中国的书法艺术进入了一个新的境界,是汉字演变史上的一个转折点,奠定了楷书的基础。隶书结体扁平、工整、精巧。到东汉时,撇、捺等点画美化为向上挑起,轻重顿挫富有变化,具有书法艺术美。风格也趋多样化,极具艺术欣赏的价值。
隶书相传为秦未程邈在狱中所整理,去繁就简,字形变圆为方,笔划改曲为直。改"连笔"为"断笔",从线条向笔划,更便于书写。"隶人"不是囚犯,而指"胥吏",即掌管文书的小官吏,所以在古代,隶书被叫做"佐书"。隶书盛行于汉朝,成为主要书体。作为初创的秦隶,留有许多篆意,后不断发展加工。打破周秦以来的书写传统,逐步奠定了楷书的基础。在"罢黜百家,独尊儒术"的思想统一下,是汉代隶书逐步发展定型,成为占统治地位的书体,同时,派生出草书、楷书、行书各书体,为艺术奠定基础。
楷书
楷书又称正书,或真书,始于东汉。其特点是:形体方正,笔画平直,可作楷模,故名。楷书的名家很多,创造出许多有代表性的字体,如“欧体”(唐·欧阳询)、“虞体”(唐·虞世南)、“颜体”(唐·颜真卿)、“柳体”(唐·柳公权)、“赵体”(宋元·赵孟頫)等。初期楷书仍残留极少的隶笔,结体略宽,横画长而直画短。在传世的魏晋帖中,如锺繇的《宣示表》、《荐季直表》、王羲之的《乐毅论》《黄庭经》等,可为代表作。观其特点,正如翁方纲所说:“变隶书之波画,加以点啄挑,仍存古隶之横直”。
东晋以后,南北分裂,书法亦分为南北两派。北派书体,带著汉隶的遗型,笔法古拙劲正,而风格质朴方严,长于榜书,这就是所说的魏碑。南派书法,多疏放妍妙,长于尺牍。南北朝,因为地域差别,个人习性、书风迥然不同。北书刚强,南书蕴藉,各臻其妙,无分上下,而包世臣与康有为,却极力推崇两朝书,尤重北魏碑体。康氏举十美,以强调魏碑的优点。
唐代的楷书,亦如唐代国势的兴盛局面,真所谓空前。书体成熟,书家辈出,在楷书方面,唐初的虞世南、欧阳询、褚遂良、中唐的颜真卿、晚唐的柳公权,其楷书作品均为后世所重,奉为习字的模范。楷书为现代常用的标准。
草书
草书形成于汉代,是为书写简便在隶书基础上演变出来的。有章草、今草、狂草之分。草书为书写便捷而产生的一种字体。始于汉初。当时通用的是“草隶”,即潦草的隶书,后来逐渐发展,形成一种具有艺术价值的“章草”。汉末,张芝变革“章草”为“今草”,字的体势一笔而成。唐代张旭、怀素又发展为笔势连绵回绕,字形变化繁多的“狂草”。草书为书法家所常用。
章草笔划省变有章法可循。代表作如三国时期吴国皇象《急就章》的松江本。
今草不拘章法,笔势流畅。代表作如晋代王羲之《初月》、《得示》等帖。
狂草出现于唐代,以张旭、怀素为代表,笔势狂放不羁,成为完全脱离实用的艺术创作,从此草书只是书法家临摹的书法作品。代表作如张旭《肚痛帖》、怀素《自叙帖》。
行书
行书大约是在东汉末年产生的,是介于楷书、草书之间的一种字体,可以说是楷书的草化或草书的楷化。它是为了弥补楷书的书写速度太慢和草书的难于辨认而产生的。笔势不像草书那样潦草,也不要求楷书那样端正。楷法多于草法的叫“行楷”。草法多于楷法的叫“行草”。代表人物:“二王”:王羲之,王献之。
5、特点
汉字是世界上最古老的文字之一,对周边的影响也是非常巨大的,是其它文字的母字。它是记录事件的书写符号。在形体上逐渐由图形变为由笔画构成的方块形符号,所以汉字一般也叫“方块字”。它由象形文字(表形文字)演变成兼表音义的意音文字,但总的体系仍属表意文字。所以,汉字具有集形象、声音和辞义三者于一体的特性。这一特性在世界文字中是独一无二的,因此它具有独特的魅力。汉字是汉民族几千年文化的瑰宝,也是我们终生的良师益友,每个人的精神家园。汉字往往可以引起我们美妙而大胆的联想,给人美的享受。
汉字更是民族灵魂的纽带,在异国他乡谋生,汉字便是一种寄托,哪怕是一块牌匾、一纸小条,上面的方块字会像磁铁般地吸引着你,让你感受到来自祖国的亲切。因为那中国人的情思已经浓缩为那最简单的横竖撇捺。每一笔,都是饱蘸着华夏碧血写就的。在海外,无论你功成名就还是漂泊沦丧,只要有方块字的伴随,你就会有几多慰藉几多寄托,因为无论是象形还是指事,无论是会意还是形声,每一个字都有深远的来历,每一个中国人就是那一撇一捺,已经成为方块字的魂魄。
相较拼音文字的优点
当今世界上使用的文字中,汉字和水书属于非拼音文字。在人类的历史上,比汉字更早的文字有两河流域的楔形文字(钉头文字)和埃及的圣书文字,但是它们早已失传。世界各国使用的文字分为两大类,即非拼音文字(汉字和水书)及拼音文字(其他文字)。有人说汉字是中国五大发明,是一个奇迹。
现今文字中,汉字是从商朝开始使用并演变至今。梵文字母是创造宇宙之神大梵天所创造并授予人类(详见唐玄奘《大唐西域记》卷二的记载)其他文字很多都是借用四大字母系统的文字。婆罗米系列字母、拉丁字母、斯拉夫字母、阿拉伯字母被称为世界四大字母体系。印度、尼泊尔、孟加拉国、缅甸、老挝、泰国、柬埔寨、中国*地区用婆罗米系列字母。英文、法文、意大利文等使用拉丁字母;俄文、保加利亚文、塞尔维亚文等使用基里尔字母(或斯拉夫字母),是希腊字母改造而成的;拉丁字母也是希腊字母改造而形成的。阿拉伯字母的祖先——阿拉马字母(Aramaic)及希腊字母的祖先——迦南(Canaanite)字母也不是他们祖先直接创造的,而是借用了小方闪米特人(Semites)的文字(小方闪米特字母)改造而成的。这种字母借用了苏美尔人(Sume)的楔形文字,并经过改造而成的。楔形文字是苏美尔人创造的,圣书文字是埃及人创造的,汉字是中国人创造的,中国水族创造的水书,它们都不是拼音文字。四者之中只剩下汉字和水书,其他两者都已经消亡了。
汉语的另一个奇特之处是它的超方言特性及超语言特性。语言学家把中国各地的方言分为八大方言区。有人说,如果没有汉字,中国早就分裂成几十个国家了。欧洲的意大利语、法语、西班牙语、葡萄牙语和罗马尼亚语之间的差别比中国方言的差距小得多,但是他们绝不愿意承认各自的语言是“罗曼语”的不同方言,因为它们都是独立的国家。
汉字在世界历史上,作为其它后发明的文字的母字,如越南、朝鲜和日本都曾经用汉字来记录着它们的语言。日本人至今还使用汉字和假名的混合文字,使用汉字,还有另一项重大发明,就是写中国字,读日本词。只要其他国家愿意,他们也可以这样做。如果真是这样做了,汉字就成为国际通用的语言符号了,就像数学符号一样,只表意,不表音。
汉字是世界上使用人数最多的文字。据统计,使用汉字和汉语的人数达到16亿以上。
20世纪初叶,随着西方文化的传入,有人认为,中国之所以落后,汉字是罪魁祸首,主张将汉字废掉。到了20世纪后半叶,计算机科学急剧发展,又有些人认为汉字阻碍了科学的发展,方块字无法输入电脑,又有一阵要废除汉字的鼓躁。后来,这方面的问题解决了,质疑声也随之消散。
汉字是现在仍在使用的历史最悠久的文字。现在能看到而又能认读的最早的汉字是3000多年前的甲骨文。这已是相当成熟、相当系统的汉字了。世界上没有一种文字像汉字那样历尽沧桑,青春永驻。古埃及5000年前的圣书字是人类最早的文字之一。但它后来消亡了,有记载的古埃及文化也被深深地埋藏起来了。苏美尔人的楔形文字也有5000年的历史。但在公元330年后,它也消亡了。历史上衰亡的著名文字还有玛雅文、婆罗米文等等。而汉字不但久盛不衰,独矗世界文字之林,还不断地得以发展,影响也越来越大。
优美
它已成为一种艺术——书法艺术。汉字的书法艺术是任何其它文字所无法相比的。下列的古代书法作品已经成为无价之宝。著名的有兰亭序、神策军纪圣功德碑、玄秘塔碑、祭侄稿等无数作品。
辨识度高
人类的眼睛视野总是一个面,而不是一条线,所以线性排列不易辨认;排成方块一目了然。拼音文字=线形文字;汉字=方块文字。汉字比拼音文字有更高的阅读效率。
易懂,具有关联性
例如,“被”是一个形声字兼会意字。如果从形声字的角度来看,“被”字左边的“衣”字旁表示意义,说明被子是属于衣物一类,右边的“皮”字在造字的时代和“被”的读音相似,表示这个字的读音,但是随着时间的推移,“皮”和“被”的读音变得不一样了,逐渐失去了它表读音的功能。如果从会意字的角度来看,用皮做的衣物就是“被”。被的最初意义指的是一种小被子,到了后代,在被的本义基础上又引申出“蒙受”等意义。
形象,直观达意
汉字是象形文字,其显著的特点是字形和字义的联系非常密切,具有明显的直观性和表意性。汉字的表意性使汉字成为世界上单位字符信息量最大的文字,因此容易辨识,利于联想,这也为加快阅读速度带来极大的便利。
汉字有着区别于世界其他各种语言的根本特点,这就是汉语语法自身的特殊性即意合。无论是词组合成句子,还是单句组合成复句,首先考虑的因素往往是语意的配合,而不是语法形式的使用,只要几个负载着重要信息的关键词语在意义上大致搭配得拢,就能言简意赅地达到交际目的,这几个词就可以组合在一起,这就是所谓的“意合”。汉语语法的这一特点,使它结构独特,灵活多变,颇多隐含,着重意念,其意合性、灵活性和简约性是其它语言所不能比拟的。汉语语法的上述特点,有利于我们在阅读中运用意会的方式来进行感知和理解,这对于加快阅读速度就有极大的便利。
信息量大
研究表明:汉字作为一个复杂的文字符号系统,其信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值(平均信息量)是9.65比特。通过数理语言学中著名的齐普夫定律(ZIPF’SLAW)核算,这是当今世界上信息量最大的文字符号系统。
联合国五种工作语言文字的信息熵的比较如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。
汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆0-9,10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9表,二进制只需要学会与、或、非的简单逻辑。但是,人类在日常生活中为什么不使用二进制数字系统呢?因为那样很浪费,一个数字“7”表示成二进制就成了“111”,记个大数不把人累死?反过来,人类为什么不用十六进制,或更高的进制呢?一方面是人脑智力的限制,另一方面,十六进制也未必能大幅度提高信息熵。这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。这就是汉字字符集信息熵高的优势。
汉字的以上五个方面的特点,无疑会使其在阅读心理方面较拼音文字具有相当大的优势,使汉字的书面语在感知、理解的各个方面都有较高的速度和效率,能够实现阅读速度、理解速度、记忆速度的协调发展,快速阅读,也是中国为何能崛起的天然因素,汉语不失,华夏永存。
计算机输入
中文信息处理由于打字机键盘在设计时本身没有考虑汉字输入的问题,输入汉字往往比输入拼音文字困难。由于英文是由26个字母排列组合而成的文字,因此可以简化输入步骤;相比较之下汉字则不能如此,从字形上虽然可以拆解成不同的部分,但是被分成的部首或偏旁数量多,这样不但不能达到简化输入的目的,反而显得更为繁琐,于是从汉字字音上去考虑汉字输入被分成少量的语音元素组合排列,这样可以达到简化输入的步骤。由于是语音输入对汉字的读音必须清楚,某些生僻字或不知道汉字发音的则会很困难,这在一定程度上限制了汉字的输入。汉字没有经过中文打字机的普及,直接进入了电脑中文信息处理阶段。在电脑发明初期曾引起汉字能否适应电脑时代的问题,支持汉字拉丁化的学者甚至以此为理据。
随着各种中文输入法的出现,汉字的计算机输入、存储、输出技术得到了基本解决,大大提高了中文写作、出版、信息检索等的效率。中文输入法有上千种之多,主要包括表音输入和表形输入两类(即五笔和拼音),也有两者兼之的。汉字的语音输入、手写识别和光学字符识别(OCR)技术也已得到广泛应用。
如收录数千字的GB2312(*),Big5及CNS11643(*),HKSCS(香港),JIS(日本),以及收录两万多字的GBK(*),国外标准Unicode,ISO10646等等。在这个过程中,因为技术及其他种种因素,在收录字数,及收录字体等方面或做不同层次的调整。
中国*为了解决邮政,户籍整理等领域用字的迫切需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB18030-2000,共收汉字27484个。并强制所有在*地区售卖的计算机产品必须使用这个新官方标准。
汉字编码系统为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。
国标码(“国标”是*国家标准的简称)在*使用。GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。
BIG5码。收录13053个汉字。在*和香港使用的一字节或两字节编码。
Unicode并不被大陆很好地接受。*要求在大陆出售的软件必须支持GB18030编码。
在国际通信化和软件设计领域,CJK编码除了收集了中文,还有日本汉字、韩国汉字的汉字集。
6、影响
中国发现的最早的成熟文字,曾认为是甲骨文。就所见的殷商文字资料来说,文字载体的门类已经很多。当时的文字除了用毛笔书写在简册上之外,其他的主要手段就是刻写在龟甲兽骨、陶器、玉石上以及陶铸在青铜器上。商代文字资料以殷墟卜用甲骨和青铜礼器为主要载体,有一千多字,只是商代文字的部分保留,名甲骨文,特有学科——甲骨学。
对日本文字的影响
日本民族虽有着古老的文化,但其本族文字的创制则相当晚。长期以来,其人民是以汉字作为自己传播思想、表达情感的载体,称汉字为“真名”。五世纪初,日本出现被称为“假名”的借用汉字的标音文字。八世纪时,以汉字标记日本语音的用法已较固定,其标志是《万叶集》的编定,故称“万叶假名”。是为纯粹日语标音文字的基础。日本文字的最终创制是由吉备真备和弘法大师(空海)来完成的。他们俩人均曾长期留居中国唐朝,对汉字有很深的研究。前者根据标音汉字楷体偏旁造成日文“片假名”,后者采用汉字草体创造日文“平假名”。尽管自十世纪起,假名文字已在日本盛行,但汉字的使用却并未因此而废止。时至今天,已在世界占据重要地位的日本文字仍保留有一千多个简体汉字。其中,在2010年重新制定并公布的日语常用汉字表中,共收录了2136个汉字。
对朝鲜(韩国)文字的影响
中国古代的制度和文化一直影响着朝鲜,因此朝鲜把本民族文字称谚文(非正式文字)。谚文的创制和应用是古代韩国文化的一项重要成就,但是20世纪前却并没有得到大范围应用。实际上,早起时期的韩国亦如日本没有自己的文字,而是使用汉字。新罗统一后稍有改观,时人薛聪曾创造吏读,即用汉字表示韩语的助词和助动词,辅助阅读汉文书籍。终因言文各异,无法普及。李朝初期设谚文局,令郑麟趾、成三问等人制定谚文。他们依中国音韵,研究朝鲜语音,创造出11个母音字母和17个子音字母,并于公元1443年公布使用《训民正音》。朝鲜从此有了自己的文字,但不久又再度废止。二战后,韩国因“去汉化”政策,再次加以使用,朝鲜亦同。但是由于韩文拼音文字的同声字太多,书写后分辨不清的情况多,谚文的发展受到挑战。
对越南文字的影响
十世纪以前的越南是中国的郡县。秦、汉、隋、唐莫不在此设官统辖,故受中国文化的影响较深。越南独立后,无论是上层人士的交往,还是学校教育以及文学作品的创作,均以汉字为工具。直至十三世纪,越南才有本国文字——字喃。字喃是以汉字为基础,用形声、假借、会意等方法创制的表达越南语音的新字。十五世纪时,字喃通行全国,完全取代了汉字(少数人还在用汉字)。但是现代越南文字多受西方文字影响,完全使用拼音文字。
7、民俗
射虎:即猜灯谜,也叫打灯虎,与汉字有着密切关系。旧时的射虎大致可以分成两类,一类是文人射虎,谜面深奥,谜格复杂多样,谜底多为四书五经中的原句;一类是市井灯谜,谜面谜底均较通俗。射虎是元宵节的一项重要活动。