文 Article > 丛中笑 Cong Zhongxiao
汉字是世界上最古老的文字之一,从古至今一脉相承,记录、传承和传播着延绵数千年的中华文化,沟通着你我的工作生活。特别是在当今互联网无处不在、信息传播飞速发展的时代,我们每天用电脑敲击键盘工作学习,用智能手机录入文字沟通彼此,或打开墨香悠然的书刊报纸汲取知识。你可曾想过,那些跃然于屏幕或纸上的汉字是如何而来,汉字和英文字母在计算机处理过程中曾有着怎样的天然鸿沟,甚至面临被计算机抛弃的危局。
使古老的汉字跨 越数字鸿沟、在计算机时代自由驰骋的,正是我国著名科学家王选。上世纪70年代中期开始,他带领北京大学科研团队,在国家“748工程”有关部门的组织和支持下,开拓创新,艰苦攻关,成功研制汉字 信息处理与激光照排系统,攻克了汉字在计算机中的存储、处理和输出等难关,掀起了中国印刷业“告别铅与火、迎来光与电”的技术革命,成为我国自主创新和用高新技术改造传统行业的时代典范,并为汉字的计算机信息技术处理及应用奠定了重要基础,为中华文明在信息时代的传承与发展提供了保障。正如习近平总书记指出的那样:“汉字是中华文明的重要标志,也是传承中华文明的重要载体。上个世纪8 0年代汉字激光照排系统问世,使汉字焕发出新的生机和活力。”
20世纪70年代,随着计算机技术的发展,西方率先采用了“电子照排技术”进行出版印刷,而当时的中国仍然是“以火熔铅,以铅铸字,以铅字排版,以铅版印刷”的铅排印刷,能耗大,污染严重,效率很低。更重要的是,如何处理庞大的汉字信息成为中外科学家面临的巨大难题。有人甚至主张:“计算机是方块汉字的掘墓人,也是汉语拼音文字的助产士”“要想跟上信息时代的步伐,必须要走汉语拼音化的道路”。
> 1981年,汉字激光照排系统原理性样机通过部级鉴定
为了改变这一落后面貌,1974年8月,在周恩来总理的关怀下,我国设立了国家重点科技攻关项目“汉字信息处理系统工程”,简称“748工程”,组织研发汉字信息处理问题。日、英、美等国家的科学家也纷纷开始研究。然而,最难的一步,是让印刷体的汉字进入计算机,中外科学家尝试了许多方法,都没能彻底突破这一难关。
1975年,38岁的北京大学无线电系教师王选,从北大数学系任教的妻子陈堃𨱇那里,听说了“748工程”,被其难度和巨大价值强烈吸引,以狂热的科研激情投身研究。
当时我国已有五家科研团队从事汉字照排系统的研究,在汉字信息存储方面采取的都是模拟存储方式,输出方案选择的则是国际流行的二代机或三代机。王选经过仔细调查研究,做出了异于常人的方向判断和跨越式大胆技术决策:模拟存储没有前途,应采用“数字存储”方式将汉字信息存储在计算机内;跨过当时流行的二代机和三代机,直接研制世界上尚无商品的第四代激光照排系统。
> 20世纪70年代我国小型铅印厂一角
“数字存储”,就是把每个字的字形变成由许多小点组成的点阵,每个点对应着计算机里的一位二进位信息,有笔画覆盖的小方格记为1,没有笔画覆盖的小方格记为0。这样,组成汉字的全部小方格,就被处理成了由0和1信号组成的数字化字模。用计算机排版,必须把全部汉字的数字化字模存放在计算机里,供各种报纸、书刊排版使用。很显然,方格划得越细越密,字形才越逼真,也才能符合印刷质量的要求。报纸上常用的是五号字,一个五号字大约需要划分为96×96=9216个方格,也就是要近一万个0、1信号组成的点阵。
然而,与西文相比,汉字不但字数繁多,还有十余种字体,20多种大小不同的字号,如果全部用数字点阵方式存储进计算机,信息量高达几百亿甚至上千亿字节,即数千兆。当时我国国产的DJS130计算机,存储量不到7兆,英美等国的计算机存储量也只有几十兆,根本无法存储。王选大胆进行颠覆性创新,用数学和软、硬件方法双管齐下,实现了汉字信息处理的核心技术突破:对于撇、捺、点、勾等不规则笔画,在笔画的轮廓上选取合适的关键点,用直线相连成折线来代表汉字的轮廓曲线;对横、竖、折等规则笔画,则采用参数方法来描述它们的长、宽、起笔和收笔的笔锋,并在坐标纸上对起始位置进行标注,以此完整地确定其形状和位置,还可以很好地控制笔画在变倍时的质量,这样只需要存储一两种有代表性的字号,然后通过放大或缩小,就可以产生出其他各种字号。通过这种“轮廓加参数”的“高倍率汉字字形信息压缩技术”,使汉字字形信息量压缩约500-1000倍,把数千兆汉字信息压缩成几兆,顺利存进了计算机。其中用“参数信息来控制字形变化时的质量”这一高招,在1975年是世界首创,获得了我国首个欧洲专利。直到大约10年以后,类似的用“提示信息”(即HINT)描述字形的技术才在西方流行。
> 748工程申请报告和批复文件(1974年8月)
此后,王选又发明了“高速不失真的汉字字形信息复原技术”,并设计出加速字形复原的超大规模专用芯片,使被压缩的汉字字形信息以710字/秒的速度高速复原,居世界首位,并具 有强大的字形变化功能。以此为基础,王选设计了汉字激光照排系统的核心——照排控制器(后来称为栅格图像处理器,英文简称RIP),由它生成汉字字形信息和控制激光照排机,在遇到计算机中有笔画的格“1”时发射激光,在胶片或印刷版材上感光成字,然后制版印刷。
由于王选的技术过于超前,遭到了许多质疑,说他“玩弄骗人的数学游戏”,有的讽刺说:“你搞第四代,我还要搞第八代呢!”但王选坚信自己的技术是正确的,他带领团队克服重重难关,在1979年7月27日,用汉字激光照排系统输出了第一张报纸样张《汉字信息处理》;1980年9月15日,又成功地排出了第一本样书《伍豪之剑》。北京大学把样书呈送中共中央政治局,方毅副总理于1980年10月20日批示:“这是可喜的成就,印刷术从火与铅的时代,过渡到计算机与激光的时代,建议予以支持。”10月25日,邓小平同志批示:“应加支持”。1981年7月,汉字激光照排原理性样机通过了部级鉴定,实现了从技术方案到样机的实质性过渡。
有人劝王选,“现在已经证明你的科研原理正确,你是有能力的,应该做更多其他研究”。王选却说,“我不能拿了国家的钱,只是做了一个试验”。他提出了“顶天立地”的产学研结合之道:“顶天”即不断追求技术上的新突破,“立地”即把技术商品化,并大量推广、应用。
> 1985年,激光照排系统在新华社投入实用。这是王选和技术人员查看用系统排印出的《新华社新闻稿》
这是一个十分艰苦、“九死一生”的过程。1984年王选团队研制成功华光Ⅱ型系统,开始在新华社进行中间试验。当时正值引进高潮袭来,美、英、日等国照排机厂商大举来华,用户和业内人士纷纷购买国外产品,国产系统由于问题不断,频频遭遇冷嘲热讽。王选顶着压力,挤公共汽车往返于北大和新华社之间,带领科研团队解决了一个又一个技术难题,最终使系统达到了实用要求。1985年5月,“华光Ⅱ型计算机—激光汉字编辑排版系统”通过国家经委主持的国家级鉴定和新华社用户验收,成为我国第一个实用照排系统。
要使系统达到最高水平,必须能顺利排印大报、日报。王选和同事们不断创新,又研制成功了Ⅲ型、Ⅳ型系统,与《经济日报》印刷厂进行合作,在全国报社中第一个勇尝“螃蟹”。期间系统问题一度层出不穷。报社一边登报致歉,一边发出最后通牒:必须在10天内排除故障,顺利出报,否则退回到铅排作业!王选与科研团队紧密协调,昼夜改进,终于在规定时间内实现了稳定出报。1988年,经济日报卖掉了所有铅字,在全国首家告别“铅与火”,使汉字激光照排系统实现了从实用化到产品化进程的关键冲刺。
1989年,《人民日报》花费430万美元,引进了美国HTS公司的照排系统,美方却因解决不了汉字信息处理的难题,致使系统迟迟不能使用。王选带领北大科研团队,在原电子部的主持下与该报社签订了技术改造协议,半年不到就将系统改造成功投入了使用。紧接着,来华销售的英国、日本等其他国外厂商也因解决不了汉字信息处理的技术难关,最终全部被国产系统取代,退出了中国市场。
> 王选查看用激光照排系统输出的报纸胶片(1991年摄)
此后,王选带领青年骨干不断创新,在“告别铅与火”后,又实现了“告别报纸传真机”“告别电子分色机”“告别纸与笔”“告别胶片”等一次次新闻出版领域的技术跨越,使我国延续上百年的铅字印刷行业得到彻底改造,形成了全新的电子出版和数字出版产业,开创了一条创新驱动发展的成功之路。西方从1946年发明第一代手动式照排机,花了40年时间,到1986年才开始推广第四代激光照排机。王选1976年提出直接研制第四代激光照排系统,不断发明一系列原创技术并实现成果转化,到1987年投产使用,一步跨越了40年。
从1974年到1994年的20年间,“748工程”不仅开创了我国印刷技术革命的新纪元,而且带动了中文计算机信息技术的全面发展,在开拓汉字信息处理技术及建立相关产业、开创计算机信息技术及应用、造就人才队伍等方面取得了令人瞩目的成就,是我国信息化和工业化建设相结合的成功探索与实践。
2001年,中国工程院颁发“二十世纪我国重大工程技术成就”评选结果,“汉字信息处理与印刷革命”入选第二位,与名列第一的“两弹一星”仅差一票。王选也因此荣获2001年度国家最高科学技术奖、“改革先锋”“最美奋斗者”等荣誉。
> 我国用汉字激光照排系统排印的首张报纸样张(1979.7.1排版,7.27正式输出)
斯人已逝,精神长存。王选身上体现出的百折不挠、勇于创新、顶天立地、协作攻关等品格风范,为我们树立了光辉的时代典范。(编辑:九月)
(作者丛中笑系北京大学王选计算机研究所副研究员,王选纪念室主任,兼任中国印刷技术协会印刷文化研究委员会副主任委员)