王選與「748工程」

2023-03-10     《藝術與設計》雜誌

原標題:王選與「748工程」

文 Article > 叢中笑 Cong Zhongxiao

漢字是世界上最古老的文字之一,從古至今一脈相承,記錄、傳承和傳播著延綿數千年的中華文化,溝通著你我的工作生活。特別是在當今網際網路無處不在、信息傳播飛速發展的時代,我們每天用電腦敲擊鍵盤工作學習,用智慧型手機錄入文字溝通彼此,或打開墨香悠然的書刊報紙汲取知識。你可曾想過,那些躍然於螢幕或紙上的漢字是如何而來,漢字和英文字母在計算機處理過程中曾有著怎樣的天然鴻溝,甚至面臨被計算機拋棄的危局。

使古老的漢字跨 越數字鴻溝、在計算機時代自由馳騁的,正是我國著名科學家王選。上世紀70年代中期開始,他帶領北京大學科研團隊,在國家「748工程」有關部門的組織和支持下,開拓創新,艱苦攻關,成功研製漢字 信息處理與雷射照排系統,攻克了漢字在計算機中的存儲、處理和輸出等難關,掀起了中國印刷業「告別鉛與火、迎來光與電」的技術革命,成為我國自主創新和用高新技術改造傳統行業的時代典範,並為漢字的計算機信息技術處理及應用奠定了重要基礎,為中華文明在信息時代的傳承與發展提供了保障。正如習近平總書記指出的那樣:「漢字是中華文明的重要標誌,也是傳承中華文明的重要載體。上個世紀8 0年代漢字雷射照排系統問世,使漢字煥發出新的生機和活力。」

20世紀70年代,隨著計算機技術的發展,西方率先採用了「電子照排技術」進行出版印刷,而當時的中國仍然是「以火熔鉛,以鉛鑄字,以鉛字排版,以鉛版印刷」的鉛排印刷,能耗大,污染嚴重,效率很低。更重要的是,如何處理龐大的漢字信息成為中外科學家面臨的巨大難題。有人甚至主張:「計算機是方塊漢字的掘墓人,也是漢語拼音文字的助產士」「要想跟上信息時代的步伐,必須要走漢語拼音化的道路」。

> 1981年,漢字雷射照排系統原理性樣機通過部級鑑定

為了改變這一落後面貌,1974年8月,在周恩來總理的關懷下,我國設立了國家重點科技攻關項目「漢字信息處理系統工程」,簡稱「748工程」,組織研發漢字信息處理問題。日、英、美等國家的科學家也紛紛開始研究。然而,最難的一步,是讓印刷體的漢字進入計算機,中外科學家嘗試了許多方法,都沒能徹底突破這一難關。

1975年,38歲的北京大學無線電系教師王選,從北大數學系任教的妻子陳堃銶那裡,聽說了「748工程」,被其難度和巨大價值強烈吸引,以狂熱的科研激情投身研究。

當時我國已有五家科研團隊從事漢字照排系統的研究,在漢字信息存儲方面採取的都是模擬存儲方式,輸出方案選擇的則是國際流行的二代機或三代機。王選經過仔細調查研究,做出了異於常人的方向判斷和跨越式大膽技術決策:模擬存儲沒有前途,應採用「數字存儲」方式將漢字信息存儲在計算機內;跨過當時流行的二代機和三代機,直接研製世界上尚無商品的第四代雷射照排系統。

> 20世紀70年代我國小型鉛印廠一角

「數字存儲」,就是把每個字的字形變成由許多小點組成的點陣,每個點對應著計算機里的一位二進位信息,有筆畫覆蓋的小方格記為1,沒有筆畫覆蓋的小方格記為0。這樣,組成漢字的全部小方格,就被處理成了由0和1信號組成的數字化字模。用計算機排版,必須把全部漢字的數字化字模存放在計算機里,供各種報紙、書刊排版使用。很顯然,方格劃得越細越密,字形才越逼真,也才能符合印刷質量的要求。報紙上常用的是五號字,一個五號字大約需要劃分為96×96=9216個方格,也就是要近一萬個0、1信號組成的點陣。

然而,與西文相比,漢字不但字數繁多,還有十餘種字體,20多種大小不同的字號,如果全部用數字點陣方式存儲進計算機,信息量高達幾百億甚至上千億位元組,即數千兆。當時我國國產的DJS130計算機,存儲量不到7兆,英美等國的計算機存儲量也只有幾十兆,根本無法存儲。王選大膽進行顛覆性創新,用數學和軟、硬體方法雙管齊下,實現了漢字信息處理的核心技術突破:對於撇、捺、點、勾等不規則筆畫,在筆畫的輪廓上選取合適的關鍵點,用直線相連成折線來代表漢字的輪廓曲線;對橫、豎、折等規則筆畫,則採用參數方法來描述它們的長、寬、起筆和收筆的筆鋒,並在坐標紙上對起始位置進行標註,以此完整地確定其形狀和位置,還可以很好地控制筆畫在變倍時的質量,這樣只需要存儲一兩種有代表性的字號,然後通過放大或縮小,就可以產生出其他各種字號。通過這種「輪廓加參數」的「高倍率漢字字形信息壓縮技術」,使漢字字形信息量壓縮約500-1000倍,把數千兆漢字信息壓縮成幾兆,順利存進了計算機。其中用「參數信息來控制字形變化時的質量」這一高招,在1975年是世界首創,獲得了我國首個歐洲專利。直到大約10年以後,類似的用「提示信息」(即HINT)描述字形的技術才在西方流行。

> 748工程申請報告和批覆文件(1974年8月)

此後,王選又發明了「高速不失真的漢字字形信息復原技術」,並設計出加速字形復原的超大規模專用晶片,使被壓縮的漢字字形信息以710字/秒的速度高速復原,居世界首位,並具 有強大的字形變化功能。以此為基礎,王選設計了漢字雷射照排系統的核心——照排控制器(後來稱為柵格圖像處理器,英文簡稱RIP),由它生成漢字字形信息和控制雷射照排機,在遇到計算機中有筆畫的格「1」時發射雷射,在膠片或印刷版材上感光成字,然後製版印刷。

由於王選的技術過於超前,遭到了許多質疑,說他「玩弄騙人的數學遊戲」,有的諷刺說:「你搞第四代,我還要搞第八代呢!」但王選堅信自己的技術是正確的,他帶領團隊克服重重難關,在1979年7月27日,用漢字雷射照排系統輸出了第一張報紙樣張《漢字信息處理》;1980年9月15日,又成功地排出了第一本樣書《伍豪之劍》。北京大學把樣書呈送中共中央政治局,方毅副總理於1980年10月20日批示:「這是可喜的成就,印刷術從火與鉛的時代,過渡到計算機與雷射的時代,建議予以支持。」10月25日,鄧小平同志批示:「應加支持」。1981年7月,漢字雷射照排原理性樣機通過了部級鑑定,實現了從技術方案到樣機的實質性過渡。

有人勸王選,「現在已經證明你的科研原理正確,你是有能力的,應該做更多其他研究」。王選卻說,「我不能拿了國家的錢,只是做了一個試驗」。他提出了「頂天立地」的產學研結合之道:「頂天」即不斷追求技術上的新突破,「立地」即把技術商品化,並大量推廣、應用。

> 1985年,雷射照排系統在新華社投入實用。這是王選和技術人員查看用系統排印出的《新華社新聞稿》

這是一個十分艱苦、「九死一生」的過程。1984年王選團隊研製成功華光Ⅱ型系統,開始在新華社進行中間試驗。當時正值引進高潮襲來,美、英、日等國照排機廠商大舉來華,用戶和業內人士紛紛購買國外產品,國產系統由於問題不斷,頻頻遭遇冷嘲熱諷。王選頂著壓力,擠公共汽車往返於北大和新華社之間,帶領科研團隊解決了一個又一個技術難題,最終使系統達到了實用要求。1985年5月,「華光Ⅱ型計算機—雷射漢字編輯排版系統」通過國家經委主持的國家級鑑定和新華社用戶驗收,成為我國第一個實用照排系統。

要使系統達到最高水平,必須能順利排印大報、日報。王選和同事們不斷創新,又研製成功了Ⅲ型、Ⅳ型系統,與《經濟日報》印刷廠進行合作,在全國報社中第一個勇嘗「螃蟹」。期間系統問題一度層出不窮。報社一邊登報致歉,一邊發出最後通牒:必須在10天內排除故障,順利出報,否則退回到鉛排作業!王選與科研團隊緊密協調,晝夜改進,終於在規定時間內實現了穩定出報。1988年,經濟日報賣掉了所有鉛字,在全國首家告別「鉛與火」,使漢字雷射照排系統實現了從實用化到產品化進程的關鍵衝刺。

1989年,《人民日報》花費430萬美元,引進了美國HTS公司的照排系統,美方卻因解決不了漢字信息處理的難題,致使系統遲遲不能使用。王選帶領北大科研團隊,在原電子部的主持下與該報社簽訂了技術改造協議,半年不到就將系統改造成功投入了使用。緊接著,來華銷售的英國、日本等其他國外廠商也因解決不了漢字信息處理的技術難關,最終全部被國產系統取代,退出了中國市場。

> 王選查看用雷射照排系統輸出的報紙膠片(1991年攝)

此後,王選帶領青年骨幹不斷創新,在「告別鉛與火」後,又實現了「告別報紙傳真機」「告別電子分色機」「告別紙與筆」「告別膠片」等一次次新聞出版領域的技術跨越,使我國延續上百年的鉛字印刷行業得到徹底改造,形成了全新的電子出版和數字出版產業,開創了一條創新驅動發展的成功之路。西方從1946年發明第一代手動式照排機,花了40年時間,到1986年才開始推廣第四代雷射照排機。王選1976年提出直接研製第四代雷射照排系統,不斷發明一系列原創技術並實現成果轉化,到1987年投產使用,一步跨越了40年。

從1974年到1994年的20年間,「748工程」不僅開創了我國印刷技術革命的新紀元,而且帶動了中文計算機信息技術的全面發展,在開拓漢字信息處理技術及建立相關產業、開創計算機信息技術及應用、造就人才隊伍等方面取得了令人矚目的成就,是我國信息化和工業化建設相結合的成功探索與實踐。

2001年,中國工程院頒發「二十世紀我國重大工程技術成就」評選結果,「漢字信息處理與印刷革命」入選第二位,與名列第一的「兩彈一星」僅差一票。王選也因此榮獲2001年度國家最高科學技術獎、「改革先鋒」「最美奮鬥者」等榮譽。

> 我國用漢字雷射照排系統排印的首張報紙樣張(1979.7.1排版,7.27正式輸出)

斯人已逝,精神長存。王選身上體現出的百折不撓、勇於創新、頂天立地、協作攻關等品格風範,為我們樹立了光輝的時代典範。(編輯:九月)

(作者叢中笑系北京大學王選計算機研究所副研究員,王選紀念室主任,兼任中國印刷技術協會印刷文化研究委員會副主任委員)

文章來源: https://twgreatdaily.com/zh-mo/a4ee5637d63e5f0141597ca9acfa5ac5.html