|
请问这里有人用仓颉输入法吗?我想学习仓颉,可是太难了,请问有什么学习技巧呢? |
|
|
|
|
|
|
|
发表于 15-4-2004 05:58 PM
|
显示全部楼层
仓颉目前有分第三代及第五代(Version 3 & 5) ,
目前在我国市面能找到的仓颉书多是第三代,
Windows 所附的仓颉也是第三代的。
初学者我建议直接学第五代,第五代仓颉程式软体可至我国的仓颉之
友网站下载,佳礼论坛所附的网上仓颉输入法也是采用第五代版本。
虽本地很难找到第五代仓颉书,但有关参考书都可在网上找到,请至 http://www.chinesecj.com/newlearncj/index.php
自修<自學倉頡輸入法課程>,再看<第五代倉頡輸入法手冊>,包
您可学会仓颉。
仓颉其实很容易自学,基本要熟二十四个字母,这个二十四个字母一
般上半小时可熟背了。二十四个字母的前七个字母其实五分钟內就大
略熟了,即A日,B月,C金,D木,E水,F火,G土,聪明的用
户很快就能组成一些字如:
AB = 明
AA = 昌
AAA = 晶
CB = 钥
DDD = 森
FG = 灶 ...等等...
熟了廿四个字母再联想七十余个字根即可大略掌握仓颉所有字根,七
十余个字根是用联想法,若用苦背,是方法用错了!
廿四个字母 + 七十余个字根就是成了仓颉主要的中文拆码部件,
我们字典有二百余个部首,仓颉就是把字典的部首再简化而成一个中
文码,该中文码可做字序,用途很广,完全可取代字典的部首查法。
再来就是熟取码规则,中文约有十万字,其中康煕字典有约收四五万
字,输入法若无考虑到取十万字,只能把问题往后推,Big5 只有一
万三千字,GB近七千字,GBK有二万字,GB18030有二万
七千字,最新版Unicode 收七万汉字,这些取码字,仓颉早已一一考
虑了,通过仓颉取码规则,再多的字也不怕,只要內码有该字即可输
出中文字。
仓颉取码规则通了,就可成为中文打字专家矣!要繁打繁,要简打简
,要日文汉字可打日文汉字!
其实仓颉在电脑有六大功能,输入中文只是一个很入门的,有机会我
们再聊聊六大功能! |
|
|
|
|
|
|
|
楼主 |
发表于 15-4-2004 11:01 PM
|
显示全部楼层
真的吗?仓颉还有五大功能?我只知道仓颉是一种中文输入法,还有其他五大功能是什么? |
|
|
|
|
|
|
|
发表于 17-4-2004 01:58 PM
|
显示全部楼层
|
|
|
|
|
|
|
发表于 30-4-2004 07:23 PM
|
显示全部楼层
|
|
|
|
|
|
|
发表于 30-4-2004 09:09 PM
|
显示全部楼层
仓颉发明人朱邦復先生在其<第五代仓颉输入法手册>中对仓颉六大功能有详尽叙述:
转自: http://www.cbflabs.com/book/ocj5/ocj5/index.html
============================================================================
<第五代仓颉输入法手册>序
────────────────────────
資訊時代的來臨,對人類文化所引起的衝擊,遠較社會型態、經濟制度之影響為烈。由於文字是資訊的基礎,其功能效率,其適應範圍,都涉及該文字本身、以及使用該文字的國家民族之興衰、存亡。
中國文化是否有存在的價值,我們無權置喙,但是身為中國人,生在這個轉型的時代,卻有責任將中國文化保存下來。不僅僅只是為了自己、或者為了對列祖前賢有所交待,更重要的是為了未來世世代代的子孫,他們有權認識過去人類所積累的各種文化珍產,有權探求各種思考的內涵,有權選擇其喜愛的生活方式。
因此,自從研究中文輸入的第一天起,我就給自己定下了一個明確的方向,希望能在有生之年,徹底解決中文文字在資訊處理上的各種問題。
文字的問題應該從文字的特性上著手,我詳細閱讀了有關的古籍,依照中文文字歷代發展之規律、配合時代需求,整理出一套編目的方法。1975年,我出版《形意檢字法》,後來再經修改,並以電腦為應用對象,才定名為倉頡輸入法。
文字是人類思想行為的記述、表達工具,其發展全基於「約定俗成」,沒有任何人有足夠的力量和智慧加以硬性限制。即使有人自不量力,也絕對經不住歷史的考驗。
因此,我們設計倉頡輸入法之基本精神,不僅要保全過去見諸史籍的所有文字,亦且兼顧千秋萬世的未來,要能提供新概念、新事物的文字編碼及組合。
由於中國文化精深淵博,涉及的層次太廣,我自知能力有限,面對這樣艱巨的任務,若非訴諸大眾,結合各界的力量,則難有達成的一天。基於這種信念,我放棄了倉頡輸入法的專利權,潛心致力於中文文字的研究與發展。
1977年我在台灣推出了第一代倉頡輸入法,1979年與宏碁公司合作,利用「向量組字法」,推出了第一台真正的中文電腦。1980年又推出第二代倉頡輸入法,並用在蘋果機的「漢卡」上。1982年,第三代產品問世,在台灣大量推廣,奠定了中文電腦市場的基礎。
這樣經由市場逐代推廣的結果,也導致了很多困擾,其中,宏碁公司自稱為「天龍碼」,而 IBM 5550 則將第二代及第三代混用。至於其他版本,更是五花八門,以致倉頡輸入法雖然已被普遍採用,卻是各代之間各系統相互傾軋,無從統一。
除此之外,就實用的立場來看,第一代是根據一萬二千字的《國語辭典》所設計,第二代僅將輸入字母略作調整,並將輸出字形重新設計。第三代比較完整,是以《康熙字典》為範圍,選取其中四萬字,將第二代加以改良的結果。
第三代問世後,我受到市場的壓力很大,如若不斷改進下去,必然會造成更大的困擾。但在全部中文文字收齊前,這些輸出輸入方法,充其量只能稱作「商業產品」,對中國文化承先啟後的實際意義並不大。
還有一個重要的原因,我在當年設計倉頡輸入法時,是根據一種自以為是的理念。我認為中文文字的優點,在於老祖先們的睿思遠見,發展出六書的「形聲」原則,將「字形、字音、字義」融匯一體。在現代化資訊的技術尚未成熟以前,當人類還惑於人本具的「辨識」及「思考」能力之時,大家無從領會其中的奧妙。一旦時機到來,中文必將成為第一個可供「機器理解」與人類溝通的「資訊媒介」。
因此,我將倉頡法所考慮的全部精神,作為我今後努力的方向及綱領,將中文文字的特性,加上文字本身本具備的特質,得出了六大功能的結論:
1,字碼:
字碼是文字的編碼,以供文字實際的應用,包括鍵盤輸入,文字索引等。對於鍵盤輸入,需要考慮鍵位的利用率與人體工學的關係,以及各鍵的功能。用鍵的分佈要力求合理,至於鍵的定義,則視各家的觀點而定。但有一點不可忽視,即文字碼僅能使用文字鍵,不宜與數字、符號鍵混用。
有人只為了輸入時的速度,常刻意遷就,筆者認為輸入僅為文字功能之一,如無全面的解決方案,本末顛倒,將導致未來發展的困難。
字碼之功能效率,與資料之應用量成正比。當資料量不大時,字碼的重要性不顯。然而在資訊時代,字碼順序與人的直觀認知,有著舉足輕重的關係。拼音文字最大的優點,就是其字母具有直觀的排列順序,舉凡分類及各種資料查尋,都遠較圖形文字便利。
一旦圖形文字也建立起相應的字碼,且具有符合人類直觀的序列後,則比諸拼音文字毫無遜色之處。
字碼與字形須一一對應,也是一個不可忽視的重要因素,由字形可以直接看出字碼,從字碼也能立即得到字形。似此,則無論是形是碼,實為一體之兩面,如此才能發揮文字的真正效益。我們使用的倉頡碼,就是根據這種理論所設計,在字碼上,可以提供數百萬種不同的組合,同時,每個組合都有一相應的字形,皆由程式組合提供。
2,字序:
字序須與人的視覺一致,因為文字是視覺符號,由視覺排序比較直觀,才能發揮文字的應用效率。同時,經過長時間的試用結果,英文及拉丁文字母不失為一種極為有效的排序系統。所以利用現存的、已証實為有效的英文字序,會有事半功倍之效。
倉頡輸入法採用之「倉頡字母」,即建立在這種基礎上。目前,我們正在設計用倉頡字母排序的中文字、詞典,以証明其功能之優異性。
此外,電腦是為講求效率而發明的機器,從軟體工程上說來,軟體的效率,端視資料的排序機能而定。一台電腦硬體的售價,經常與其處理速度成正比,字序效率的高低,可以說與成本息息相關,故此可見字序的重要性。
有人建議為了維護傳統文化,排序應該採用部首、筆畫方式。須知傳統文字中並沒有「排序」這種觀念,而部首、筆畫祇是供「文字分類」之用,所以拿來編字典還可以,要用來排序,則不僅不符合人的辨識機能,沒有意義,且要特別建表,降低了電腦的效率。
3,字形:
字形為一種視覺效應,利用明暗、強弱的對比,人得以辨識其特徵而判別其所代表之概念。就視覺之特性而言,字形大小一致,利於直觀認識;形狀工整,垂直向密度大於水平密度者,比較容易辨別;而在單位空間中,形狀變化則與所代表之信息量成正比。
根據上述條件,中文字之信息量及辨認直觀性皆較拼音文字為高。在另一方面,字形簡單者,固然有易學易用的優點,但卻減低了文字最重要的信息功能。為了彌補這種損失,必須結合多重字形以表達複雜的信息,拼音文字即建立在這種觀念上。對文字的認知,須由形轉音,由音得義,並非直觀性文字。
早期電腦採用「英文字符態」,對中文極為不利,後來圖形功能的需求日漸增加,才為中文創造了有利的發展環境。
然而,國人太迷信於美國人的技術,不願自行開拓新路,所以才有點陣字形的存在。常有人說,我的向量字形不夠精美,但世上沒有任何一種技術,一問世就達到盡善盡美的地步。向量字形証明了這種技術的潛力和必要性,還需要大家的投入努力,才能臻於完善。
4,字辨:
倉頡字母及輔助字形共計114 個,在設計之初,即考慮到有朝一日,如果用電腦程式來認字,所需要認的符號當然是越少越好。然而,少也要有一定的限度,至少要能令人取碼時,易於分辨,不致混淆。
除了符號少,分類還要能配合視覺原理,因為程式在檢查時,是模擬人的視覺認知。若不按照視覺分類,則將增加許多無謂的困擾。
還有在取碼規則上,我特意設了一項「包含省略」的規則,目的就是為了便於辨識時檢查。在取碼時,選取邊角位置,也是考慮的因素之一。在這些預先準備的有利條件下,我們所設計的中文辨識套件,自然而然能達到極高的效率。
5,字音:
這又是拼音文字的優點,但中文也有約略相同的功能。因有百分之八十五的字源自「形聲」規則,即一字中,有以之發音的聲符。祗惜未經整理,古音已失,傳到如今,由文字可直接得到正確字音者,在常用字中,已不到百分之七十了。
儘管如此,對數量極大的中文而言,節省的空間仍相當可觀。更何況,在系統設計的立場,如是形聲字,可以說幾乎不佔空間,在語音辨識上能一次完成,比起以語音為主的拼音文字,一點也不遜色。
6,字義:
文字最重要的功能,就是傳達「訊息」。這些訊息就是人對一般事物所認知的「常識」、「知識」。
人類所使用的文字,大體可分為兩種,一是拼音文字,一為圖形文字。對拼音文字來說,眼睛見到文字以後,還要由形轉音,由音知義。圖形文字則不然,視覺得到了形象,可立即與經驗中的認知概念相聯接,效果快速。
人類的感知中,有百分之八十以上來自視覺效應,美國學者的研究顯示,最理想的符號,即為直覺的「視覺訊息」(Icon)。以各種交通誌號為例,如用英文,則因長短不一,所佔空間不等,有直觀反應不及的缺點,故而儘量採用圖形。
實際上,中文就是一種「視訊」,源起於以圖形記事,後來為了書寫便利,才將圓弧改為其他較易書寫的形狀。同時,在發展過程中,前人根據常識認知所產生的概念,也保留在偏旁部首的分類中,代表了文字的應用範圍。
這是中文最特殊、也是一直被忽略的一項極關緊要的功能。以往,中文部首僅用作字典上的索引,其實,這是一個很大的錯誤。人只有在不瞭解該字字義時,才有查字典的需要。既然不明字義,又怎知其分類?而不知分類,如何以之作為索引呢?
將此六大功能統一設計在一種編碼法則中,的確是費盡心血。很多人的中文輸入方法僅只供輸入用,更糟的是只供數千字的輸入用,並非一種全面性的解決中文的策略。不過是頭痛醫頭,腳痛醫腳,其拼拼補補之餘,每到電腦的功能晉昇一級,就要痛苦一陣。但對倉頡輸入法,尤其是在第五代的基礎上,可以說是永遠地、徹底地,從根將問題一次解決。以至於在中文電腦的設計上,如能在整體的觀點,同時把這六大功能設計完成,則不喻可知,中文電腦之功能,必將遠較拼音系統為優。
本著上述信念,我不顧一切,繼續致力於研究發展第四代的改進計劃。但由於一些因素,不幸胎死腹中。1985年在美國又發表了第五代輸入法及字形產生器,共收集了約六萬字,只用了80KB的記憶空間,可以提供由 15*15至32*32等多種字形及字體。
倉頡輸入法絕對有修改的必要,原因之一是前幾代缺點很多,必須更正;其二是當將字集擴大時,重複字急劇的增加,到了難以忍受的地步。例如說在第三代中,“”部原來與“??”部同佔一鍵,如查《辭海》,“”部有28字,“??”部有149 字,重複字僅4 個。但是將字集擴大,僅以文化學院發行的《中文大辭典》為例,“”部有130 字,“??”部有 548字,重複字竟然高達23字。所以不將這兩個部所佔的鍵位分開,問題就得不到合理的解決。
還有個原因是,在「字庫及概念庫」的設計中,涉及「倉頡取碼」的字身定碼,我們共找到9897個字身,如不避開重碼,則無從分辨,所以我們不得不大動干戈。
然而這卻是一次重大的挫敗,首先是在美國沒有中文市場,開銷大、營利少。兼以離開草根太遠,發揮不了應有的效用。其次是我們人手太少,坐待外界的合作,未曾主動開發出應用軟體,等到公司無力維持時,只好另謀發展了。
第五代推廣失敗後,我們又以七萬字為藍本,發展了第六代。基於過去的經驗,我認識到光只埋碩做研究,沒有實力做後盾,真正的效益不大。再加上已經做了五代,仍然有所不足,那為何不集中全力,把已經成熟的產品開發出來,然後著書立說,將全部技術公之於世,把研究發展的機會留散他人呢?
於是,我們放棄了第六代,再以第五代為基礎,開發出「全漢字字庫」,以及解釋中文的概念辭典。前者是倉頡輸入碼與字形的處理,約佔256KB ,以12MHZ CPU 處理速度計算,平均每秒輸出40*40 之字形500 個;後者是倉頡碼與中文字音、字義的介面,八千字及卅萬個詞彙,僅佔64KB。
上述工作的完成,証實了我當年設計理念是正確的。然而對我而言,這只是一個起點,有待努力開發的工作數不勝數。為了期望早日竟功,我和沈紅蓮回到了大陸,在深圳科技園的大力支持下,從基礎概念起,訓練了二十多位電腦勇士,日以繼夜,週而復始,打算在五年中,完成全部中文電腦的設計。
目前,人員的訓練才有了初步的結果,但最關緊要的規劃工作已經完成。在1989年八月,「全漢字字庫」通過了國家級鑑定,被評為『世界領先技術』。1990年四月,我們又以「聚珍整合系統」,贏得『超越國際水平』的佳評,肯定了同仁們的工作價值。
實際上,我們的工作尚未完成,全漢字字庫的技術可以發展得更完美,聚珍整合系統更有待不斷的加強。目前我們正傾力發展模組,打算將中文電腦的技術全部公開,且不要說是模組本身,僅僅是手冊和說明,都不是簡單的工程。
目前,我們至少已經完成了倉頡輸入法所揭櫫的字碼、字序及字形三大功能,下一步將是「文字辨識」的套件,程式約24KB,48*48 的字形,每字平均約需一千個指令,即可將點陣字形轉換為倉頡碼。此外,中文的語音處理,以及自然語言操作系統等,都在極積的研究發展中。有了這些全面的解決方案,中文電腦才算告一段落,以後的工作,須待下一代年輕朋友們的接棒和努力了。
這些功能的原始程式、設計理念和未來的導向等,我們將陸續全部公開發表。其目的在於喚醒國人,我們有足夠的智慧,走自己的道路,也有世界一流的技術,發展自己的產品。與其不名譽的抄襲別人的心血作品,何不光明磊落地享受創作的樂趣?在這嶄新的闊野上,有足夠的餘地,供每一個有心人士,盡興馳騁,充份地發揮您的專長。
本來,坊間有關倉頡輸入法的書籍已經不少。且作者大都有豐富的教學經驗,實在不需要我們再多添一本。但為了配合「聚珍整合系統」的應用,並闡明倉頡輸入法的真義,才在百忙之中,完成本書。倉頡輸入法既是我們發明的,對它的改進、統一與詮釋,自然是責無旁貸,並且要不斷的改進,直到人人都能方便的使用為止。
本書第一章闡述倉頡字母及輔助字形的分類原理,第二章說明輸入規則,第三章將介紹「聚珍整合系統」上有關倉頡輸入法的應用。附錄一提供了第三代、第五代改碼字字碼對照表,可供原使用者參考。附錄二為“聚珍整合系統”的異體字字碼表,附錄三為常用字首字碼表,附錄四為常用字身字碼表,附錄五為常用整體字字碼表,這些都是為了幫助初學者,以便從各個角度來瞭解倉頡輸入法。附錄六為第五代倉頡字碼表,目前暫公佈18018 字集。(另《聚珍資訊碼對照表》一書,包括了第三、第五代倉頡碼,注音、公會碼、交換碼、BIG5碼、電信碼及5550碼等,共有13053 字,將於近日出書)附錄七為國標碼6763字倉頡字碼表(簡體,未附)。
有心人可以看出,附錄三、四、五對中文字形產生器,中文字形辨識,中文自然語言等軟體的製作,都是不可或缺的基本結構和資料。
朱邦復序於1990年12月10日
深圳科技工業園 |
|
|
|
|
|
|
|
发表于 30-4-2004 09:21 PM
|
显示全部楼层
倉頡輸入法源起:
一、緣由
忙了幾十年,馬齒徒增,來日無多,而壯志未酬。不論如何,我手中有些技術,經濟
價值雖然人見人殊,但糊口謀生倒也輕鬆自在,特別是對中國文化上意義重大。我早就想
把這些寫出來公開發表,可是一來不知道有沒有用,二來也實在抽不出時間。拖到現在,
工作越來越忙,舊的技術還沒有落地,新的卻又脫穎而出。
我在大陸上幾經辛苦調教出了廿個學生,但是人手依然嚴重不足,每看到他們忙得朝
夕不分,就再也不忍逼迫學習。沈紅蓮一再勸我,早日寫成書,說不定有人「私淑」成材
,遠比我在這裏空事擔心的好。
好是好,時間委實難以分配,好在沈紅蓮答應為我寫一部份,工作量稍輕,就此決定
下來。話雖如此,又拖了好久,這次回國遇到熱訊雜誌總編鍾琗?浚?伸峨s誌的風格及
水準不錯,而且與鍾主編言談投契,於是就先口頭答應要寫些技術性的文章,以俾「駟馬
」拖著我,到時好鞭策一些貨色出來。
倉頡輸入法雖然有不少人使用,但是其真正的功能卻被淹沒了。當然,這是因為我去
國太久,加上各種利害關係,以致是非難明。我並不介意利、害、得、失,但卻為一個原
本可以解決中文瓶頸的方法,受到委曲而不平。我當然會繼續奮鬥下去,但是,這場戰爭
和所有人類掀起的戰事一樣,不可能輕易消失的。今天我還在,明天呢?如果長江沒有後
浪推著前浪,東逝的盡頭,還會有什麼?
所以,我終於開始寫了,但願能寫得清楚,更願學者能好好把握這個技術的核心,就
是中國文字巧妙的結構。來日當中文時代到臨,中文電腦大放光芒之時,如果能徹底瞭解
這個結構,就可站在世界的中心。
本文之一部份係由若干篇現成的資料改寫而得,故難免重複。為了保持本文的完整,
不便多作更動,敬請原諒。
二、話說當年
「倉頡輸入法」係由筆者發明於1976年,原名「形意檢字法」,並獲內政部版權註冊
在案。1978年在三軍大學實驗中文電子通訊成功,蔣緯國將軍特正名為「倉頡輸入法」。
1979年,筆者與宏碁電腦公司合作,採「倉頡輸入法」輸入中文字母,並應用「向量組字
法」將字每組合成中文字形。生產出第一部具有中文字形、中文操作系統、中文程式語言
之微電腦,並命名為「天龍中文電腦」。
現在看來,中國人用中文電腦是理所當然的,可是,在十餘年前,電腦剛剛引進國門
,用電腦的人不多,懂電腦的人更少。電腦上用的是英文字形,處理的是英文資料,行家
莫不認定中國文字已經壽終正寢,英文一統天下的時代正要到臨。而外行人則抱著遺憾的
心情,無可奈何地,坐看中文的式微。
我在1973至1978五年間,抱著民族尊嚴和一股信心,面對這股逆潮,舌戰群雄。由大
學教授至升斗小民,除了極少數關懷中華文化者,絕大多數都站在現實立場,認為要國家
強盛,就必須趕上時代。傳統文字雖然重要,民族的生存更為重要,如果實在必行,中文
的犧牲也是「適者生存」的天演律。
當時我正在研究中文輸入法,看到了一線曙光,祇是沒有機會實現。雖多方挫折,我
毫不氣餒,在設計輸入法的同時,就考慮到了字形輸出及字形辨識的可行性。甚至於,字
音字義都有了一些實現的概念。
我與宏碁合作天龍中文電腦之時,大電腦一台「租金」每月就要上百萬美金,貴得太
離譜。而微電腦功能太差,其記憶體一般約有16 KB ,最多也只有64 KB 。即使以今天各
界的中文技術,中文字形也根本沒有空間可以容納。
天龍中文電腦是用美國ZILOG 公司出產的 MCZ系統上,主機記憶體為64KB,我們用切
換的方式,多加了一塊64KB的記憶區,以處理中文字形。64KB空間能提供數萬中文字形,
即使到今天也是一項重大的技術突破,但卻並未被國人重視。因為,國人太過於聰明,喜
撿現成便宜,不願下苦功走自已的路。很多專家學者,都認為記憶體將越來越便宜,字形
應該學習美國人,用點陣的方式貯存為宜。
我一直認為,記憶體是供電腦運作的空間,如果希望中文與英文具有同樣的功能,則
不能將系統記憶體浪費在中文字形的貯存上。也有人建議將中文字形貯存在硬碟中,我曾
預言,基於硬碟讀取次數的極限約在六千萬次左右,用這種方法,則每半年要換硬碟一個
。很不幸,待使用者理解的的話時,損失早已造成了。
我一直執著於用組字的方式,試圖用極小的空間,全面的解決中文以及各種圖形文字
的排版問題。因為在我多年的研究中,發現了文字的基本因子:對輸入而言,是為字碼;
對排序則用字母;辨識則利用基本形及位置;字形可以靠筆形的比例組合。
由於當時只有理念,尚有待實驗,在三軍大學,我証明了取碼、電傳的可行性。與宏
碁公司期間,我則提出「向量組字法」,擬用54 KB的空間,以倉頡碼為索引,找到正確
的筆形后,組成字形。
我負責設計整體結構及程式流程,沈紅蓮則製作資料,宏碁公司由施崇堂為首,另有
郭欽陽、黃豐約等軟體工程師及若干硬體工程師參加。我們於民國77年12月開始工作,到
次年5月,硬體測試成功,又加入了幾位系統工程師,終於在78年9月28日,完成了首創的
「天龍中文微電腦」。
「天龍」成功後,行政院於79年,曾頒發科技界最高榮譽「行政院長獎」。我個人並
未以「天龍」之成就為滿足,遂以宏碁所支付的權利金,開辦了零壹科技公司,以專業發
展中文電腦為職志。
然而,「天龍」並未使電腦廠商看到中文市場的潛力,我費盡口舌,逐家拜訪各電腦
銷售廠商,希望將各種機型都加上中文。當時的微電腦並沒有共同的標準,各家有自己的
硬體設備,不同的操作系統,完全不能兼容的應用程式。甚至於更令人洩氣的是,硬體規
格及技術手冊等資料一概闕如,我們每遇到一種機器,就需要花上個把月,用邏輯分析儀
,把其中內部資料讀出,再根據CPU 的指令,像猜謎一樣跟蹤下去。
由於中文電腦沒有買家,所以廠商興趣缺缺,我們每改裝一種機種,僅收費新台幣卅
萬元的人工成本,甚至賠本也做。由79年至81年,我們改裝了十餘種不同廠牌的電腦,其
型號早已忘卻,僅就記憶所及,略述如下:
NEC 公司所生產的早期微電腦,震旦行所經銷的 SHARP,全亞公司所生產的 PA 800,
此外還有NORTH STAR,ALTOS,APPLE ,VICTOR 9000 ,等。至於終端機,則有為神通所
設計的「漢通」,為誠洲設計的「倉頡」,以及為電信局設計一種專用機種,後來交由「
眾鼎公司」經營。
我們最成功的產品之一,是為佳佳公司所開發、用在「蘋果」上的「漢卡」。後來因
為權利金與佳佳意見不同,所以協議收回獨家銷售權,轉而交由六家在中華商場開業的小
店去生產經銷。結果因為售價便宜,才打開了中文電腦的市場。
我的理想是推廣中文電腦,如果自己也介入市場,就會導致其他電腦廠商的疑慮,甚
至於不願從事中文電腦的開拓。因此,我經營零壹公司的理念是:全力協助生產廠商發展
中文,收費低廉,而且不重複他們的工作,專心致力於研究。
三、中文電腦的文字因素
倉頡輸入法為一種解決「中文輸入、輸出、辨識、釋義」等功能之綜合方案。在文字
輸入方面,力求將過去文化上所用之文字,逐字賦與規則統一之字碼,以達成承先之歷史
責任。此外現階段之用字亦不能或缺,未來社會上之新事物新觀念,也都有必要應用字碼
輸入,以供應用。
首先,中文的組碼必須用國際標準鍵位之文字字符鍵,以便與國際文字共用。現行之
國際標準文字字符鍵僅26個,是則中文之取碼方式,必須用該26個鍵,以達成之。
有了輸入法並不能解決中文的字形應用,而且收字越多,所需考慮的問題也越複雜。
所以,一定要在收字的同時,考慮妥當文字的輸出,務使「有碼即有字」。
以我國數千年的歷史,前人所遺存的文獻何止億萬,將來都有必要輸入到電腦中。為
了解決大量文字輸入的困難,文字辨識的功能,也有必要與文字輸入的方式吻合,以便進
行電腦程式的製作。
然而文字最重大的功能,是概念的應用,中國文字即為概念文字,當來日人工智能進
一步發展時,必能大放光芒。從事文字輸入設計者,體悟到個人身負中國文化的歷史重責
,理應慎始慎終,務期至於至善。
由於此一目標之工作艱巨異常,我們訂定了若干原則,茲簡述如下:
1,過去文獻上所用字,迄今尚無學術界有系統之整理,而我們限於物力、人力,勢必
難以竟功。特以字典為憑,但凡該字之說明有典可稽者,則視為文化用字。此外,若字典
上載明為「見於某某碑文」,若干不常見之異體字,或殘缺不全者,概不收入。
2,根據說文解字,中文源自象形、指事、轉注、假借、會意、形聲六書,其中百分之
八十之文字,皆依據形聲所造,是以,本輸入法即以「形聲」為取碼及組字之基本法則。
將所選取的文字一一整理,共計分析出594個字首,9897個字身。
3,前述之字首及字身,實即為原始之象形及指事等字形,是故這些字首及字身可以分
別取碼,以代表原字,亦可按照中文字形組合之規則,以字首及字身結合之。
4,因限於26鍵,其中保留一鍵供特殊用途,餘25鍵, 594個字首,每一字首若取一至
二碼,可得到650種排列組合;字身9897個,每個取一至三碼,可得一萬餘,顯然可涵蓋
所有之字首及字身。因此,以字首碼加字身碼,即每字取一至五碼,適為全部收集字之最
小公倍數。
5,將前述之字首字身碼,分別再作分析,得到 612個基本結構之字形,當電腦得到倉
頡輸入之字碼時,同時即可在「字形庫」中,得到正確的「結構字形」。將結構字形根據
人工智能的方式,依用戶指定的字級大小,以及字體的變化,將該字形畫出的程式,便是
「全漢字字形產生器」。
6,上述全漢字字形產生器僅佔 260KB的程式空間,字形可作「無級次」大小變化,在
10MHZ 的微電腦上,每秒鐘可產生40X40之中文500個。
7,本字形產生器除了能提供所設計之近萬字以外,由於排列組合之靈活性,計可組合
出594 X 9897 個符合形聲法則之「新字」。如此,原只屬於拼音文字的靈活組合之優點,
亦得以在保存中文文字傳統的同時,有效地發揮出來。
8,在中文文字辨識上,倉頡輸入法僅用 114個「基本符號」,根據中文文字的「結構
關係」,分別取碼。是以,使用者僅需知此114個符號,以及結構規則,即可得到中文字
瑪。同理,當電腦程式掃瞄文字點陣時,採用此原理,也可以得到該字之「倉頡碼」。用
這個原理,我們開發了「全漢字字形辨識系統」,全部只佔60 KB ,其中程式約佔24 KB,
每秒鐘「識字」近一千個。
9,倉頡輸入法最大之特色,在於用「中文字母」作為排序之根本,大大提高了文字使
用的效率,不僅易於程式處理,且與人取碼時所得之順序一致。依此順序,中文完全具有
與拼音文字相同的排序功能。作為字典索引、大量的圖書、資料編目等,簡單方便,我們
即將以之廣泛應用在各種資料處理上。
至今我們還在努力,進一步將輸出字形美化,現在已有明、宋、黑、圓等字體,而且
正在設計楷書,計有王、柳、歐、顏等書體;此外還有隸書、魏碑及各種應用藝術體等。
我相信,通過這些努力,中文的應用瓶頸已完全排除,甚至較拼音文字更具特色。如
能有效地加以推廣,不僅對文化的發展維繫有重大的意義,對當今的資訊處理,也能發揮
非凡的經濟效益。舉凡戶政、財稅、交通、新聞、圖書館各界,皆得以提高應用效率,為
國家節省大量的費用。
註:在研究時,我們所參考之資料如次:
1,康熙字典 一冊
台灣商務印書館印
2,中文大辭典 共十冊
台灣中華學術院1980年印行
3,辭海 上下冊
台灣中華書局1987年出版
4,中國文字資料庫 兩冊
台灣國字整理小組1985年出版
5,中文資訊交換碼 三冊
台灣國字整理小組1985年出版
6,數據通信中文電碼 一冊
台灣交通部電信總局1983年出版
7,常用標準國字解析 一冊
台灣遠力出版社1983年發行
8,次常用國字標準字體表 一冊
台灣教育部1982年印
9,說文解字 一冊
台灣世界書局出版
除上述資料外,本方法所收中文涵蓋下列各種規格:
1,台灣電信局所使用之「數據通信中文電碼」
計16,376字
2,台灣電腦公會使用之「BIG-5 」
計13,053字
3,台灣「常用國字標準字」
計 4,800字
4,台灣「次常用國字標準字」
計10,740字
5,台灣財稅中心人名用字
計18,000字
6,中國國家標準碼
計 6,763字
7,美國博愛公司中文內碼
計18,018字
(美國國會圖書館與史丹福大學聯線供全美各大學資料查閱用 ) |
|
|
|
|
|
|
|
发表于 30-4-2004 09:27 PM
|
显示全部楼层
|
|
|
|
|
|
| |
本周最热论坛帖子
|