我的人物小傳 - 17. 初次海外出差:北京微軟之旅

        從 DOS 時代,中文系統初次問世,最後勝出的「倚天中文」系統,採用了「大五碼」 BIG5 做為電腦中文編碼的基礎,但是 BIG5 中,僅僅定義了一萬三千多個「日常用字」,而完整的中文字集其實多達五萬多字,也就是有將近四萬字根本不在電腦的中文系統中,而這些字被稱為「難字」、「罕見字」、「異體字」。


        既然這四萬字是少用的罕見字,應該不影響日常生活,何必在意?問題是這些字,往往出現在人名、地名上,因為中華文化有所謂的「姓名學」,所以常常會造出這些為了改命或是求吉祥的文字。


        而金融業為了在系統內儲存客戶開戶資料的姓名、地址,反而經常被這些「罕見字」所困擾。

        當時的解決方案,就是 BIG5 提供了一個自定義的「造字區」,讓用戶可以在這個區域自訂中文內碼代表的罕見字。

         IBM 主機採用的 EBCDIC 字碼表,也同樣有這樣的造字區,來定義這些罕見字。

        中文造字這件事對老外來說,是個難以理解、摸不透的神秘區域,因為對他們來說,英文造新字怎樣也是面對那 26 個字母的排列組合,不懂中文造字為何要自定義位元組內碼?

        而我們家的產品就是佔據了這塊老外手伸不進來的「中文利基市場」。

游錫『堃』


        這個字是我們產品簡報最常舉的案例。這個字就是典型造字,各種不同編碼的主機內都有不同的內碼,例如 IBM EBCDIC 字碼對應到 PC BIG5 字碼,而不同行庫之間(例如跨行轉帳,中信金 vs 台新金)也因為各自定義而造成資料交換困難,這時候往往會利用常見字作各種天馬行空的替換。

        例如:游錫方方土

        直到 UNICODE(UTF8 / UTF16) 萬國碼出世,才讓大部分這些中文難字有了統一定義。

        而我們的產品就在這個時機點,提供了跨系統、跨行庫的「A系統造字 <--> UNICODE 標準字 <--> B 系統造字」解決方案。


匯入各大行庫的造字對應定義


字碼轉換測試與驗證工具

        這讓金融界可以不用更動幾十年來已經儲存在資料庫內的中文造字,又可以達到支持萬國碼標準和不同行庫、系統互通,省下大量人力物力,繼續使用現有資料與系統,相當於無痛解決千禧年 99 -> 00 的危機。


         M 師父極佳的效能優化,也讓產品成為 EAI 的資料交換核心系統,變成金融企業內的資訊高速公路。身為一條 7x24 不能中斷,極度穩定又跟金錢相關的系統,同時支持 BPM 各種流程應用,一套 450 萬應該也不算貴吧?


        由於產品的成功,以及所有華文系統當時都有類似的痛點,經過台灣微軟的介紹,北京微軟也對我們的產品有興趣,因此邀請我們到北京微軟辦公室做一場產品介紹


        仍在坐監的 B 先生,就這樣幫我買了機票,派我隻身前往這人生地不熟的神秘國度。




        當時的時空背景,大陸人對台灣人仍有相當的崇拜和敬畏:覺得台灣很有錢,科技水準非常領先。抵達北京微軟介紹產品、做完 DEMO,最常聽到他們經理和負責接待我的工程師(綽號:愛滋貓,但他跟我保證他沒有愛滋病)說:台灣的技術水準真的是不同水平耶。



上面那位就是負責招待我的地陪工程師:愛滋貓。
同時也是學習與培訓我們產品的見習工程師。




侃侃而談系統架構的我








北京微軟機房的主機群




北京微軟發展的歷史沿革


北京微軟的系統監控儀表板

        因為我們的產品除了轉碼外,還能做 ETL 和具有格式轉換能力,無論是 plainText,CSV,TSV…,通通轉成 XML 在內部處理,所以同時對外支持 SOA、SOAP、WebService 等,所以當下我展示了一套叫做 stylus 的軟體,可以利用 XSLT 把 XML 內的資料元素拖拉成各種形式的轉換,例如套成網頁、表單、Email…etc。


透過我們的產品,可以將幾十年老舊的 IBM 主機搖身一變為現代化的 SOA WebService

        現場他們發亮的雙眼看得直呼:「哇!台灣人的技術真是不簡單!」

        然而這套叫做 Stylus 的視覺化設計工具,其實是跟國外買來幾千塊台幣的套裝軟體,只是買我們 450 萬的產品我們都會內附贈送,所以往往會說成「是我們產品內建功能」之一。


Stylus Studio (a XSLT Designer Tool)


        就像上一篇講的,我們根本不擅長做 GUI 工具,所以都是『槓桿』第三方產品。

        就這樣,在北京微軟接收三天的招待之旅後回台,完成人生第一次海外出差的職涯成就。

留言

這個網誌中的熱門文章

SQL Deadlock 的處理經驗談