「大人物」包括Oracle, IBM, Adobe, NetScape對XML的支持 叫大家對XML另眼相待。
為什麼?HTML早已縱橫四海,還不能稱孤道寡嗎?
更遑論PDF只是挾天子(PostScript)以命諸侯(印前工業界)更別想一統江湖了。
XML到底是啥麼碗糕?XML是MIT的註冊商標,卻是W3C(World-Wide-Web Consortium)的產品,足見其大有來頭。
如果我們從使用電腦的發展來看,先瞭解未來的資料格式的需求,可能較容易了解為何「XML一出,誰與爭鋒」。
這十年來的電腦世界裡,以建個網站為例:我們結合作業系統、文書處理、資料格式化和網路軟體…等等各個步驟,而且各步驟相互依賴,改變其中任何步驟,都得付出代價-「錢」和「技術支援」。
目前我們付出的代價小於我們從中得到的好處,所以問題不大。但是要處理的事情愈來愈複雜,終於有一天處理的成本會超過其產生的價值,儘管新技術一再翻新,就像熱力學裡講的「熵」-亂度,所有的物理現象都像趨向於亂度高的狀態發展一樣。電腦世界不正是正快速地朝那個方向發展?
所以這些電腦大人物想像未來的趨勢,定義電子生意(e-business)-範圍包括資訊管理系統(MIS)、新近流行的電子商業(e-Commerce)還有各項自動化系統都算e-business。
理清電腦作業的基本要件邏輯-解決方案的四大支柱,才能發現新的資料格式標準的重要性:
- 網路-連接資料與解決方案;TCP/IP肯定沒有異議。
桌面-包括電腦硬體、作業系統和大多數電腦常共用的軟硬體零組件;以瀏覽器為主,或者輕型的前端軟體(thin
client),不只是PC,其他如set-top電視選台器都裝上
了瀏覽器。也漸有明顯的趨勢可尋。
程式-實際執行的程式碼,如Lotus123, PE2, …;像Java的元件都以跨平台為訴求。
- 資料本身-如報紙編輯的文稿,會計帳務資料….,我們正在討論它。
以往的資料一但遇到新技術或是新觀念,都必須煩惱資料轉換的問題。所以新的資料格式應該打破和網路、桌面及程式的關聯性,讓新技術與舊系統能平行作業。這是第一個需求。
XML就可以在系統改變時提供平行作業的條件,如果你把Java當作開放的軟體,XML就算是一個開放的資料格式。
重點之一,XML用人看的懂的「標籤(tag)」來標示意義,並包裹資料,以往的資料格式只有電腦看得懂。
為何不用HTML?簡單的說HTML將從標籤中抽出內容,使讀者看到作者想表現網頁的內容;XML則保留標籤的骨架和內容。HTML可以當成XML的網頁輸出模組,XML和不同的模組構成不同的資料庫處理系統。比如建立一XML圖書館,需要先建一個圖書館管理模組,此模組幫你搜尋所有書的書名標籤(tag),或是作者標籤,再幫你從內容標籤中給你整本書的內容。如果有PDF模組你得到的就是一本PDF電子書。想像一個報社的資材管理系統(asset management system)用XML作為流程中的資料格式,記者發稿時以XML格式存入資料庫,編輯利用編輯模組經由「摘要」標籤,找到想要的文章,利用組板模組製作版面。網站編輯利用相同的編輯模組編輯,利用HTML模組製造網頁。資料部門利用資料庫模組建立資料庫;日後記者又可以從資料庫中,找到發稿的材料;小說部門利用另外一模組,組合連載專欄出版一本書。這就是同一資料不同應用(re-purpose)。現在HTML的全球資訊網(World-Wide-Web)只不過是資訊網,XML會把全球資訊網變成全球資料庫(World-Wide-Database)。儘管目前只看到XML網站出版的應用,其實不只是資訊消費者可以從XML得到好處,最終XML的主要應用將遍及所有電腦間的互動,資料庫交換…等等。看來W3C和那些大人物們想用XML來當支撐未來電腦作業解決方案之一根支柱。
你可能關心兩大瀏覽器天王對XML的進度,他們都確定要讓瀏覽器解也能瀏覽XML,Beta版也有了,只是與實用性還有一段距離。參考XML.com的編輯Tim
Bray的The Trouble With Browsershttp://www.xml.com/xml/pub/98/12/B-Trouble.html。
如果你想了解IBM公司規劃XML的初衷,可參考負責Java和XML計劃的Simon
Phipps在IBM, e-business,
& XML 中以版圖移轉的觀點來解釋XML的發展。