Seybold 機構在最近發表了一系列的「下一波的出版」(Next-Wave Publishing) 研究報告,內容頗有深度與前瞻。第一篇報告談到出版的技術,提出語意網 (Semantic Web) 的概念,我在「下一波出版技術:語意網」一文介紹。第二篇談出版的流程,提出內容的製作策略與媒體平台結構,我在「下一波出版的內容策略」一文介紹。現在發表第三篇,也是最後一篇,以內容革命為題,再回到語意網的技術,把真正的含意(即語意)從資料內容取出,與資料內容本身分離,再把語意與處理流程分離,最後取得以語意表達的知識型態。換句話說,我們現在天天說的「內容」,不但不等於知識,要把內容變成知識,實在還有一大段距離。
資訊業的早期稱為資料處理,那個時期的資料都很簡單,重要的是處理,電腦程式是主角,資料與程式緊綁在一起。1970 年以後逐漸鬆動,程式與資料可以分開,但專屬的資料仍需專屬的程式來處理(如 Office),直到網路的出現,資料的格式才開放(如 HTML),這一三十年的時段,資料與程式的重要性相等。網路確實加速了發展,在 2000 - 2003 年間,元數據 (Metadata) 的運用,使資料的交換性大幅度提高,重要程度提升,程式的重要程度相對降低。現在加上 OWL 的運用,使資料添增運算的活力,彌補元數據不足,「語意模型」(Semantic Model) 逐漸形成。所以,從 2004 年起就進入了語意時代,語意的重要性超過程式、資料、與語言,也只有從語意時代,才能邁進知識時代。
「知識管理」似成了時髦的名詞,但知識究竟是什麼?如何運用資訊科技來表達?儲存在電腦裡的零散資料,或許不能算知識,但資料庫是知識麼?網路搜尋到的資料算是知識麼?除了電腦展現的型態以外,是不是也應著重內容的含意?那麼什麼樣的內容才算知識?說起來這雖然有些模糊不清,但不妨從知識用資訊技術表達的五個層級說起:第一層級是字彙、字典,第二層級是辭典、與分類,第三層級是元數據模型,第四層級是體驗、判斷,第五層級是語意陳述。雖然每一層級都是知識,層級越低、知識價值也越低,層級越高、知識價值就越高。
第一層級是簡單的名詞解釋,以及一些資料的定義,通常以自然語言描述。第二層級則深一層,包括語辭的解釋與摘要,同意、反意、與相關的詞彙,同時也作簡單的分類,建立基本結構。這些技巧已經應用在許多領域,發揮相當的成效,像有固定範圍(如機構內部)的知識管理,顧客服務的 FAQ,電子商務對商品提供不同層次的資訊等。
第三層級元數據 (Metadata),這幾年隨 XML 的普及應用日廣,藉 DTD 與 XML Schema 的工具,把知識(描述資料的資料)注入資料,與資料庫的結。XML 是語法規則,資料以標記 (Tag) 加註,不同應用領域的標記以 Namespace 進一步區分,但標記仍不足以表達深層的知識,於是有 RDF (Resource Description Framework) 的制訂,來整合網路上的相關資源,建立了元數據資料模型。圖書館的全球化目錄,新聞稿的轉載刊登,個人化的音樂收集,都是這一層級知識表達的運用。
第四層級是知識的體驗 (Ontology) 與判斷 (Inference),為資訊技術的高層次應用,較前面幾層級複雜。所謂體驗,是一種明確的規格,來描述資料的實體與概念的相互關連,做為電腦理性判斷的基礎。這一層級的知識價值,已經跳脫出以制式語言表達的框架,添增了理性的價值判斷。這一層級所用的工具,以 OWL (Web Ontology Language) 為主,OWL 是 W3C 核定 XML 格式的語言,目的在以高階層的描述,來標示網頁、資料、與 Web Services,而把資源、資料儲存、與處理流程,「語意化的」關連在一起。儘管這一概念尚在萌芽,已經有人開始運用因而獲利,全球性出版商 Bertelsmann 屬下的 Empolis 公司,已經運用這一技術開發客戶服務系統,供給 Siemens 公司全球六萬人使用,節省可觀的費用。
第五層級是最高知識價值的表達與展現,也是前幾個層級的集合,整合對知識的解析與使用工具,建立以資訊技術上對知識價值判斷的理論,再與電腦展示技術結合,把知識完全以語意的方式呈現。這一層級,語意與概念,替代了名稱與語言,來釐清複雜與混淆,這時知識的所表達,是科學化的,是機器與人可共用的,也適用全部知識的表達。知識到這一層級的表達,也許需要時間,但是穩定而延續的。資訊,儘管大量快速產生,也快速大量流失,每分鐘、每天、每年都在流失,不久即成為歷史;知識,尤其是語意表達的知識型態,也許進展緩慢,但能穩定、延續、而持久。
到底什麼是知識?知識科學家 Richard Ballard 博士說的好:
 知識,被沒有答案的問題所定義。
 知識,不論是理論或是觀測的事實,都是降低答案的不確定性。
 知識,是用降低不確定資訊的數量來衡量的。
那出版的下一波與知識有什麼關連?答案是:不再出版資訊,而要出版知識。而出版業要決定的是,選擇那一層級?
|