要把以前的舊書數位化再版,除了重新輸入編排之外,就是把原來的書掃瞄處理,或掃瞄成影像直接列印,或轉換成電腦文字檔。這件事不在掃瞄與字體辨認的高檔技術,而在一本書怎麼翻頁、攤平的低檔技術,這與影印一本書相同,最麻煩的事是把一本書一頁一頁放平。以這樣的速度,每小時最多掃瞄 100 頁。
Kirtas Technologis 公司最近研發出一種高速度的書本掃瞄機,內有一個放書的槽,各種尺寸厚薄的書本,只要往槽裡一放,就會自動翻頁掃瞄,每小時掃瞄可高達 1200 頁,一位操作員可輕鬆的照顧五台掃瞄機,一小時的產量至少有 5000 頁。如果用傳統的方法要一小時有 5000 頁的產量,恐怕要 50 位操作員、操作 50 台掃瞄機。
放書槽呈 110°的 V 字型,書放上去就自然左右張開,翻頁是用一隻機械手臂真空吸紙(圖),翻過去之後,再用小機械手把書左右撐開攤平(圖)。掃瞄是左右兩頁先後掃,V 型槽兩側各有一面鏡子,光線照射到左頁書面,右側的鏡子就把影像反射到數位照相機裡,然後光線照射到右頁書面,左側的鏡子把影像反射到數位照相機,然後機械手臂在吸下一頁,繼續翻頁、攤平、照射、照相一連串的動作。每一動作,在時間上都搭配的恰到好處,實際上這是一個機器人的動作,核心技術是由 Xerox PARC 提供的。
這個「機器人」的另一個動作,是維持掃瞄頁面與照相機的固定焦距。書的厚薄不同,而且書本張開兩邊頁數的厚薄,隨著掃瞄的翻頁而變動,導致書的頁面與照相機的焦距隨時改變,所以每掃瞄一頁、翻頁之後,就要調整焦距。不斷的調整照相機的焦距過於複雜,不是好辦法,不如調整放書槽的位置來的容易,所以放書槽是個能上下左右活動的裝置,每翻一頁,書槽就自動調整自己的位置,來維持書面與照相機的固定距離。
這台書本掃瞄機型號稱為 Kirtas APT BookScan 1200 ,每小時能掃瞄 1200 頁,輸出可為彩色、灰色、黑白三種,數位照相機為 3400 x 4000 像素,可產生每吋 300 至 600 點的解析度。掃瞄的最小面積為 5 x 8 吋 ,最大為 10 x 13 吋, 書的厚度可從 0.5 吋到 4 吋,紙厚可從 13 磅到 80 磅。 翻頁完全自動,一人可同時照顧五台 BookScan 1200。
掃瞄之後為 TIF 檔,如果僅為印書用,TIF 即可直接應用,現行的「按需印書」(On-Demand Book Printing),如果沒有文字檔,多半是由掃瞄檔列印的,如美國的按需印書廠 Lightning Source 就是這個作法,現在電腦快速便宜,用影像列印未必比 PDF 文字檔消耗多少計算資源。當然掃瞄之後如果要做其他加工,就需用軟體將影像轉換成文字檔,再做編篡。但無論如何應用,掃瞄速度多倍加快,應為出版技術的一大突破。
下面幾張掃瞄的結果,僅為適用網頁的示意展示,實際掃瞄結果為高檔的 TIF ,遠較以下影像清晰。
人物一
人物二
黑白圖
彩色圖
黑白圖文
彩色圖文
黑白文字
以上各掃瞄結果 TIF 原檔,可從這一網頁下載。
要了解掃瞄機的運作細節,最好觀看 Kirtas 製作的一段影片,即可一目了然。(影片在這一網頁裡)
|