PDFの解説 1999.11.25…00.6.21…01.08.28…03.1.10更新


 本稿の内容はAcrobat 3.0をベースとしていましたが(1998年10月初稿)、Acrobat 4.0にも対応するよう調整しています。確認環境はMacですが... [01.08.28:現在では5.0が登場して久しいのですが、本稿を推敲する余裕がありませんので、ご容赦下さい。基本的には、そう変わりないので...]
 1999年6月に登場したAcrobat 4.0について▲

▼役立つリンク(01.08.28)

報告書電子化の基本となるPDF

 PDF(Portable Document Format)は、Adobe Systems による電子文書の規格です。PDFの別名Acrobat は、PDFに関わる、一連の(Adobe Systems製)アプリケーションを指しています(元々コードネームでした)。

 なぜPDFなのかというと、PDF電子文書と、紙への印刷物(その有無にかかわらず)との、実質的な関係が保たれるからです。PDFと印刷物の関係は、ある意味では、金本位制における現金とゴールドの関係にも似ています。

 そして、DTP(集版のデジタル化)を実施した場合、DTPデータを容易にPDFに変換できるからです。これによって、コストを気にせずに、文書の電子化が可能になったわけです。

 PDFは、異なるフォント環境、異なるコンピュータ環境においても、オリジナル文書とほぼ同様のレイアウトが、再生できるようになっています。その意味で、マイクロフィルムの電子版ともいえます。電子的なフォーマットでありながら、印刷物との、原理的・技術的な対応関係が強く保たれています。

 つまりPDFは、文献保存の一形態として重要な意味を持っている、ということです。電子文書としては、HTMLなど、様々な可能性があるのですが、それらはオリジナルレイアウトを完全に保持しておくことができません(将来的には、この辺の事情は変わる可能性がありますが−CSS2やSVG等)。大事なことは、PDFの存在によって初めて、印刷物自体を所有し続ける必要性が、必ずしも無くなったと、主張できることです(PDFと同様の趣旨のフォーマットは他にもありますが、PDFがデファクトスタンダードとなっています)。

◆補足.PDFの将来について

 PDFはAdobe Systemsの規格ですが、規格自体は公開されており、規格の利用は無償です(PDF処理アプリケーションはIBMなどからも出ていますし、MacOS XではPDFを標準形式にしようとしています)。この点は、ポストスクリプトがかなり高価で、プリンタメーカーなどが苦労しているのとは、だいぶ異なります。PDFは、欧米では既に電子文書の一方のデファクトスタンダードになっており(もう一方はML系)、他のポータブルドキュメント規格(書式が再現される電子文書)の追随を許さない状況になっています。PDFのバージョンが上がっても、注意してさえいれば、PDFの互換性を保つことができます(Acrobat Readerは永久に無償配付)。またAcrobat 4からは、プリプレス(商業印刷向きの版下作成)への対応性がさらに増し、DTPのプロセスにPDFが利用される可能性が高くなっています。こうしたAdobeの戦略を考えると、PDFの利用可能性が将来にわたって損なわれることはありえない気がします。たしかに、ML系のスタイルシートの機能が上がり、それらを有効活用するようなアプリケーションが開発されれば、Acrobatのお株を奪ってしまう可能性はないわけではありません。フォントのアンチエイリアス処理にしても、最近はOS自体が対応する方向にありますから、アプリケーションが対応する時代ではないかもしれません。ただ、最悪のケースを考えても、Acrobat作成用アプリケーションが、オープンソース化される結末にしかならないでしょう。

PDFの利用

 PDF再生専用のアプリケーション=Acrobat Reader は、Adobe Systems から無償配付されています(再配付も自由−オリジナルのインストーラを改変しない、という当然の前提が付きますが)。日本語版はAcrobatのバージョン3から登場し、Windows及びMacOSで利用できます。UNIX版は英語版しかありませんが、Acrobat 4.0では、英語版であっても、日本語PDFを閲覧可能にする手段が提供されました。Acrobat Readerは、雑誌付録CD-ROMに収録されている例も多く(6MBくらいありますので、ダウンロードで入手するのは非現実的です)、またMacの場合は、MacOS 8.0以降のシステムディスクに、あらかじめ収録されています。Windowsでもプレインストールされる場合が多いようです。

  Acrobat Readerのダウンロード  Acrobat/PDFの紹介  Acrobatの技術情報  [AdobeSystemsサイト]

 PDF文書とWebブラウザとの連繋に関しては、若干注意が必要です。HTML文書中からリンクする場合、どのような挙動をとるかは、Webブラウザ側の設定に依存するからです。

 プラグイン表示だと、Webブラウザウィンドウの中にAcrobatウィンドウが開き、入れ子状態になります。従って表示領域はその分狭くなります。プラグイン表示には挙動不振な点も多いので、通常は、プラグイン表示ではなく、直接Acrobatアプリケーションで表示するように設定することをお薦めします [追加註:IE5.0以降では挙動が安定し、問題なくなりました]。

PDFの閲覧

 PDFの閲覧は、リターンキーやPageUp/PageDownキー、カーソルキーなどによるページめくり、ないしページ内に用意されたハイパーリンク(Webブラウザと同様に、カーソルが指差し状態に変わります)を適宜利用し、時には「しおり」(最も簡易な目次=ハイパーリンクの仕組み)で任意のページへ行く、という具合になります。

 PDFは標準状態では字が薄く見えるかもしれません。これは文字表示にアンチエイリアシングを行っているためです(Acrobatではスムーズフォントと呼ばれています)。

[追加註:Acrobat 5.0では、CoolType(クリアタイプ)の技術も導入されました。これは本来は液晶用なのですが、明朝体のフォントの場合、CRTでもCoolTypeを使って濃い表示にすると具合がいいようです…サンプルDに設定しています…つまり、CoolTypeの設定はCRTでも避けられないようです…おかげで表示速度はさらに遅くなりましたが]。

 表示倍率が低い場合は、スムーズフォントをオフにした方が読みやすいかもしれません(遅いマシンでも表示が早くなります)。Acrobat 4では、文字に加えて、白黒画像(ラスター系2値画像)に対してもアンチエイリアシングが行われます。この機能によって、イメージでの電子文書化が実用的になってきました(末尾参照)。ちなみにベクター画像のアンチエイリアシングは、Acrobat 4でも見送られました(Illustratorでは実現していますが)[→Acrobat 5では、実現しました]。

 本文を本気で読むためには、表示倍率150〜200%くらいが、具合がいいようです(元のフォントサイズが10ptくらいの場合)。全幅表示(Acrobat 3ではショートカットキー K、Acrobat 4ではショートカットキー2)、ないし有効領域表示(Acrobat 3ではショートカットキー M、Acrobat 4ではショートカットキー3)だと、最適な表示倍率になるようです。左側の「しおり」を隠して、さらに表示ウィンドウを広げるのもいいでしょう。

 なお、Acrobat 4では、PDF文書のフォント設定と全く同じフォントが、閲覧中のローカルマシンにもある場合、それで表示するようになっています。そのフォントが、ローカルマシン上でアウトラインフォントでない場合、表示品位が若干低いものとなります。ローカルフォント使用をオフにし、常にアウトラインフォントで表示するよう切り替える機能は、製品版Acrobat 4にはあるのですが、無償版Acrobat Reader 4では切り替えられないのです。ただ、一般のユーザー環境では表面化しない問題だと思われます(DTPで使われるフォントは、一般ユーザーは持っていないから…細明朝体と中ゴシック体は除く)。

PDFの作成とDTP

 PDF作成のためには、製品版の Acrobat が必要です。これには Acrobat Distiller、及びAcrobat Exchange が含まれています(Acrobat 4では、後者はAdobe Acrobat 4.0に名称変更、以下単にAcrobatと言う場合は、この編集対応の製品版Acrobat)。原理的には、全ての印刷可能なコンピュータアプリケーションから、PDFは作成可能です(一般にはPDF Writer使用)。

 とはいうものの、PDFに取り組むのであれば、いわゆるDTP(DeskTop Publishing ないし DigiTal Prepress)から行うことをお勧めします。DTPは、現実的にはMacにおける PageMaker ないしMacにおける Quark XPress を指しています(他にもいくつか例を挙げることができますが...)。

 では、DTPと通常のワープロとの違いは何でしょうか。紙面デザインの完成度は、使い手の問題ですが、一般には文字組みの美しさが違います。微妙な文字詰め(カーニング)は、現在でもDTPの独壇場のようです。それを気にしないのであれば、DTPにこだわる意味は薄くなります。とはいっても、いずれにせよ、全ての頁上の、本文、図版、写真、キャプション等が、デジタル的にレイアウト済みの状態で完成していないと、PDFは作りようがありません(頁ごとに、ばらばらであっても構いませんが... 後でAcrobat でまとめることができます)。結局、DTPの実践は、PDFへの一道程であると思われます。

 (かいつまんで言うならば)PDFの作成は、アプリケーションからのプリントを、ポストスクリプトファイルに出力し、出来上がったポストスクリプトファイルを Acrobat Distiller にかけてPDF化します(但し、ポストスクリプトベースでない、通常のアプリケーションでは、PDFWriterを使うべきです…Excelや一般のワープロ)。出来上がったPDFファイルは、Acrobat にかけて、ページの集成や、しおり、ハイパーリンクの設定などを行います。Adobe自身のPageMakerやFrameMaker、InDesignだと、DTP側のリンク設定を生かしつつ、PDFの出力まで自動化できます。

PDFと印刷会社

 内部的にDTPを実施していない場合でも、印刷会社にDTP方式で印刷準備(集版)をしてもらえば、同じことです。DTPデータが完成すれば、後は殆ど自動的な変換作業で、PDFが作れます。DTPファイルを適正に作っていく過程こそ、コストの大部分を占めるのです(ハイパーリンクを作り込むのは、また別の問題ですが...)。少なくとも、「しおり」の作成までは、サービスでやってくれるでしょう。

 実際、1997年6月に日本語Acrobat 3 が発売されて以来、PDFをサービスで試作してくれる印刷会社が、増えています。なぜサービスなのか、といえば、単純にPDFを作成するだけなら、コストが実質的にゼロに等しいからです。

 もしもPDFやDTPを知らない印刷屋がいたら、そいつはもぐりです。とはいっても、営業畑の人間は、技術に疎い人が多いのも事実です。少なくとも、一度は技術サイドの人間と、直接対話する機会を設けることをおすすめします。そのくらいは、営業サイドに要求してもいいでしょう。

PDFの容量

 報告書をPDF化した場合、図版の量や複雑度に依存するのですが、概ね35〜70KB/頁になります(テキストだけなら、その1/10程度で済みます)。つまり200頁なら7〜14MB、1000頁なら35〜70MBになります。つまり、CD-ROM1枚に、少なくとも1万頁分以上は、収録できることが分かります。

 PDFは、よく、ファイル容量が比較的小さいと言われます。初期設定では(Acrobat4.0ではScreenOptimizedの場合)、写真などのラスター系階調画像は72dpi(ppi)、ラスター系2値画像は300dpiにダウンサンプリングされており、しかも圧縮されています。つまり、PDFのファイル容量は(ポストスクリプトファイルの最適化の問題もあるのでしょうが、より大きい部分は)Acrobat Distiller におけるラスター画像の解像度設定と圧縮の程度によって決まってくるのです。

 設定を変えて、階調画像を300〜350dpi(ppi)、2値画像を800〜1200dpi、いずれも無圧縮ないし低圧縮とすれば、(理論的には)オフセット印刷にも耐える品位を保つことが可能です。そのようにして作成したPDFの、ファイル容量は巨大なものになりますが、後々、実体としての印刷物を復元することが可能になります(印刷におけるPDFの実用性は、Acrobat 4で確かなものになったようです)。ただし、ディスクでの配付をターゲットにするのであれば、階調画像は100〜150dpiでいいのではないでしょうか。

 通常は、ローカルなレーザプリンタをターゲットとすれば、ディスクでの配付には十分ではないでしょうか。

付記1.スライドショー

 Acrobatの環境設定(初期設定)で、全画面表示(フルスクリーン表示)の時の自動スライドショーが出来る。要するにページめくりが自動化される。間隔を秒単位で指定でき、トランジションも指定できる。ループも指定できる。これはプレゼン等にも有効である。これはAcrobat自体に備わっていた機能であり、ver.3のreaderでも利用できる。[03.1.10]

付記2.ラスター画像のアンチエイリアシングとその活用による文書電子化

 遺物や遺構などの図版を、スキャンして収録した場合、印刷原稿としては2値画像になります。Acrobat 3では、線が細い2値画像をPDF化すると、あまりきれいな画面表示は得られませんでした(かすれることもあります)。前述のように、Acrobat 4では、白黒画像のアンチエイリアシングも行われるようになったので、この問題は解消しました。

 この機能によって、古い報告書をスキャンしてPDF化する場合、300dpiで2値の画像にしておけば、きれいな表示と、印刷時の品位が両立するようになりました。容量も、135dpi・4階調・GIF画像と、同じ程度に収まります。PDFにしておけば、ファイル整理もつきやすく、目次機能(しおり)も便利です。


注:

ベクター画像
線分や関数曲線などで構成された画像、計算によって描画される。CAD系、ポストスクリプト系など
ラスター画像
ピクセル(画素)の集合としての画像、スキャン画像の他、ベクター画像から生成することも多い(ラスタライズ)
階調画像
白と黒だけでなく、中間色(中間濃度)を持つ画像
2値画像
白と黒だけで構成された画像

WebsiteTop技術情報>PDF解説