整データ

非正規な表データ

 データベースには、正規化という概念があります。表(テーブル)は複数の関連したデータを集成し、それを何かの順番に並べたものです。ところが、データの中には関連が定まっているものがあり、一つが決まれば、関連したデータが分かってしまうものがあります。そうした冗長なデータを別の表に分離して管理しようというのが、データの正規化であり、正規形です。正規形の話はともかく、非正規なデータの特徴は、項目の中に階層性がある事です。

 項目の中に階層性がある表なら、Excelの好きな考古学界にはあふれています。項目の階層性を示したいだけなら、最上部の項目行だけ2行にすれば済むのですが、データは1行1データ(レコード)に収め、一つのデータが複数の行にまたがるような表は、作るべきではありません。そういう表は、あまりにもイレギュラーで、例えば csv(互換性の高いテキスト形式の表データ)にしようとしても、始末に負えません。

非正規な表データは止めよう
データは1行1レコード

Excelのセル内改行

 1行1データに収めるのでは、表現として物足りない、という贅沢な悩みがあるかもしれません。どうしても必要だという時には、Excelのセル内改行というテクニックを使って下さい。

まずセルをダブルクリックしてセル編集状態にします。
改行したい位置で Alt+Enter(Macならoption+command+return)で改行です。

 これなら、データとしては1行1レコードのままで、Excel上の表現としてはセル内改行になっています。ちなみに、このデータをテキスト化してみると、セル内改行のところで、データも改行されてしまいます。これだと、データとしてはちょっと手直しが必要ですが、セル内改行されたデータは""で囲まれてますから、見分けはつきます。

 表をHTML化する立場から言いますと、改行したいところに<br>を入れておいてもらえば話は早いのですが...

インデントとタブを知ろう

 文献リスト等で見かけるところですが、一つの文献が複数行にわたる時、2行目以降を引っ込めることがあります。位置調整にスペース(空白文字)を入れる事がよくありますが、スペースを入れてしまうと、文書の幅が変わった時にずれてしまい、始末に負えません。行頭の開始位置を調整する機能は、インデントに任せるべきです。インデントは、ワープロの段落書式で設定できます。センタリングは、言うに及びません。

 表に近い内容を、表罫線無しで本文に入れたい事があります。語の冒頭をそれぞれ揃えたいので、スペースを位置調整に使うことがよくあります。こういった場合は、タブ設定を使うべきです。これもワープロには必ずある機能です。

レイアウトを整えるためにスペースを使うのは止めよう

 HTMLでもスタイルシートでインデントが設定できます。実際には、文献リスト等はHTMLのリストタグ(ul)を利用しています(その方が手っ取り早く、識別性も高いので)。注には、定義リストのタグ(dl)が使えます。

無力なワープロ

 殆どの場合、Windowsのワープロで文書が作成されます。その場合、頻繁に機種依存文字が使われますし、英数字における全角と半角の混在は日常茶飯事です。一桁の数字は全角にする場合もありますが、基本的には半角で統一すべきでしょう。

 こうした表記の乱れは、テキストエディタで確認し、置換する必要があります。その手順を考えると、一般的なワープロが如何に無力な存在であるか、思い知らされます。[03.7.26修正]


index  …03.6.26