![]() |
|
|
|
底本の画像要素の取り扱いに関しては、工作員作業マニュアルが大まかな作業方針を示している。
画像を組み入れる際、入力テキストにどう注記するかについて、マニュアルは「[#写真入る]」といった例を示すにとどめている。
作業方針の細部が示されていなかったため、処理実績にはばらつきが生じていた。
こうした実態を踏まえて、青空文庫メーリングリストの「[aozora:5223] 画像の注記」チェーンで、形式の統一について話し合いがもたれた。(落着点は、[aozora:5243][aozora:5244]と思われる。)
公開ファイル作成にあたって、画像注記をxhtml版中でどうタグ処理するかについては、点検グループ内で話し合って、[[xhtml組み込み用画像ファイル名の付け方]]などのメモをまとめ、これらにそって処理してきた。
これまでのこうした流れを踏まえて、底本にある画像要素の取り扱い方針を、あらためてまとめておく。
なお、このメモは、入力者、校正者に、以下の作業ステップをすべて実践してもらうことを期待して用意するものではない。
画像注記の形式整備や、画像ファイルの作成は、点検グループ、公開用ファイル作成担当に委ねてもらってもかまわない。
このメモの狙いは、公開ファイルがどのように作られるか、その道筋を示しておくことにある。
▼底本中の画像要素の取り扱い
底本中の写真や図版、挿絵などは、マニュアルの以下の方針に従って、原則として、入力しない。
「●写真や挿し絵などは、画像ファイルとして扱い、基本的に、入力の対象には含めません。…」
工作員作業マニュアル、2入力-1
http://aozora.gr.jp/KOSAKU/MANUAL_2.html
入力しなかった画像要素に関しては、省いた旨を、テキスト版中、xhtml版中に注記する必要はない。
ただし、本文の理解を図る上で不可欠であり、かつ著作権が切れていることを確認できる場合は、以下の方針に従って画像要素を入力する。
▼画像ファイル形式
画像形式は、pngとする。
解像度は、72ppiとする。
色深度は、ファイルサイズを抑えるため、画質の明らかな劣化を起こさない範囲で浅くする。
▼画像ファイル名
画像のファイル名は、以下のように付ける。
fig作品ID_通し番号.png
「作品ID」は、1バイトの数字で表記する。(各作品のIDは、総合インデックスで確認できる。)
「通し番号」は、1バイト数字2ケタの「01」から始まる連番とする。「99」以降が必要になる際は、「001」から始まる1バイト数字3ケタの連番とする。
例)fig2441_01.png
▼テキスト版中の画像要素の注記
テキスト版中では、以下のように注記する。
[#××××××の××(画像ファイル名)入る]
↑ ↑
内容の説明 画像の種類
「内容の説明」は書き込むことを原則とするが、省略してもかまわない。
画像の種類を示す語は、「図」「地図」「絵」「挿絵」「表」「写真」等を使用する。
例)[#石鏃二つの図(fig42154_01.png)入る]
[#ひこうかばんの挿絵(fig42385_01.png)入る]
[#挿絵(fig42385_01.png)入る]
底本が画像に説明文(キャプション)を付けている場合は、鍵括弧内に引用した上で、以下のように書く。
[#「第一七圖 國頭郡今歸仁村今泊阿應理惠按司勾玉」のキャプション付きの図(fig4990_07.png)入る]
▼xhtml中の画像ファイルタグの書き方
「図」「地図」「絵」「挿絵」等、人が描いたものは、「img class="illustration"」とし、テキスト版注記の「××××××の××」にあたる部分を「alt」にうつして、以下の例のように書く。
<img class="illustration" width="608" height="380" src="fig42385_01.png" alt="ひこうかばんの挿絵" />
<img class="illustration" width="564" height="424" src="fig4990_07.png" alt="「第一七圖 國頭郡今歸仁村今泊阿應理惠按司勾玉」のキャプション付きの図" />
「写真」については、「img class="photo"」とし、テキスト版注記の「××××××の××」にあたる部分を「alt」にうつして、以下の例のように書く。
<img class="photo" width="623" height="360" src="fig42383_01.png" alt="牛の置物の写真" />
<img class="photo" width="564" height="424" src="fig4990_07.png" alt="「書斎にて」のキャプション付きの写真" />
画像タグの行末には、原則として「<br />」を付す。
▼画像ファイルの配置
画像ファイルは、テキスト版のzip圧縮ファイルに同梱する。
合わせてxhtml版での表示用に、公開サイトのサーバーの、cards>人物IDフォールダー>files内に置く。
思ったことをメモしておきます。
1.なぜ拡張子があるのに、fig のように頭につける必要があるのか。
2.通しの連番以外のほうが好ましいばあいも考えられるのではなか。
たとえば、a,b,c... a,i,u... i,ro,ha... など
3.著者単位でディレクトリ管理している理由は?
作品単位で管理しない理由はなぜか。
4.頻出度の高い画像(たとえば屋号・梵字など)は、どこかで
一元管理を考えてもいいのではないか。
5.旧字旧かな版と現代表記版で同一画像を流用するばあいは?
現段階での個人的な結論は、fig やそれ以外の接頭子はあってもいいし、なくてもいい。たとえばキャプションに図1,図2,図3... 表1,表2,表3... とあるならば、ファイル名もそれに対応しているほうがおそらく作業しやすいことは想像つく。さらに、通しの連番も連数字に限定してしまう必要はおそらくない。
以上の理由から1と2については、現行の作業方針は柔軟性に欠けると思うので、より柔軟性をふくんだ形への見直しを検討してもいいんじゃないでしょうか。
一工作員として、しださんのメモにコメントをつけてみます。
1.なぜ拡張子があるのに、fig のように頭につける必要があるのか。
WindowsではMacと違って、拡張子が違っていてもファイル名が同じだと同一フォルダに置けないので、そのあたりの配慮かと思っていました。Windowsではデフォルトの設定がたしか「拡張子を表示しない」だったような。たとえば画像と音が含まれようなファイルの場合、「fig作品ID_01.png」「aud作品ID_01.mp3」のように対応できるようにするためかと。
2.通しの連番以外のほうが好ましいばあいも考えられるのではなか。
たとえば、a,b,c... a,i,u... i,ro,ha... など
たとえば「図イ」という画像をあらわすのに、「作品ID_i.png」、「表A」という画像をあらわすのに「作品ID_a.png」とするといった感じでしょうか? 連番だと、一部の画像の著作権が切れていないようなときは悩んだりしますね。たとえば2人で挿絵を描いていて、1人は著作権が消滅しているけど、もう1人はあと10年有効だったりとか。
見直しの検討には賛成ですが、いまのところ私にはこれといった良案はありません。
3.著者単位でディレクトリ管理している理由は?
作品単位で管理しない理由はなぜか。
データベースをそのように設計したから、だと思います。なぜそのように設計したかといえば、データベース以前には作家単位でディレクトリを分けていて、それを踏襲したからだと思われます。なぜ作家単位でディレクトリを分けるようになったかと言えば、当時はファイル名が作品名をローマ字表記したものだったので、同じ名前の作品があると困ることになるという配慮からだと思われます。
いまでは固有の作家ID、作品IDが付されますから、できれば作品別のほうが良かったですね。ただ変更するとなるとデータベースの根本的な見直しが必要になるでしょうから、おいそれと手を付けることはできないと臆測されます。
4.頻出度の高い画像(たとえば屋号・梵字など)は、どこかで
一元管理を考えてもいいのではないか。
JIS第3水準、第4水準の漢字などの画像は一元管理されています。JIS X 0213の面区点番号という識別子がはっきりしているからですね。もしそれ以外の画像などを一元管理するのであれば、利用しやすいように整備する必要があると思われます。
5.旧字旧かな版と現代表記版で同一画像を流用するばあいは?
現状では作品IDで区別していますから、たとえ同一画像でも作品IDごとにそれぞれ用意するのではないでしょうか?
> WindowsではMacと違って、拡張子が違っていてもファイル名が同じだと
> 同一フォルダに置けない
なるほど。
> たとえば「図イ」という画像をあらわすのに、「作品ID_i.png」、
> 「表A」という画像をあらわすのに「作品ID_a.png」とするといった感じ
> でしょうか?
はい、そうです。
> 見直しの検討には賛成ですが、いまのところ私にはこれといった良案は
> ありません。
画像をふくむ作品を実際に作業してるかたがたが、どんどん試してくださっていいんじゃないでしょうか。童話中の挿絵のようなばあいには、現行の作業方針は有功な管理方法だったと思うんです。だから、まったくの白紙にもどすんじゃなくて、新規の具体的サンプルを、ひとつずつためていけばいいんじゃないかと思うのですが。
ファイル名の頭に fig や aud をつけるという案は、とくに賛成も反対もしません。付けても付けなくてもOKです。たぶん作品によって、とくにかまわないばあいも考えられるし、もうちょっと工夫したいと思うばあいもありそうですから。現行の作業方針をエキスパンダする方向で賛成です。まずは、ここまで。
ところで、画像の縮尺はいまのところ未規定《みきてぃ》だったと思うのですが、原寸のまま=縮尺率100%と考えていいでしょうか。
> WindowsではMacと違って、拡張子が違っていてもファイル名が同じだと
> 同一フォルダに置けない
そんなことはないですよ。
少なくともXPでは「登録された拡張子を表示しない」設定でも、同一ファイル名で異なる拡張子のファイルを作成することが出来ました。
現在確認できる環境にありませんが、95とMeでも可能だと思います。
2000と98とNTはいじったことがないので分かりませんが、内部的には拡張子込みでファイル名として扱っているので、拡張子が異なれば別ファイルとして扱われるはずです。
>内部的には拡張子込みでファイル名として扱っているので、拡張子が異なれば別ファイルとして扱われるはずです。
その通りのようですね。御指摘ありがとうございました。
「1.なぜ拡張子があるのに、fig のように頭につける必要があるのか。」に対するコメントを以下のように訂正いたします。
Windowsでは「拡張子を表示しない」設定ができるので、同一のファイル名だとファイルの種類が区別しづらい場合があるため。また、画像とそれ以外のファイルを並べ替える際にも、便利かも知れません。
Posted by: すずき at 2006年05月26日 01:19