水牛だより7月1日
青空文庫のテキストを使って製本してみる

2005年07月04日

 プロジェクト・グーテンベルク:電子テクストの始まり

1.インターネット前史

 アメリカ国防総省の小さな部局、高等研究計画局(ARPA)。その中の情報処理技術室に1965年、ロバート・テイラーという男がやってくる。当時のコンピュータ界はこの技術室から資金を提供されて、それぞれの場所でそれぞれのシステムで独自に研究が行われていた。たとえば主なものをあげてみると、大学ではMIT、ハーバード、スタンフォード、カリフォルニア(バークレー&ロサンゼルス)、カーネギー・メロン、イリノイ、ユタ。研究所ではスタンフォード、リンカーン、ランド。企業ではボルト・バーネック&ニューマン。

 66年、室長となったテイラーは、このばらばらの研究拠点をどうにかひとつにつなぎ、よりよい発展が望めないかと考えていた。このネットワークの構想こそ、インターネットの前身アーパネットである。69年、カリフォルニア州で4つのコンピュータをつなぐ実験が行われ、さまざまな試行錯誤を経て、2年後には先ほどあげた拠点をすべて含んだ、15ノード・23地点のコンピュータがネットワークに接続された。それはちょうど、アメリカ建国200周年を5年後にひかえた年のことだった。

 
2.コンピュータと青年

 1971年、イリノイの夏はとにかく暑かった。

 暑いと人間やる気が起こらない。おまけに環境が悪いとなるとなおさら。仕事だって宿題だって手につかない。イリノイ大学の学生、マイケル・スターン・ハートも同じ考えだったらしい。どこへ行っても宿題がはかどらない。寮も図書館も研究室もさわがしくてやってられない。そんな彼が、友人がオペレータをやっている、明るく静かで空調も完備されたコンピュータ・ルームに転がり込んだのも、自然な話だった。

 当時のコンピュータというのはとんでもなく高価でとんでもなく巨大でやっぱり熱を出す。まさに《計算機》と呼ぶにふさわしい代物で、立派な部屋にでんと構え、丁重に温度管理されていた。もちろん高額なものがそうたくさんあるわけではないので、研究者たちはみんな計算したいものを持参してコンピュータ・ルームにやってきては、専門的な知識を持っているオペレータに計算機を操作してもらう。たまたま計算機の使用が混んでいるときには行列ができる(人orプログラムの)。人が次々とやってきてオペレータにお願いしていくことからか、コンピュータ・ルームは《祈祷室》の様相を呈し、オペレータは《僧侶》然とした存在になってくる。

 マイケル・ハートはそんな光景を見ながら、コンピュータのそばで宿題をこなしていくうち、自然と自分の周りにあるものの使い方を覚えていった。もちろん、父親がシェイクスピア学者という肩書きには似合わず、当時出始めた電子機器にはまっていたことや、母親が数学教育学の教授であったことも素地としてあったかもしれない。けれどもともかく、彼は誰にも気づかれないうちにコンピュータを身体で理解していった。

 ある日、コンピュータ・ルームはとても忙しかった。その日も彼は部屋に入り浸っていたが、そこを仕切る3人のオペレータはものすごい量の仕事で完全に手がふさがっていた。そこへ、常連となっている研究者が、プログラムを手にあわてて部屋にやってきた。

「急ぎで、これを実行してほしいんだけど。」

 もちろん、3人のオペレータは忙しく手がつけられない。普通なら待ってもらうか、もう一度あとで来て、ということになる。けれども本当に急がなければならなかったらしく、それを察した彼は、友人であるオペレータにこう言ってみた。

「おれが、このプログラム走らせてもいい?」

 すると3人のオペレータはものすごい顔をして驚いた。

「おまえ、動かし方知ってるのか!?」

 そこで彼は、紙に読込と実行の手順を書いた。オペレータたちはそれを見て、

「それでいい、やってみろ。」

 プログラムは見事実行された。その日から、マイケル・ハートはコンピュータ・ルームの《非公式》オペレータとなった。


3.プロジェクト・グーテンベルクの誕生

 彼はオペレータのひとりから権限を借りて作業をすることになった。そうして非公式に続けていたが、7月3日、夜はふけ、そろそろ深夜勤務の時間になる頃――

「マイケル、おまえに正式なアカウントをやるよ。」

 と、権限を借りていたオペレータが彼に言った。ただ、そのアカウントをドルに換算したときの価値を聞いて、彼は心臓が飛び出るくらい驚いた。

「1億ドル!?」

 しかも、もし1億ドル分使い切ったら、また補充してくれるという。途方もない話に唖然としながら、その高価なコンピュータを何に使えばいいのかと、周りのオペレータに聞いてみても、

「いいんだ、好きにたわむれとけ。」

 なんて返事をされる始末。そこで、その価値に見合う利用方法を彼はひとりで考え始めた。

 ――プログラム? たしかに FORTRAN なら扱えるけれど、別にたいしたプログラムなんか組めないし、作ったところで遠い将来まで使われるかどうかわからない。それじゃあ価値のムダ遣いだ。できるなら、このコンピュータでもってずっと先まで意味のあるようなことをしたい……

 彼はそれから1時間半くらい悩みに悩んだ。

 ――何に使おうか、できたら、人の役に立つことを。軍事目的とか、金もうけはダメだ。うーん。

 そして最終的に行き着いたのが、「利用価値のある文献をコンピュータに入力し、ネットにつながったコンピュータからなら誰でもアクセスして利用できるようにする」というアイデアだった。

 当時ネット上で読めるモノといったら、だいたいがコンピュータが壊れたらどうすればいいとか、修理屋の連絡先とか、トラブルシューティングの類ばかりだった。そこに何かしらの読むに値するモノを入れようと思ったのである。その頃はまだネットはたかだか100人の研究者が使うきりだが、彼はのちのちこのネットは大きく成長して、全世界の人々のもとへと広がるという確信があった。そうすれば入力したモノは遠い先々まで有効に活用される。

 彼は早速作業に取りかかった。文章を入れるとしたら何を入れよう。アメリカはちょうど建国200年に向けてムードが高まり、いたるところで独立宣言を印刷したものが出回っていた。彼もたまたまその日、独立宣言のコピーを1枚持っていた。

 ――よし、これを入力しよう。

 そうしてそれから1日で入力・校正を終え、利用者への手引きも用意した。

 プロジェクト・グーテンベルクの始まりだった。


4.インターネット以後

 その後プロジェクト・グーテンベルクはこつこつとそのテクストの数を増やしていった。1つだったものが10に20に50に100に。いまでは16000の電子テクストがそこにあり、世界中の誰もがネットワークにつなぎさえすれば望んだときに人種・性別・階級を問わずそれを手にすることができる。

 マイケル・ハートはこう言う。

「電子テクストは、空気以外にして世界で初めて、望めば誰でも手に入るものとして現れたんだ。」

 今では、プロジェクト・グーテンベルクと同じような趣旨のサイトが世界中にある。色々列挙してみると――

 アフガニスタン
 アルメニア
 イタリア
 エスペラント
 オランダ
 スウェーデン
 セルビア
 タミル語
 デンマーク
 ドイツ
 ハンガリー
 フランス
 ポーランド
 ラテン語文献
(できるだけ色んな言語のものを並べようとしたら、やはり言葉の意味がわからないので中身の確認がいまいちできていません、ご了承あれ)

 筆者が昔からお世話になってるアーカイヴで行くと、

 アンデルセン
 イソップ
 グリム
 ペロー
 

 もちろん青空文庫もたくさんあるアーカイヴのひとつ。

 現在、マイケル・ハートのホームページに行くと、初期プロジェクト・グーテンベルクのトップを飾っていた「無知と文盲の鉄格子を打ち破れ」と書いた本人の画像とともに、こんな言葉が書いてあった。

「昨日の自分がやったことを見て、今日もまだすごいって思えたら、それはまだまだ明日への目標が小さい、ってことだね」

 と言われても、1971年7月4日に彼が始めたことは、果てしなくすごいことだったと、私は思う。

★この文章を書いた人→大久保ゆう★こんな時間に→2005年07月04日 06:20 ★トラックバック
 コメント

大久保さんの記事への補遺として。
エスペラントならば、以下のサイトもおすすめ:
"Virtuala Esperanto-Biblioteko" (直訳で「仮想エスペラント図書館」)
http://www.esperanto.net/... 文学作品以外の情報もあります。

"eLibrejo"(elektrika Librejoの略ならば、「電子書店」)
http://www.esperanto.nu/... pdfファイルで(原作/翻訳)文学作品をダウンロードできます。
書店と銘うっていますが、特に料金はないようです。ファイルは、印刷出来ない設定になっていました。

Posted by: Juki at 2005年07月05日 23:28

青空のばあい入力と校正の2段構えになってますが、そのあたり、ほかの電子図書館もおなじなんでしょうか? それからテキスト使用についても、青空同様原則自由と考えていいものでしょうか?

Posted by: しだ at 2005年07月06日 07:14

>Jukiさん。
フォローありがとうございます。
Jukiさんならエスペラントに何らかの反応があるはずだっ! ……と思っておりました。

>しださん。
作業原則は色々とばらつきがあるようですが、
テキスト使用に関しては、たぶんそうだろうなあ、
と思われるところをリンクしてみました。
使用規定は、基準を作る前の青空文庫の感覚と、
同じようなところがほとんどだと思います。
ちなみに、ここに挙げていないものには、
有料のもところどころありましたよ。(あと会員制とか)

Posted by: 大久保ゆう at 2005年07月06日 07:45

ゆうくん、どうもありがとうございます。
ほかにも比較したいことをちょっと箇条書きにしてみます。
・活動開始年
・公開冊数
・参加ボランティア人数
・テキスト修正方法
・新規創作の受け付け
・別版の作成

こんなところでしょうか。
電子図書館のトータル総量ってCD何枚分ぐらいになるんだろう?
作業マニュアルの比較なんかも見てみたいですね。

Posted by: しだ at 2005年07月07日 14:42

 コメントする
※URLを入力するときは、そのままURLのみを入力してください。自動的にリンクされます。Aタグを使用することはできません。
※コメントスパム対応のため、POSTに時間がかかってしまいます。一度クリックしたら、気ままにお待ちください。










名前、アドレスを登録しますか?