GNU arch Book

GNU arch は バージョン管理システムとよばれるプログラムの一つであり、既存のバージョン管理システムのいくつかのアイディアを更に発展させようとして Tom Lord によって2000年の初頭から開発されてきたものだ。改良点についての詳細はこの本の内容を超えているが、最も重要な特徴は、分散型のシステム構成をとっていることと、チェンジセットと呼ばれるデータを中心とした設計になっているところだ。

この本の読み方

この本はたった 3 種類の人たちに向けて書かれたものだ。

コンピュータには詳しくないが、バージョン管理システムに興味がある人: あなたには第1章が役には立たつと思う。もしこの章を理解できないとすれば、それは私の書き方が悪いからだ。誰も信じてはくれないが、私にとってはこの章が一番重要な章だ。
Windows を通常利用している: 非常に残念なことに、現時点では GNU arch は Windows 上ではまだ動作しない。詳しい動向を追ってはいないが、移植を進めているチームがあると聞いている。第1章のギャグにつき合ってくれるだけで許してほしい。GNU arch の理解度には限りがあるが、ギャグの改良には終りはない。
Unixのコマンドを利用できる: (XXX)
ハッカー: こんな本の程度の内容なんてすべて知っている、などと言わないでほしい。この本の中にある間違いや、改良点について示唆していただけると非常に助かる。

この本での約束ごと

ここではこの本で利用されるさまざまな規約について触れる

印刷上の規約

固定幅: コマンド、コマンド出力、スイッチに利用する
イタリックな固定幅: プログラムやテキスト中で置き換え可能なアイテムに対して利用する
イタリック: ファイルやディレクトリの名前に利用する

アイコン

注意

このアイコンは周りにあるテキストに関連した注意を示す。

ティップ

このアイコンは周りにあるテキストに関連したヘルプ情報を示す。

警告

このアイコンは回りにあるテキストに関連した警告を示す。

ソースコードのサンプルは、単なる一例にすぎない。普通のやり方で利用できるとは思うが、問題点を簡単に示すためのものであり、良いプログラミングスタイルの例として載せたものではない。

この本の構成

以下の章とその内容をここで一覧にしておく:

第 1 章, 導入: バージョン管理システムの一般論、GNU arch が生まれた背景、その特徴について
第 2 章, インストール: 説明を始めるに当たって GNU arch を実際にインストールしてみる
第 3 章, 基本的な使い方: 他アーカイブとのやりとりを含まない範囲での日常的な利用方法に沿った説明をする。データのインポート、取得し、修正し、コミットなどについて触れる。
第 4 章, 既存プロジェクトの移行: 主に既存プロジェクト移行時によく問題になるファイル認識規則についての説明
第 5 章, マージとブランチ: マージとブランチについての説明。他アーカイブとのやりとりをする必要がある場合にはこの章の理解が必要になる。GNU arch に特化した内容が多く、分散バージョン管理という観点からは最も重要な章かも知れない。
第 6 章, XXX
第 7 章, YYY
第 8 章, ZZZ
第 9 章, WWW
Appendix A, AAA
Appendix B, BBB
Appendix C, コマンドリファレンス: GNU arch コマンドごとにその機能を詳細にのべた。一度全体を理解した後は、この部分が一番重要になるだろう。

この本はGFDLだ

この本は、The GNU Free Documentation License にしたがう。このライセンスは、文中に "Free" という言葉が含まれているにもかかわらず、Free ではない、と考える人々がいる。私はその区別ができるほど、この問題についていまだ深く考えたことがないが、六法全書をすべて読破する前に日本国の法律に従うように、この GFDL なるものに従おうと思う。詳しくはコピーライトの章を参照してほしい。

この本の比較的最近のバージョンは、http://arch.bluegate.org/gab-jp/book.htmlにある。またこの本自体はもちろん GNU arch で管理されている。最新の FQDN は、補遺を参照してほしい。

謝辞

… そしてGNU arch コミュニティーの人々。

コンピュータに一度でも触ったことのある人なら、長く保存しておきたいようなデータを誰でもひとつくらいは持っているものだ。それは大切な人からの E-mail に添付されていたデジカメでとった写真だったり、上司ににらまれながら徹夜で仕上げた提案書だったり、カナダの天才ピアニストが演奏したバッハの変奏曲だったり、hello world とだけ画面に表示される、本人以外にとっては何の意味もない C 言語のソースコードだったり、今日習いにいったおかし教室の先生が自分にだけこっそり教えてくれたチーズケーキのレシピだったり、過去10年分の株価チャートだったり、次のペットはコッカースパニエルにすべきか、チワワにすべきかについての非常に論理的な知人からの忠告のメールだったり、2週間ホテルに缶詰になって書き上げた恋愛小説の最後のたった一言だったりする。これらすべてが、すべて1と0の組み合わせ、つまりデジタルデータとして表現し保存できることは、実は鉄の塊が空を飛ぶことや、5光年も離れた星が肉眼で見えるほどに宇宙が澄みきっているのと同じくらい驚嘆すべきことなのだが、たいていの人はそれに気づいてはいない。

このようなデジタルデータは、おおきく二つのグループにわけることができる。ひとつは、一度保存したら二度とその内容がかわらないもの。もうひとつは、時間と共に修正や改良が必要であり、内容が変化していくものだ。大切な人の写真はどうだろう? 普通は前者だろう。送ってもらった写真を画像編集ソフトで勝手に修正したりしちゃいけない。ありのままの彼女の姿をありのまま受け入れよう。そうすれば君はずっと彼女の友人でいられる。でももしかすると君は雑誌の編集者かなんかで、その写真は一ヵ月に 15 万部も売れる雑誌の一面をかざるはずのコラージュの素材になるのかも知れない。なら話しは別だ。その画像には大いに修正が入る。君は背景を黒く塗りつぶし、右目の上にどっかの国の大統領の左目を張り付け、別に作っておいたレンガのハッチパターンで塗りつぶしたバルテノン神殿の裏口に、そのピカソの首を転がす必要がある。それを上司に確認してもらって、何度か修正を入れる。やっぱり元のやつがいい、とか言われてもいいように、修正してできた版ごとに名前のついたファイルにバックアップをとっておこう。こうして君の作品は採用され、雑誌は晴れて発売され、その夜君はどっかのラウンジで静かに酒を飲みながらこれで一段落だと一人ごちる。

時間と共に内容に変更や修正が加わるデータを履歴つきで時間にそって管理したいという場面はよくある。しかもそれは具体的なデータの種類によらない、一般的な話だってことがわかる。上のような画像であれ、編集中の音楽であれ、プログラムのソースコードであれ、ドキュメントであれ、いつ誰がどのような変更をどこに、どのように加えたかを即座に知ることができて、間違った時のために過去のどの時点のデータにもすぐに戻れる。そんな汎用的な仕組みがあれば、これは便利だ。こんな発想から発達してきた、ソフトウェアの一分野がある。バージョン管理システムがそれだ。ここで説明しようとしている GNU arch というソフトウェアも、このジャンルに分類されるソフトウェアだ。気づいただろうか。いま私はこっそり、「いつ誰がどのように」と書いた。そう、写真の例は一人でやる作業のシナリオだったが、もっと一般的に複数の人間がひとつのデータをめぐって共同作業するようなケースまで含めて考えてみたいのだ。

実はバージョン管理システムと呼ばれるソフトウェアはすでにいくつも存在している。商用のものもあれば、フリーソフトウェアのものもある。フリーソフトウェアの側で一番有名なのは、CVS と呼ばれるもので、事実上その分野の標準になっている。GNU arch が作られたのは CVS よりもずっと後のことだが、こちらもフリーソフトウェアなので、ある一定のルールを守れば、誰でも自由に利用することができる。ところで人生には同じ冗談を二度言ってはいけない、という鉄則があるのをご存じだろうか? これに従えば CVS というソフトがあるのに、あえて別のソフトを作ったのには、もちろんちゃんとしたわけがある。結局、同じ車輪を二度まわすほど暇な人間はそう多くはない。この章では、GNU arch の生い立ちについて説明しようと思が、それにはまず、バージョン管理システムの歴史について説明する必要があるし、その歴史のなかで CVS がどんな風に生まれてきたかも説明する必要があるし、それを踏まえた上でその欠点も説明する必要がある。それではじめて、どうしてGNU arch が生まれたかもわかってもらえるというものだ。

もし君がプログラムについての知識がゼロだったり、Unix という言葉を知らなかったり、知っていても使ったことはないのなら、後の章はまったくのチンプンカンプンであること請け合いだが、この章だけは退屈せずに読んでもらえることを目指したつもりだ。そんな風にしたのにはわけがある。実はバージョン管理システムの歴史は、フリーソフトウェア/ オープンソフトウェアのムーブメント自体に密接にかかわっていて、その世界について、広くさまざまな人に知ってもらいたいという動機が私にはあるのだ。

バックアップ

バージョンを管理するのに一番原始的な方法は、もちろんバックアップをとることだ。バックアップファイルの名前の後ろに通し番号をつけて整理したフォルダに入れておけばこれは立派なバージョン管理の役割をはたすことができる。冒頭の画像の話を例にして考えてみよう。いま、 image.tiff という画像ファイルを編集しているとしよう。tiff というのは精細な画像を扱うときによく利用される形式だ。これが雑誌の表紙になるはずのデータだとしよう。この最初の版を作ったのがたとえば 2004/03/11 の 11:30 だとする。君はまずは手始めに image.tiff を、 image-0.tiff という名前で保存する。それから背景色を変えて、少し縮小した次の版が 13:45 分にできあがったら、これを image-1.tiff という名前でまた保存する。そのあと知らぬ間にボスがやってきて、さんざんケチをつけたあと、気をとり直して次の版ができたのが 19:12。ではこれを image-2.tiff にしよう。こんな具合だ。

図 1.1. image.tiff の縄文式バージョン管理

ファイル名を通し番号じゃなく、時刻そのものにするのも一案だ。たとえば、image-0.tiff のかわりに、2004-03-11-11-30.tiff のような名前にする。これだとファイル名を見ただけで、いつバックアップをとったかまで一目瞭然だ。欠点としてはファイル名がすごく長くなってしまうことで、これから説明していくにはちょっと都合がわるい。大抵のシステムでは、ファイルの時刻を調べる機能がちゃんとついているので、ファイル名自体に時刻を埋め込まなくてもそれほどは困らない。

この方法の利点と欠点について、すこし考えてみよう。まず利点。なんといっても話が単純なことだ。それからこの手法は—これだって立派な手法だ—どんなデータにだって使えることだ。今は画像で説明したけれど、同じことは見積り用の表計算のデータにだって、プレゼン用の提案書にだって、FAX で送る予定のお悔やみの文書にだって、校正中のマサイ語の辞書にだって使える。1 + 1 = 2 が、りんごにも、みかんにも、象にもサイにも使えるのと同じだ。このことを示すために、 image.tiff という具体的なファイル名のかわりに R という一文字でファイルを表して、その後にバックアップの順番を示す番号を振ろうと思う。 R はリビジョンの略だ。ファイル名を番号だけ表すのはさすがに寒いので先頭につけてみた。あまり深く考えないでほしい。

図 1.2. 一般的なファイルの縄文式バージョン管理

次は欠点。版を重ねるごとにデータサイズが大きくなることだ。いまみたいな話だとかなり複雑なデータになっているはずだから、数メガバイトもあるかも知れない。そんなんもんじゃない? オーケー。10メガバイトだとしよう。修正は、全体のサイズに対してわずかだろうから、版を重ねた後もだいたい 10メガバイトだとすれば、N 回バックアップすれば N * 10 メガバイトのディスクを食うことになる。10回バックアップすれば 100メガだ。たしかにこれはあまり嬉しい状況じゃない。考えてもみてほしい。お互いほんの少ししか違っていない良く似たデータが、いくつもいくつも自分のディスクの中で雪だるまみたいに増えていくのだ。でも、と君は言うかも知れない。それは対した問題じゃない。最近のハードディスクの容量を見ろよ、と。数百ギガバイトの容量を持つようなものがザラじゃないか。3年後には、きっとテラバイト級のやつが店に並ぶぜ。100 メガと言えばこのてのディスクの 1/1000 か、1/10000 の容量しかない。ケチなこと言いっこなしだ。好きなだけ版を重ねても問題なんかおこりゃしないぜ、と。

なるほど説得力がある。しかし、だ。このまるごとコピー作戦にはもう一つ重大な欠点があるのだ。それは、ある版とその前後の版での修正点が何であるかがバックアップデータを見ただけでは簡単にはわからない、という問題だ。これはちょっと画像では説明しにくい。ワープロで作った非常に大きなドキュメントを例にとろう。業務中にテトリスをやりすぎてクビになった君の新しいアルバイト先での第一日目。自己紹介もすまないうちに渡された巨大なワープロのドキュメントは全部で 500 ページ。行数にして 15000行もある。何かの標準化資料という話なのだが、内容を見てもさっぱりわからない。でも心配はない。「我々は、この文書の内容を理解させようと君を雇ったわけではない」からだ。君の仕事はこの文書を管理することと、レビューに出席して、丸テーブルの前で黒いスーツとサングラスに身を固めた七人の男たちが低い声で語る修正案を文書に反映させることだけだからだ。「ただし、正確にやりたまえ」。君はさっそくドキュメントのバックアップをとり、最初の版、 R-0 として管理する。これでひと安心だ。次の日に最初のレビューがある。レビューはあまり盛り上がらない。1320行目から 2 行削除してくれ、と言われる。それから 14015 行目から 3 行追加してくれ、と。これで全部だ。君は会議の後、修正後のドキュメントのバックアップをもう一度とる。これで二つ目のバージョン、R-1 ができた。次の日も、そのまた次の日もレビューは続く。君のリビジョンも R-2, R-3, ... と増えていく。

こんな感じでレビューが 5 回ほど続いた一週間後、ひとりの男が重苦しい沈黙を破って「我々は、話の最初から何かとんでもない重要な条項を削除してしまったのではないかね」と言う。一瞬、皆に緊張が走る。最初のレビューでの変更点は何だったかね、ほら、君がやってきた、あの日のレビューだよ、とすぐ隣の男が君の耳もとでささやく。とたんに君は困った状況に追い込まれる。君はこの日のレビュー前のバックアップ (R-0) と、レビュー後のバックアップ(R-1)の、両方のデータを保管している。だから、「あの日のレビュー前の状態にすみやかに戻したまえ」とか、「あの日のレビュー後のデータを印刷して、ウクライナの国境近くにいるエージェント・ケファに直ちに送りたまえ」とかいう要求に答えることはできる。しかし「ではそのレビューでの変更点は何だったのか?」となると話は別だ。二つのファイルとは別に「1320、2行削除、14015、3 行追加」のようなメモを管理しない以上、15000 行もある二つのファイルの内容を一行づつ目チェックしながら追いかけていくより他ないわけだが、もちろんこれは人間のやる仕事ではないし、君の仕事でもない。君は人間なのだ。^[1]

テキストファイルとバイナリファイル

問題を整理しよう。第一の疑問は、こうだ。「ある良く似たふたつのデジタルデータがあるとき、その違いを常に計算することができるか? 」、もう一つは、こうだ、「もしそうなら、その違いを人間がわかる形式で表現できるか? 」この二つだ。ここでいう「違い」のことを、コンピュータの世界では「差分」と言ったり、「デルタ」と言ったりする。後者は耳慣れない言葉だが、差分は英語で difference と言い、頭文字のd はギリシャ文字でデルタという文字になるところから来ている。この本ではいつでも差分と言うことにする。ここはアメリカでもギリシャでもウクライナでもない。日本なのだ。

第一の疑問にはあっさり答えることができる。つまり、イエス、だ。どんな場合にでも、どんな形式のデジタルデータでも、差分を計算することができる。ドキュメントデータもデジタルデータの一種だから、もちろん差分を計算することができる。問題は第二の疑問だ。これは非常に難しい。R-0とR-1の差分をせっかく求めても、人間がわかる形で表現できるとは限らないのだ。いまの例で言えば、最初の日の修正前のドキュメントと修正後のドキュメントを指定して、その両者の差分を出力するプログラムを書くことはできるが、その差分が、「1320、2行削除、14015、3行追加」とか、そこまで親切な形ではなくても、とにかく人間が解読できるようなデータにできるとは限らないのだ。その差分データにせいぜいできることといえば、変更前のドキュメントと、一緒に渡して、変更後のデータを復元するようなプログラムの存在を必ず保証できることだけなのだ。

ずいぶんと悲観的な話をしてしまったようだが、単に私は「デジタルデータ一般についてはノー」と言っただけだ。すべての女性にピアスが似合わなくても、ピアスの似合う女性はたくさんいるし、すべての政治家が公正廉直でなくても、公正廉直な政治化だって、いるにはいる。たぶん。そんな女性や政治家を探してみよう。いま問題になっているのは、「ドキュメントファイル」だ。しかしドキュメントファイルにもいろいろある。ワープロのドキュメントはたいてい、行によってフォントの大きさが違っていたり、イタリックになっていたり、段幅が微妙に違っていたり、文字そのもの以外のデザインに関係したデータがたくさん入っている。これとは逆に、単なる文字情報だけが入っていて、それ以外の情報が一切入っていないようなものもある。豊富な情報が入っているデータにもいろいろある。たとえばあるソフトウェア会社の作ったデータは、その会社独自のデータかも知れない。他の会社のワープロのデータと互換性があれば、自分のところのソフトウェアが売れなくなる可能性があるから、わざとそうしているのかも知れないし、互換性の問題に気づくことができない単に無能なソフトウェア集団なのかも知れない。いま言った、文字だけの情報が入ったファイルのことを、テキストファイル、と言う。そしてそれ以外のファイルをバイナリファイルと言う。さて第二の疑問の答えは、こうだ、「もし君のドキュメントがテキストファイルであれば、差分を計算できて、その結果を人間が把握する形式で表示することもできる。もしそうでなければ、つまり君のドキュメントがバイナリファイルであれば、うまくいくかどうかは、そのバイナリファイルの性質による」。

君のドキュメントが運よくテキストファイルであったとしよう。すると、二つのドキュメントの差分を以下のように表示するためのプログラムがある。具体的にどうやるんだよという話は、ちょっと端折らせてほしい。狭くて深いクレバスの谷底までいちいち降りていたんじゃいつになっても頂上には着けない。あとで詳しく説明するが、GNUdiff、グニューディフと呼ばれるプログラムを使うと、とにかく以下の出力を手にできる。ディフは、さっきも出てきた difference つまり差分の意味だ:

--- R-0       2004-04-12 09:52:47.000000000 +0900
+++ R-1       2004-04-12 09:52:56.000000000 +0900
@@ -1317,6 +1317,8 @@
     てまで解釈されるものではない。
 XI. 特別工作員間の通信はすべて非対称暗号方式を利用するものとし、
     具体的な形式は以下のいずれかとする。
-イ.楕円暗号
-   楕円暗号は他方法によることができない場合にのみ使用することを許可する。
 ロ.量子暗号のうち、二粒子相関系を用いたもの。
 ハ.オメガ・チャンネル(推奨)
    オメガ・ディテクターを携帯している特別工作員は常にオメガ・チャ
@@ -14012,9 +14014,6 @@
   し、又はこの条約で捕虜に与える権利を制限する恐れがある場合に限り
   行うことを認められる。但し、当該紛争当事国が外交上及び領事業務上の
   慣習及び条約に従って通常行う任務を行うことを妨げない。
+第17条の2
+  第1条から第16条までの規定にかかわらず、関係諸機関にはジュネーブ第一条
+  約、第二条約、第三条約、第四条約の各条項が厳格に適用されるものとする。

 第18条
   第3条、第12条、第14条及び第15条に掲げる特別工作員は、次の標示に関し

いったい何の話かわからないだろう。実を言うと私にもさっぱりだがここで注意したいのは、データの内容ではなく、このファイルの構造だ。大雑把に言って、先頭の二行を除けば、@@ -1317,6 +1317,8 @@ のような行で始まる大きく二つの部分に区切られていることがわかると思う。これをハンクと言い、@@ の行をハンクヘッダー、と言う。ハンクとは英語で「ちょっとした大きさのかたまり」程度の意味らしい。最初のハンクヘッダーは次のように読む「修正前のファイルの 1317 行目から始まる 6行は、修正後の 1317 から始まる 8 行に対応しています。対応の仕方は以下です」。次のものは、「修正前のファイルの 14012 行目から始まる 9 行は、修正後の 14014 行目から始まる 6 行に対応しています。対応の仕方は以下です」。最初のハンクには '-' 文字で始まっている行が 2 行ある。これは行が削除されたことを示している。一方二番目のハンクには '+'文字で始まっている行が 3 行ある。これは行が追加されたことを示している。先頭に記号のない行は変更があったまわりの様子を示すための手がかりとして置かれた行で、修正の前後で変化がなかった行を示している。それぞれの変更がどんな内容だったのかは一目瞭然だろう。君は救われたのだ。

少し話をはぐらかしてしまったような気がして恐縮している。デジタルデータ一般についての差分の話をしておきながら、テキストファイルとバイナリファイルに分類して、いつのまにかテキストファイルに限定した差分の話をしてしまった。実はバイナリファイルにはテキストファイルの差分のようなうまい一般論はない。バイナリファイルに属するもっと個別の具体的なファイル形式について議論するより他なくて、それはこの本の内容を超えているのだ。ではこんな限定した議論に意味がないかというとそうでもない。テキスト形式のデータもたくさんあるからだ。まずまっさきにあげなくてはならないのが、プログラムのソースコードだ。これは何十年もの間、ずっとテキストファイルだった。そうでないコンピュータ言語や開発処理系もあるのかも知れないがとても主流だとはいえない。それからドキュメント文書の一部、たとえば TeX と呼ばれるドキュメント形式は、やはりテキストファイルだ。それから電子メールなんかもテキストファイルだし、HTML のホームページもそうだ。他にもいろいろある。一部の表計算のソフトなんかでも、ファイルの保存形式を選択することでテキスト形式で保存できるものもある。自分のお気に入りのプログラムがあれば、マニュアルなんかで調べてみると思わぬ発見があるかも知れない。

君の回りで、便利なソフトを使わず、わざわざテキストファイルを使っている人がいたら要注意だ。彼は本当の便利さを理解しているのかも知れないのだ。

差分と複数のファイル

ここまでのところをまとめさせてほしい。まず、デジタルデータには時間の経過と共に変化するタイプのものがあって、それを管理したい場合にはバックアップを随時とって名前をつければ良いのだが、それだとバージョン間の差分をすぐに知ることができない。でも一部のデジタルデータは良い性質を持っていて、いつでも二つのバージョン間の差分を人間が理解できる形に計算することができる。こういうファイルのことをテキストファイルと呼ぶ。そういうことだった。ここから先は、議論の対象になるファイルはいつでもテキストファイルであるとする。それから、バージョンのことをリビジョンといいXXX、それぞれのリビジョンを、R-0, R-1, R-2 ととおし番号で呼ぶことにする。混乱してきたら、R-0 とかは日付と時間の入ったファイル名のことだと思い出してほしい。たとえば ... という具合だ。

さて、前の節で示した、二つのリビジョンの間の差分をとるプログラムの話だが、別にこれは私が作ったプログラムじゃない。何十年も前にハッカーたちが協力して知恵を出し合ってつくったもので、GNUdiff という名前のプログラムだ。「グニューディフ」と読む。何でこんな奇妙な名前なのかは話すと長い。単に「ディフ」と言っても通じる。それから、このディフとペアになったもう一つの有名なプログラムがある。それは GNUpatchと言う。「グニューパッチ」と読む。こちらも「パッチ」と言えばその手の人たちには通じる。ディフの方はもう説明した。パッチはこれとちょうど逆のことをするプログラムだ。つまり、あるリビジョンと、差分を与えて、変更後のリビジョンを復元するプログラムだ。つまり:

図 1.3. 一列に並んだリビジョン

のようになっているとき、R-0 と R-1 を GNUdiff に渡すと、R-0 とR-1の差分を計算してくれる。これを diff(R-1,R-0)と書くことにする。 R-1 のほうを先に書くのは、差分をとる処理がちょうど引き算に似ているから、R-1 引く R-0 という目で見たいからだ。GNUpatch　は GNUdiffのちょうど逆のことをする。つまり diff(R-1,R-0)とR-0 を渡すと、R-1 を復元してくれるのだ。

図 1.4. GNUdiff の処理イメージ

図 1.5. GNUpatch の処理イメージ

diff(R-1,R-0)なんて書いても、ピンとこないかも知れないが、前の節のドキュメントの差分を思い出してほしい。あの形のものを指しているだけだ。いちいちあの表示を書いていたら紙が持たない(本当は紙じゃないけど)し話がまわりくどくなってしまうので、ご勘弁願いたい。R-0 とか R-1も、例の 15000行のドキュメントにちょこちょこ修正が入ったようなものをイメージしてほしい。ああいうものを指している記号だ。話は脱線するが、シンボルの力は偉大だと思う。「車」と書けば、実際の車を用意しなくても車について語ることができるし、「宇宙」と書けば、実際に宇宙を用意しなくてもとりあえずは宇宙について語ることができる。時には話をはしょった見返りに、実物にでくわした時に、手痛いしっぺ返しを受けることもあるわけだがそれはまた別の話だ。

さてここまで道具立てがそろうと、この章の最初のバージョン管理の手法、つまり単なるバックアップファイルの蓄積より、もう少しスマートな管理手法をとることができる。バックアップファイルほどディスクを消費しないし、同時にリビジョン間の差分を即座に見てとれるという一石二鳥の方法だ。それをこれからお見せしよう。

まず、元のバックアップ手法のリビジョンを一列に並んだところをもう一度思い浮かべてほしい。各リビジョンでの修正量が少なければ、これらのデータはよく似ているのだった。これらのリビジョンの隣り合う二つに対して、GNUdiff を呼び出して、差分を求める:

図 1.6. 隣り合うリビジョン間への GNUdiffの実行

そして、命知らずにも、R-1 から R-3 までのファイルを削除する。すると以下のようなファイルが残る

図 1.7. 最初のリビジョンと差分の集まりだけを残したところ

d(rN,rN+1)の形のファイルは普通はとても小さい。前の例の行数を実際に数えてみてほしい。30行にも満たない。これに対して、R-0, ... R-3 のようなファイルは非常に大きい。修正の量にもよるが、どれも大体 15000行くらいだろう。だから、バックアップ方式だと 15000 × 6 = 90000行のデータを保管しなくてはならない。一方、差分は普通はどれも小さい。余裕を見て平均 60 行としておこう。それでも R-0 と差分の全体では、15000 + 5 * 60 = 15300 行にしかならない。ほとんど R-0 そのもののサイズではないか。差分の内容はすぐにわかるし、データサイズも小さくて済む。あとは各リビジョンをうまく復元できるかどうかなのだが、 GNUpatchを使えば求めることができる。まず R-0 はすでに手にしている。 R-1 は、R-0 と diff(R-1,R-0)をGNUpatchに渡せば求めることができる。R-2 はいま求めた R-1 とdiff(R-2,R-1)を再び GNUpatchに渡せばいい。こんな風に繰り返しGNUpatchを呼び出せば、リビジョンの数がどんなに増えてもいつかは欲しいリビジョンが求まる。図で書くとこうだ。

図 1.8. GNUpatchによる各リビジョンの復元

でも、R-0 と diff(R-1,R-0)... などから次の R-4 を作るにはどうしたらいいんだろうか? それにはこうする。まず今いった方法で何回も繰り返し GNUpatch を呼び出して R-3 を作る。そしてこれを R-4 という名前にコピーする。このままではまだ R-4 は R-3 と一緒だ。それから、例の冷や汗もののレビューで君はこの R-4 に修正を加えて保存する。これで晴れて R-4 ができた。それからさっきよけておいた R-3 と R-4 の差分 diff(R-4,R-3) を GNUdiff を使って計算する。これを差分のリストに追加して R-3 と R-4 を削除する。これでおしまい。

今回の差分作戦の基本は以上だが、この発想の上でいろいろな改良を加えることはできる。たとえば、差分ファイルでディレクトリやフォルダが一杯になってしまうのを防ぐために、R-0 と残りの差分全体を一つのファイルにまとめてしまえるような、新しいファイルの形式を定義してやる。そしてGNUpatchとGNUdiffをうまく改造して、この新しいファイルからデータを取り出したり、好きなリビジョンを取り出せるようにしてやる。複数のファイルをアーカイブというソフトを使って一つにまとめた経験はないだろうか、ちょうどあんな感じだ。

図 1.9. 差分の集まりをひとつのファイルにまとめた様子

これでいくら差分ファイルが増えていっても、その新しいファイルの内容がどんどん増えるだけで、ディレクトリがファイルで一杯になったりすることはなくなる。それから、差分の内容をすぐに思い出せるように、差分のそれぞれに小さなメモつけることができるようにしておく。バージョン管理システムの世界では、このようなメッセージをログメッセージとか、単にログとか呼ぶ。ちょうど好きなカセットテープのケースに「いとしのあゆ」とか書くのと一緒だ。こうしておけば、この一つのファイルの中に、このファイルが最初のリビジョンから現在にいたるまで辿ってきた、すべての歴史が刻まれていることになる。そしてインディージョーンズが謎の古代文字を解読するように、君はすべての過去にアクセスし、そこに流れる人の思いを辿ることができるのだ。このような仕組みを作るための具体的なプログラムをイメージできないとしても、おおよその雰囲気はわかってもらえるのではないかと思う。

さらにいろいろな改良を加えることができる。いままでの例ではたった一つのファイルをバージョン管理してきたが、一般には複数個のお互いに関連のあるファイルを一緒に管理することが多いだろう。たとえば 15000行の一つのドキュメントはいかにも大きすぎる。このドキュメントが 3 章からできているのなら、三つのファイルに分けて管理したほうが楽だろう。ディレクトリ中にはファイルごとの差分がどんどんできていくが、いま述べたようにもとのファイルとそのファイルの差分を一つのファイルにまとめる手法を使えば、いつまでたってもディレクトリのファイルの数は 3 個のままだ。こうしてバージョン管理の対象は単一のファイルからあるディレクトリ全体という、より豊富なデータ構造に移ることになる。そして単一ファイルのバージョン管理は、たまたまバージョン管理するディレクトリに一つのファイルだけが存在するという特殊なケースとみなすことができる。

細かい、と君は言うかも知れない。あんたの言うことは細かい。要するに、こう言いたいんだろう。バックアップファイルをたくさんとるかわりに、もっと効率が良くて、変更点もすぐにわかる一石二鳥の方法があると。それを使うにはなんとかって言う二つのプログラムを使えばいい、と。やり方はこれこれ、こうだ、と。あとはこのやり方にしたがって、そのグニューなんとかをうまく組み合わせたプログラムを作ってくれ、と。しかし、だ、これじゃ、エンジンのパーツ一式とドライバとスパナを俺に渡して、はい、さようならって言ってるようなもんだ。いいか、言っとくけど俺はプログラムのことなんてぜんぜん知らない。あんたには簡単かも知れないけど、俺はそんなもん組み立てたことなんてない。できるやつに頼めって? なるほど、会社にはすごい詳しいやつが二人いる。特にその一方はすごいらしい。俺には二人とも同じように、なんだかすごい連中だとしか見えないが、その滅多に口を利かない片方が、もう一方のことを天才と言うんだ。だからおそらく相当すごいやつなんだろう。しかし、だ。俺はこいつが気に入らない。ピカイチ気に入らない。人を見下してばかりいる嫌な野郎だ。俺にはわかる。ああいう奴にはプログラムが組めない人間はみんなバカに見えるんだ。なにさまのつもりだ。はっきりいってこんな男にモノを頼むくらいなら、舌を噛み切って死んだほうがよっぽどましだ。

なるほど、かなり深刻そうだ。しかし、実際には油まみれになってエンジンを組み立てる必要もないし、少なくともこの件では君も命を落とさずに済む方法がある。ちょっとわざとらしいのだが、実はいま君がまさに言ったようなものを、すでに組み立ててくれた人がいるのだ。人というのは正確じゃないかも知れない。人々、それも大勢の人々、しかも長い時間をかけて、しかも大した見返りもなしに、だ。このいきさつと経緯についての物語は、それ自体とても面白いのだが、別の機会に譲ろうと思う。とにかくここから先、もう君は GNUdiff と GNUpatch のことを、近所のゲーセンにおいてある 2ゲーム100円のリセットボタンみたいにきれいさっぱり忘れることができる。テレビの中のごちゃごちゃした部品についての知識がなくてもリモコンをいじれば、なんだか知らんがテレビは見れるし、百円玉を自動販売機に突っ込めば、なんだか知らんがコーラが出てくる。同じことだ。スイッチポンで脱水、乾燥、柔軟仕上げ。かしこい主婦なら迷わずえらぶ全自動洗濯機みたいなソフトがある。それが CVS、コンカレントバージョンシステム、だ。次の節ではこのソフトについて少し話をしようと思う。ところで君んとこのイヤな野郎の話だが、そいつが嫌なやつだからって、コンピュータに詳しいやつがみんなそういう連中だなんて思わないでほしい。君の専門が何か私は知らないが、どんな分野だって、本物っていうのは決して多くはないものだ。私は言ったはずだ。公正廉潔な女性もたくさんいるし、ピアスの似合う大物政治家だって、いるにはいるのだ。たぶん。

協力者たち

ものすごい駆け足で説明してきたが、こういうアイディアは昨日の今日で一人の人間の頭の中だけで思いつくものではない。私の知る限り、おそらく 20〜30年くらいの歴史の中で少しずつ少しずつさまざまな議論を通じて育ってきたものだ。そして今から数年前に、一応の完成をみた。このシステムをコンカレントバージョンシステム、CVS と言う。CVS は今言ったような形式で、複数のファイルをひとつにまとめたディレクトリ、あるいはツリーを管理することができる。CVS の細部は、とてもここで語り尽くせるものではないが、今までの議論で触れていないひとつの大きな特徴がある。それは、分岐、という概念だ。GNU arch が作られた最も大きな理由の一つは、CVS の持つ、この分岐概念の不完全さからくるので、以下の節では分岐、そしてこれをペアになる「マージ」ということについて詳しく説明しようと思う。分岐とマージは、今までの例のように一人でデータを管理しているときには表に現れない。しかし複数の人間が協調して一つのデータを管理する場合には本質的なものとして現れるのだ。

さて、ここで CVS について最低限の説明をしようと思う。前の節で言ったように、生の GNUdiff と GNUpatch を使いやすくまとめて誰でも使えるようにしたパッケージを作ろうという動きは非常に早くからあったようだ。CVS はこの流れの中で数年前に一応の完成を見た。実はこのドキュメントを書くに当たって、CVS が完成に至る過程を詳しく追いたかったのだが、ネット上を検索してもなかなか良い文献には出会えなかった。唯一参照できそうだったのが CVS に関連したメーリングリストの情報で、いくつかのリストについては 1993/2 くらいまで遡れるものもあるようなのだがアーカイブ全体をテキストファイルに落すことができず、結局詳しく追体験するには至っていない。私はこれらの歴史に非常に興味があるので、バージョン管理システムの過去について詳しい方や、CVS 関連の非常に古いメーリングリストのアーカイブなどを保存されておられる方がいたら是非私に御連絡頂きたいと思う。いずれにせよ、CVS は昨日の今日でできたようなシロモノでないことだけは確かだ。私の知る限り、20〜30年くらいの歴史の中で、多くの人々の議論の中で徐々に形をとっていたものだと考えられる。この物語の中には「一人の天才」のようなドラマはないことだけは確かだ。人間一人では何にもできない。

ここでは CVS の膨大な機能の中で、基本となる部分と、GNU arch との関連で重要な「分岐」という応用機能についてしぼって説明しようと思う。

CVS では二人の登場人物がいる。一つは、「リポジトリ」と呼ばれるデータ格納庫。もう一つはこの「リポジトリ」にデータを追加するのに必要な補助的な領域である「作業コピー」だ。「リポジトリ」というとなんだか高尚なもののようだが、実はもう我々はどんなものかイメージすることができる。そう、前の節で図に書いたような、最初のリビジョンと追加の差分情報が蓄積されたファイルを集めたディレクトリのことだ。このディレクトリには、ディレクトリ内にあるすべてのファイルの、全ての履歴情報が入っている。リポジトリからは、任意のリビジョンのデータを取り出すことができるし、最新のリビジョンに次の差分を追加して、新しいリビジョンを作ることもできる。リポジトリはとても重要な場所なので、直接編集したりすることは許していない。かならす CVS システムに対してこれこれのことをしてくれ、と頼まなくてはならない。これはちょっと窮屈に思えるかも知れないが、CVS にできる操作しか許さないことで、リポジトリのファイルを間違って削除してしまったり、勝手に名前を変えてしまったりといった操作ミスをなくすことができる。閉架式の図書館みたいなものを想像してもらってもいい。本を読みたいと思ったら直接本棚に行くのではなく、係の人にとってきてもらう。あれと一緒だ。もちろん CVS はなにか神秘的なことをやるわけじゃない。内部的に前の節で話した GNUdiff や GNUpatch を使って一所懸命必要なリビジョンを計算して、君のためにとってきてくれるというわけだ。あまり詳しくない人から見ると、リポジトリはものすごい数のリビジョンデータ全体がある巨大な格納庫に見える。しかし実際には最初のリビジョン以外は差分の集合体なのだった。

もう一つの重要な登場人物が作業コピーと呼ばれる場所だ。CVS からデータを取り出そうとすると、作業コピーが作られてそこにデータがコピーされる。ただコピーされるわけじゃなくて、どのリポジトリから取り出したか、とか、取り出したリビジョンはどれか、などの情報も記憶している。作業コピーは同時に何人でも作ることができる。CVS が呼び出されるたび、呼び出した人用の作業コピーができる。これは閉架式の図書館とは違うところだ。現実の本と違って、デジタルデータはいつでもコピーすることができるのだ。このコピーを作るための命令を checkout と呼ぶ。 CVS の基本コマンド、その1だ。

図 1.10. CVSに依頼して作ったふたつの作業コピー

CVS での基本的なワークフローはいたって単純だ。まず、リポジトリから最新のリビジョンを作業コピーに checkout 命令で取得する。それから作業コピーに対して必要な修正を加える。これでいいなということになったら、CVS システムに対して、今回の作業コピーの内容をリポジトリに追加してくださいという命令を送る。すると CVS は現在の最新リビジョンと作業コピーとの間の差分をとる。それからできた差分をリポジトリを構成する各ファイルに追加する。この操作を commit と言う。基本コマンドその2だ。なんだか CVS はエラク高尚なことをしているように思うかも知れないが、実際には前節で紹介した GNUpatch とか GNUdiff のようなプログラムがやるのと同じようなことをしているだけだ。get して、コミットする。この繰り返しによって、リポジトリのリビジョンはどんどん増えていく。

他にも CVS はいろいろなことができる。たとえば、最新リビジョンよりも前のリビジョンを取り出すこともできるし、あるリビジョンと別のリビジョンの差分を計算して、表示させることもできる。既に少し説明した、ログメッセージの内容を表示させることもできる。これを見れば、ああ、あの時のコミットは、こんなことをやったのだった、と見当がつく。

話がこれで終ってしまうのなら、CVS は GNUpatch と GNUdiff のやったことを一手に引き受けてくれているだけで、あまりありがたみがない。CVS が便利なところは、複数の人間がそれぞれ作業コピーを作って同じリポジトリにコミットできるような仕組みを提供しているところだ。 CVS の C はコンカレントの C だが、それはこのことを意味している。ちょっと考えればわかるように複数の人間が勝手に checkout して修正をコミットすれば、修正がお互いに衝突してしまったり、相手のした修正点に気づかず上書きしてしまったりするのは想像がつくだろう。詳しい説明は省略するが、CVS はこの当たりの交通整理もしてくれる。ある人が修正した部分に別の人が更に修正しようとすると警告してくれたり、まずは他の人がした修正点がどんなものであったかを自分の作業コピーに受け取るように指示してくれたりする。

分岐、そしてマージ

CVS について説明した。CVS は GNUpatch と GNUdiff をうまく組み合わせて統合したソフトで、基本的な命令 get と commit を持っているのだった。get を使って作業コピーと呼ばれる場所に、バージョン管理されたデータを読み込んでは修正し、一段落したら commit して、元のデータに差分を追加していくのだった。実際にやっていることは要するに GNUpatch や GNUdiff と変わらないのだが、使い勝手はずっと良くなっているし、GNUpatch や GNUdiff や差分の仕組みのことを知らない人でも気軽にバージョン管理の恩恵にあずかれると、こういう話だった。利用者が知っていなくてはならないのは、差分とか、特殊なファイル形式とか、繁雑な GNUdiff/GNUpatch の操作ではなく、リポジトリ、作業コピー、 get/commit のような、もっと次元の高い概念だけでいいのだった。さらに CVS は複数の人間が get / commit する場合でも、お互いの変更がかぶったりしないように調整したり、同時に複数の人が commit しないように、うまく交通整理してくれると、こういうわけだった。合言葉は「スイッチ・ポン」だ。これが世界を救うのだ。

ここでは最後の、複数の人間の共同作業、というところをもう少し堀下げて考えてみたい。ある一つのデータをみんなで協力して改良したり修正している場合には get/commit だけで十分だ。たとえばいまずっと問題にしてきた、国家間で利用されるある重要なドキュメントに対して、帰りがけに A が 10243行目の誤字に気がついたとする。A は時計とにらめっこしながらCVS に頼んで作業コピーに最新リビジョンの内容を get する。作業コピーの上で10243 行目を修正する。そして CVS に頼んで commit する。ばっちりだ。でももしかすると B もちょうどそのとき同じ間違いに気づいてやっぱり自分の作業コピー上で10243 行目を修正してコミットしてしまっていたとする。そんな時は CVS は、その修正はもう B がやってるよと教えてくれる。そして commit は失敗するが、もちろんその失敗は意図したものだし、手柄が A じゃなく B のものになっただけで誰も困らない。

しかし、もう少し複雑な状況を考えてみる。いまは、たった一つのドキュメントをめぐっての作業フローだった。でも、以下のようなことも、よくおこる。基本的にはこのドキュメントと同一の内容を持っているのだが、内容の一部がほんの少し違っているようなものが欲しくて、しかもそれはそれで独立した文書としてずっと管理していきたい、という場合だ。たとえば、この国家間ドキュメントには、なんらかの非常に重要な機密事項も含まれていて、各国の首脳級レベルの人間以外には配布したくない、と。でもそのような部分は非常にわずかで、それ以外の部分については各地に散らばっているエージェントに配布したい、と。極秘版と、一般大衆版のふたつのバージョンが欲しい、と。

そんな重要な文章の機密内容を、俺や Hally や Sally 程度の人間が編集できるもんかと言うかも知れない。ではもう少し現実的な例を出そう。そのためには君にプログラマーの役を演じてもらう必要があるが、も実際にそんな知識が必要なわけではない。学芸会に出てくる南の国の王様みたいにそのまま椅子にふんぞり返っていてくれればいい。いま、ある企業が新しいソフトウェアを開発している。このソフトウェアは有料なのだが、よくあるように、評価限定版というのがあって無料でダウンロードして利用できる。評価限定版は、製品版と、うり二つだ。ただし、30日たつとすべての機能が利用できなくなってしまう。そこだけが製品版との違いだ。評価版 = 製品版 + 30日タイマー、と書き表すことができる。

図 1.11. 評価版 = 製品版 + タイマー

ところで、ソフトウェアには間違いがつきものだ。これをバグと言う。ソフトウェアが完成したらバグも全部なくなっていると思うかも知れないが、そんなことはない。出荷したあともいろいろなバグが見つかるし、そのバグは修正していかなくてはならない。もちろん大きなバグ、利用するのに致命的なバグというのはなくなっている。でなければそんなソフト買う人なんていないだろう。この細かいバグには作り手もユーザもいつも悩まされる。作り手は新しく何かを作るではなく、既に作ったものを保守しているわけだから、やる気も失せてしまっている。それにバグを直したつもりが、別のバグを生んでしまうことがある。笑うかも知れないが、これは本当によくおこることなのだ。逆に、ユーザはしみ一つない動作をすると期待してソフトを買ったのに実際には細かい動作が意図したように動かない。評価版が用意されているのにはこんな理由がある。もし評価版を使って問題があれば、買わなければいい。あるいはここを直してくれたら買うんだが、とその会社に E-mail してあげてもいい。

ながながと書いてしまったが、評価版 = 製品版 + 30日タイマー、となっていた。評価版に新しいバグが発見されたとする。すると、それは製品版と共通の部分に含まれているか、30日タイマーの部分に含まれているかのどっちかだ。共通部分に含まれているなら、評価版のバグを修正したら、製品版にも反映させなくてはならない。たとえばプログラム開始時に「ようこそ、このソフトウェアへ」という文言が間違って「そうこよ、このソフトウェアへ」と表示されてしまったら、これは共通部分に含まれているバグだ。でも 30日タイマーの部分なら、製品版の方には反映させてはいけない。たとえば 30日ではなくて、60日たって使えなくなったら、これはタイマーのバグだ。評価版と製品版は、とてもよく似ている。そしてほんの少し、つまりタイマーの部分だけ、ちょっとだけ違っている。そしてそのちょっとだけ違っている部分を保ちながら、両者を厳密にそれぞれ管理していかなくてはならない。もし 30日タイマーの部分を不用意に扱って、そこに別のバグが生まれてしまったら、タイマーは働かず、評価版はいつまでも使えるようになってしまうかも知れない。これでは会社がもたない。

CVS では、こういう状況がうまく扱える。これを分岐、と言う。そして分岐を作ることをブランチ化すると言う。英語では動詞も名詞も branch という一つの言葉で表せるので都合が良いが、日本語の場合だと場合におうじて分岐と言ったりブランチと言ったりする。今の例では、おそらく製品版の方が先にあったはずで、そのためのリビジョンが CVS リポジトリに並んでたはずだ:

図 1.12. リポジトリ内に一列に並んだリビジョン

話が違うんじゃないかと思う人もいるかも知れない。CVS のリポジトリは初期リビジョン+差分の集まりだと説明したばかりじゃなかったのか、と。絵が縄文式に戻っているぜ、と。その通りなのだが、ここから先は実際のリポジトリの内部構造は忘れてしまうことにする。そういうコマゴマした詳細を隠すためにできたのが CVS だし、ここからの議論には内部構成は関係しないからだ。利用者から見れば、リポジトリにあるものは時間と共に増えていく一方のリビジョンの集まりだ。上の図ではそれぞれのリビジョンを数字だけで表している。これで十分なのだ。

ここから、評価版のための分岐を作る。このためのコマンドは紹介しないが、やはりスイッチ・ポンで分岐できる。分岐した後は、CVS リポジトリの中はこうなる:

図 1.13. 分岐後のリポジトリの様子

二つの横に伸びた線のことを、開発ライン、と言う。そして、最初からあった製品版の開発ラインのことを幹といい、後から分岐してできた評価版の方の開発ラインを枝、と言う。もちろんこれは開発ラインが分岐している様子を一本の木にたとえたものだ。幹は英語で trunk, 枝は branch で、みき、とか、えだという言葉がおさまり悪い時には、状況に応じて、トランク、ブランチ、とそのまま書いたりすることもある。こんな風に CVS リポジトリの中にはふたつ以上の開発ラインを分岐させることができる。いままでずっと説明してきた一本の開発ラインはその特別なケースになっていることがわかると思う。注意して欲しいのは、トランク内にある数字で示されたリビジョンとブランチ内の同じ数字で示されたリビジョンは何の関係もないということだ。数字はそれぞれの開発ライン中でのリビジョンの番号を示しているだけで両者は独立した別のデータだ。図中トランクのリビジョン2 からブランチのリビジョン 0 に矢印が伸びているが、ここで分岐がおきたことを示している。だからこの二つのリビジョンの内容は全く同じものだ^[2]

枝と枝との間では、両者に共通の修正点をお互いに取り込むことができる。これをマージと言う。もちろんすでに説明したように、タイマーのバグの修正を製品版にとりこんじゃいけない。とりこむのはメッセージの間違いの修正だけだ。たとえばこんな感じ:

図 1.14. 修正点の選択的なとりこみ

詳しく説明すると、トランク側の、2->3, 3->4, 5->6, 6->7 で追加した修正はブランチ側に取り込まれていない。だから具体的にどういうバグかはわからないが、とにかく製品版にだけ関係したプログラムの間違いだったのだろう。逆にブランチ側の 0->1, 2->3 はトランク側には反映されていないので、評価版のみのバグ、おそらくタイマーに関係したバグの修正だったのだろう。またブランチ側の 3->4 の差分はトランク側7 で取り込まれている。だからこれは両方の開発ラインで共通のメッセージの間違いのようなものだったのだろう。トランク側 4->5 についても同様だが、最初に発見したのはトランク側開発チームで、それをブランチ側がとりこんでいる。こうしてトランクとブランチの開発ラインは、共通の修正点については同期して、片方にしか関係しない修正点についてはきちんとその違いを保存したまま、時間にそってしずしずと行進を、いや、更新をつづけていくのだ。

さあ、CVS について大分説明してきた。細かい話は別にして、以上が CVS の持っている機能の大部分だと考えてもらってよい。君は言うかも知れない。ブラボー。すばらしい。で、君はいったい何が不満なのだ、と。

私の答えはこうだ:CVS の分岐概念には、根本的な欠陥がある。

ブルーな日々

私の目の前に一台のパソコンがある。Linuxというフリーソフトウェアが動いている。自分で設定したものだ。このコンピュータはインターネットに接続されていて、その気になれば、誰でもアクセスすることができるようになっている。「その気になれば」と言ったが、これには二つ意味がある。まず、私がその気になることで、もう一つは実際にアクセスしようとする相手もその気になることだ。単にアクセス、と言っても、実はいろいろな方法がある。いくつかの方法については、私は誰でもアクセスして良いように設定してある。たとえばいくつかの Web ページは誰でも見ることができる。それを使って私は情報を外部に発信しているから、見ることのできない人がいると都合が悪いからだ。だから、この件では私はすでにその気になっている。あとは相手がその気になるだけだ。つまり私のページに興味を持ってくれて、URL をブラウザに打ち込めばいい。これは一番よく知られたアクセス方法だが、実は他にもいろいろある。たとえば telnet と呼ばれている方法があって、このアクセスを許すと、私のコンピュータに対して、非常にたくさんのことができるようになる。コンピュータには私にとって大切なものも含まれているので、私は telnet でアクセスできないように設定してある。つまり私はこの件では「その気に」なっていない。だから外部の人間がいくら「その気」になっても私のマシンに telnet することはできない。まずは私が「その気」にならなければならないのだ。

図 1.15. コンピュータといろいろなサービス

今は、私と、それ以外の人との間で線引きしたが、実はもっと細かくアクセス制御することができる。たとえば、Hally と Sally にだけ telnetを許して、それ以外の人、たとえば例の天才君には許さないようにもできる。会員制のホームページを見たことはないだろうか? ある画面まで行くと、ログインiDとパスワードを入力してくれ、という画面に飛ばされるだろう。そう、私はあのことを言っている。あれは Web サービスに対するアクセス制御の一種だ。そのサービスが動いているコンピュータの管理者が、決まった人しかアクセスできないような設定をそのコンピュータにしたから、君はおいそれとはアクセスできない。そうか。最初からこっちの例で説明すればよかった。

図 1.16. コンピュータとアクセス制限

CVS も、Web アクセスや、telnet と同じようにできる。つまりCVS をうまく設定して、CVS のリポジトリのあるサーバをインターネットにつなげてやると、どこからでも CVS を使えるようにすることができる。つまり、いままで説明してきたスイッチポンを、出先のコンピュータからもできるようになる。この場合、get コマンドで作成される作業コピーは出先のコンピュータにできる。修正点を commit すると、今度はインターネットの上をデータが逆向きに流れて、作業コピーからリポジトリに向かってデータが流れて、結果がリポジトリに追加される。だから君は世界中のどこにいても作業ができる。たとえば Sally がタンザニアに出張になったとする。Sally は例のソフトウェアのプログラムを管理している CVS リポジトリの入ったマシンに、タンザニアのインターネットカフェからアクセスできる。もちろん CVS リポジトリには適切なアクセス制御が必要だ。これは会社の重要な資産が入ったサーバだから、外部の人間に勝手に get やcommit されては困る。だから君とHallyとSallyだけがアクセスできるように設定されているのが普通だろう。

図 1.17. CVS サービス専用機とアクセス制限

「設定されている」などと不用意に書いてしまったが、別にコンピュータ自身が場の空気を読んで、君や Hally や Sally を自動的にそっと設定してくれるわけではない。コンピュータはそんなことはしてくれない。実際には誰か生身の人間が「設定する」のだ。じゃあ誰がやるのだろう。君の今までの話を総合すると、君もHallyもSallyにも、ちょっと荷が重そうだ。こういう時には会社の中にシステム管理者と呼ばれる人がいて、その人に設定を頼むことになる。「こんど、これこれの仕事にかかわることになったから、例のリポジトリに get/commit をする必要があるんだ。悪いけど設定してもらえないかなあ」君は100万ドルのスマイルで誰かにに頼む。もしかすると頼む相手は、君がこないだ言ってた天才君なのかも知れない。もしそうなら君の笑顔に私は同情する。いずれにしても君は誰かに頼む。機嫌がよければ、あるいは Sally が一緒ならコンマ2秒で設定してくれるだろう。でもあいにくその日は朝から雨で、彼は奥さんと新発売のポテトチップスの空袋が不燃ゴミか否かをめぐって大喧嘩をしてきたばかりで、通勤電車の中ではハイヒールを履いた若い女性に踏まれ、駅の売店では 150円少なくお釣りを渡され、工事中のマンホールにあやうく落ちそうになり、よけたはずみで、ガムを踏んでしまい、あげくのはてに会社に来てみると、メールボックスが新型ウィルスのまきちらしたスパムで一杯になっていたとしたらどうだろう。私ならこう考える。「今日はやめておこう」。そしてそのまま Sally のデスクに言って、明日は丈の短いスカートで来てはくれまいかと頼む。

私が言いたいことはこうだ。システム管理者の許可なしには誰も CVS リポジトリにアクセスすることはできない。国立博物館の特設会場に展示してあるガラス張りのミイラと一緒で、君はリポジトリに指一本触れることができない。作業できるもできないもシステム管理者の腹一つなのだ。一つの企業内の話なのだからこれでもいいのかも知れない。いや、むしろ好ましい場合さえある。しかし、現実のデータ管理にはもっといろいろな形態があるのだ。たとえば、先のソフトウェアで、有償版は自社で作ったが、ここで社内の担当者は燃え尽きてしまい、タイマーの部分については子会社に発注するようなこともありうる。いま言ったように CVS はネットワーク越しに利用できるので、子会社からもget/commitができる。しかしそのためには、あなたの企業のシステム管理者は子会社の人たちにも許可を設定しなければならない。CVS はもちろんセキュリティーのことを十分に考えた設計になってはいる。しかし子会社にはどんなモラルの人間なのかはっきりしないし、身元があまりはっきりしない外部の人間にいろいろなアクセスを許すのは管理上問題がおきやすい。リポジトリに書き込みを許す場合はなおさらだ。commit はリポジトリに対する書き込み処理なのだ。

図 1.18. CVS サービス専用機と子会社からのアクセス

でも、CVS には分岐の機能があった。タイマー機能の枝を分岐して、そちらの部分にだけ子会社の人にアクセスさせれば良いではないか、と。そういう機能は CVS にはない。それに同じマシンの上に二つの枝があるから、このコンピュータがディスク障害を起こすと、両方の枝のデータが消えてしまう。もし分岐がネットワーク上にある別のマシンの別のリポジトリの中に作ることができれば問題は解決する。つまり、子会社の中にも CVS リポジトリを持つサーバを用意して、インターネットにつないだあと、元のリポジトリにある有償版の分岐を、このもう一つのマシンのリポジトリの中に作れば問題は解決する。しかし、CVS の分岐は、同一マシンの同一リポジトリ内にしか作成することができないのだ。もうお分かりだろう。私が CVS の分岐の根本的な欠陥というのはこの事実を指しているのだ。

図 1.19. CVS の分岐の限界

こんな風に書くと、私は何かことさら特殊なケースを持ち出して CVS の欠点をあげつらっているかのように見える。しかし、これは一般的な状況なのだ。特にフリーソフトウェアを開発するときにこういう事態によく出くわす。ちょうどいい例がある。私は GNU arch のリポジトリを Webブラウザで閲覧するための ViewARCH というフリーソフトを作っている。こんな場合、読み込みアクセスを世界中に許して、そのソフトウェアを公開するのが普通だ。もちろん私もそうしている。フリーソフトウェアは誰にも自由に使ってもらうことを意図して作られるし、こうしておけば、悪い部分を誰にでもすぐに指摘してもらえるからだ。しかし普通書き込みアクセスは許さない。私も許していない。さて地球の裏側の誰かが私のソフトに興味を持ったとしよう。そしてどこかにバグを見つけたか、新しい機能を追加しようと思ったとする。私が CVS でこのプログラムを管理していたとすれば、この地球の裏側の人間に対して、私のマシンに対するアクセス許可を与えなくてはならない。しかし、このような人間とは通常電子メールのようなもので知り合うだけで、面識はないことが多い。実際に会うことは一生ないような人たちも多い。こんな状況でその人間に簡単にアクセス権を与えるわけにはいかない。もちろん信頼できる良識のある人間だとわかれば、アクセスを許すことができて、分岐の仕組み自体はもっているのだから、CVS を使って自分のバージョンと彼のバージョンとを一つのリポジトリ内にうまく共存させることができる。時々の彼の枝の内容を見て気に入ればマージすることもできる。彼も自分オリジナルの変更を自分の枝に加えながら、私のアイディアを取り込むこともできる。しかしこれらはどれも彼にアクセス権を与えて初めてできることなのだ。

もし分岐を、ネットワークの他のマシン上に作ることができて、その枝同士でマージができれば、問題は解決する。このような機能をもったバージョン管理システムは、ネットワーク上にさまざまなリポジトリが分散して存在するので、分散型のバージョン管理システム、と呼ばれる。これに対して CVS のように、ひとつのマシン上のひとつのリポジトリだけで世界が閉じているバージョン管理システムを集中型のシステムと言う。GNU arch 分散型バージョン管理システムとして設計された。いま述べてきたことは GNU arch では簡単にやることができる。分岐を作るときには分岐元のマシンの管理者は、自分のマシンに特別な設定をする必要は何もない。通信ログを見なければ、地球上の誰かが自分のリポジトリの分岐を作ったことに気づきさえしないだろう。

図 1.20. GNU arch の分岐はリポジトリの境界を越えることができる

GNU arch

ずいぶん長々と述べてきた。ここでまとめようと思う。

GNU arch にはこのほかにもさまざまな改良点を持っている。そのどれもがすばらしいものだが、ここでは分散型の性質だについて徹底的に絞って述べた。私の考えではこれが GNU arch と CVS とを分かつ最も重要で強力な性質だと考えるからだ。

もし君がエラい腕っぷしの強い男で、夜たまたま通りかかった路地裏で三人の暴漢が君の理想のタイプを取り囲んでいる場面に出くわしたとしたら、うれしくて泣きそうになるだろう。彼らだって同じなのだ。

^[1] 実はここには君が現実的に彼らにそれを主張できるかどうかという、もう一つの興味深い問題もあるのだが、そっちはこの本の範囲外だ。

^[2]厳密に言うとブランチ側リビジョン0 には「自分はトランクのリビジョン2から分岐されたリビジョンです」という内容を示すごく小さな追加の制御情報を持っているかも知れない。後述するが、実際 GNU arch ではブランチ側にそのような情報を持っているので、ツリーの内容はそのぶんだけわずかに異なっている。

第2章インストール

インストール

最初にやらなくてはならないこと

UserIDの設定
アーカイブの作成
デフォルトアーカイブの設定

三つの困難

この章のまとめ

「あたりまえのことを誰よりもあたりまえにやれ。それがあたりまえのことじゃないことがすぐにわかるから」- あるグル

インストールから始めよう。

インストール

一般的に言って、GNU arch のインストール時にはそれほど大きな問題は起こらないのが普通だ。GNU arch は外部環境にほとんど依存しないからだ。たとえば glibc のようなライブラリは利用せず、hackerlab という奇妙な名前の自前のライブラリを使ってシステムが構築されている。本質的に外部に依存するのは、GNU tar, GNU diff, GNU patch のようなプログラムで、これらのプログラムが古かったり GNU 互換ではないと不具合が生じることはある。

GNU arch をインストールするにはまずは最新のソースコードを手に入れる必要がある。公式なダウンロード先は以下の URL だ:

http://regexps.srparish.net/src/tla/

ここでは tla-1.2 を利用する。wget や curl のようなプログラムで取得する。

$ wget http://regexps.srparish.net/src/tla/tla-1.2.tar.gz
…
$

tla が GNU arch のコマンドとしての名前だ。何の略かという話になるとTom Lord's Arch とか、Three Letter Acronym とか、いろいろ言われる。深い意味はない。こジャレたウィットの解説を言った本人の口から聞くほど野暮なことはない。とにかく tla と言う。ソースコードを展開すると、以下のようになる:

$ tar zxvf tla-1.2.tar.gz
…
$ cd tla-1.2
$ ls
=ARCH-USERS-README  =INSTALL  =RELEASE-ID  COPYING  configs  src  {arch}
$

普通の人であれば、おそらくこの時点で驚くだろう。こういうのが GNU arch の一番困ったところだ。これから楽しいバカンスに行こうというのに、家の前でいきなり車に引かれそうになる。ls の出力で '=' や' {','}'という文字を目にすることはそう多くはないが、普通のアルファベットと同じようにファイル名に利用できる文字とされており、GNU arch は特殊なファイルを分別するのに、さまざまな場面で積極的にこのような文字を利用するのだ。C 言語などを知っている人なら、識別子に対して '_' のような文字も含めて考えるだろう。このようなものだと思って割り切るのが一番良いようだ。

このような特殊文字の多用の是非については GNU arch メーリングリストで非常に頻繁に議論されてきた。メリットとしては、通常のバージョン管理対象となるファイルとの間に区別を設けることで特殊な処理をする場合に便利であることをあげることができる。詳しくはインベントリとファイルグループを議論する XXX で触れる。デメリットとしては、新規ユーザを驚かせてしまい、学習曲線を不要に高くしてしまうこと、Unix のシェル上での補間機能がうまく効かない場合が出てくること、また他プラットフォームへの GNU arch の移植を困難にすること、などがあげられる。いずれにせよ、ここではただ一言ですませる。つまり、「気にするな」だ。

いま展開した tla のディレクトリに戻って話を進めると、'='で始まるファイルはいずれも普通のファイルだ。また {arch} はディレクトリだ。ここではたまたまそうなっているが、'=' がかならず普通のファイルに利用されるとは限らない。ディレクトリであることもある。

実際のコンパイルは、=INSTALL ファイルに書いてあるとおり、src ディレクトリの下に =build というディレクトリを作ってからそこに移動して実行する:

もう一度いう。'=' のような文字は気にするな。

文字、文字、文字・・・

GNU arch ではファイル名に通常あまり見かけない文字をよく利用する。私はこれを奇妙な文字と呼ぶ。

GNU arch システムで奇妙なを利用する場面には、ふたつある。一つは必ず利用しなくてはならない場所。もう一つは奇妙な文字を使っても良い場所だ。arch 管理領域は必ず {arch}というサブディレクトリでなければならないから最初の例だし、アーカイブ用ディレクトリのルートツリーを{archives}とするのは二番目の例だ。このドキュメントでは、奇妙な文字をできる限り利用しないようにした。その方が混乱が少なくて済むと考えたからだ。

奇妙な文字について厳密に議論するには、そもそもファイル名に使える文字はどれとどれなのか、という議論がまず必要になるはずだ。この本を書くに当たって、私は調べてみたが、Posix などでも厳密に定義したものを見出すことはできなかった。だから奇妙な文字の議論はあいまいにならざるを得ない。便宜上、私は以下のものを奇妙な文字と呼ぶことにする。

奇妙な文字が持っている慣習的な「雰囲気」について以下の表に示す。重要なことは奇妙な文字を必ず以下のような意味に利用しなくてはならないということではないこと。あくまでも慣例として以下のように利用されることが多いという意味でとらえてほしい。後で詳しく議論するが、どの文字も設定によってどのような意味を持たせることもできる。

GNU arch で利用される奇妙な文字

=: 一部のバージョン管理下に置きたくないが貴重なファイルを示したり、メタ情報を置くときに主に利用される。この文字は一部のシェル(bashなど)はこの文字に対して補間機能が働かないが、GNU arch の設定ファイル、 =tagging-method などの一文字目になっているので、まったく利用しないわけにはいかない。しかし、この文字を使ったファイルを新たに作ろうとしている人には、私は言いたい。やめなさい。
+: =文字と同様に一部の貴重なファイルやディレクトリに利用される。このうち、' ++' の二文字で始まるファイルには特別な規則があって、常に「プレシャス」ファイルの扱いになる。プレシャスについては後の章を参照してほしい。この文字も GNU arch が内部的に利用しているので、まったく利用しないわけにはいかないが、一部のUnix コマンドに対して '+' 文字で始まるファイルを引数として渡すと、通常の引数ではなくオプションと解釈されてしまうことがある。(more や viなど)だから、この文字を使って新たにファイルを作ろうとしている人にも、私は何度でも繰り返す。やめなさい。
,: あまり重要ではないファイル、一時ファイルや中間ファイル出力によく利用される。このうち ',,' の二文字で始まるファイルには特別な規則があって、常に「ジャンク」ファイルの扱いになる。ジャンクについては後の章を参照してほしい。不思議なことに、この文字についてはなぜかあまり不具合がおこらないようだ。どうしても使いたい人は使っても良いかも知れない。しかし言っておくが、私は利用しない。
{: arch管理領域 {arch}の一文字目に利用される。このほか、アーカイブ群を置くルートディレクトリを{archives}のような名前で作ったり、ライブラリ用ディレクトリを{library}のような名前で作ったりするのを好む人もいる。慣習として、利用する場合には常にファイルの先頭の文字となり、必ず } 文字とペアになって利用される。ということ。もちろん、xyz{zy のような奇妙なファイルを作ることもできるが、私は言いたい、やめなさい。
}: { と組になって特殊なファイル、ディレクトリの名前をくくる時に利用される。慣習として、利用する場合には常にファイルの末尾の文字となり、必ず { 文字とペアになって利用されることがある。もちろん、xyz}zy のようなファイルを作ることもできるが、私は言いたい。やめなさい。
@: もしかするとこの文字はそれほど特殊ではないのかも知れないが、少なくとも私を驚かせるには十分だ。この文字はアーカイブ名称と一致したディレクトリを作るのによく利用される。この目的以外には利用しないほうが良いだろう。

$ cd src
$ ls
COPYING      Maintfile    PLUGIN       configure       docs-tla   links  {arch}
ChangeLog.d  Makefile.in  build-tools  docs-hackerlab  hackerlab  tla
$ mkdir =build
$ cd =build
$

通常のプログラムのインストールと同様、設定スクリプトの実行、実際の構築、構築後のインストール、という 3 段階で進む。最後の段階以外はすべてこの =build ディレクトリの中にしか書き込まない。インストール前であれば =build ディレクトリを丸ごと消せば初期状態に戻る。

設定は以下のようにする

$ ../configure --prefix=/usr/local

Standard Configuration Settings:

    system = i686-pc-linux-gnu
    package =
    lord@emf.net--2004/dists--devo--1.0--patch-9(configs/emf.net-tla/devo.tla-1.2)
…
    src

configuring src...
$

--prefix オプションはインストールフェーズで実際に GNU arch をインストールする先になる。--prefix を省略すると、. /src/=build/=install がインストール先になるので、まだ GNU arch をあまり信用していない人はここにインストールして動作を試すこともできる。気に入らなければひとつ上の =build ディレクトリからまるごと削除すれば tar を展開した直後の状態に戻る。他の場所にはいっさい書き込みをしない。現時点で GNU arch は単一のプログラムとして構築され、モノリシックなプログラム tla のみからなるので、インストール後そのままコピーして別の場所に持っていっても動作する。(今後のバージョンでどうなるかは保証しない)。

--prefix オプションは通常は /usr/local にすると良い。これで /usr/local/bin に tla という名前のコマンドでインストールされる。間違って /usr/local/bin と指定しないこと。これだと/usr/local/bin/bin にインストールされてしまう!

実際に構築する。長いメッセージが出力される。

$ make
set -e ; \
for dir in build-tools hackerlab links tla docs-tla; do \
	make -C $dir all ; \
done
make[1]: Entering directory `/home/octopus/tla-1.2/src/=build/build-tools'
set -e ; \
for dir in standards; do \
	make -C $dir all ; \

…

set -e ; \
for dir in src; do \
	make -C $dir all ; \
done
make[2]: Entering directory `/home/octopus/tla-1.2/src/=build/docs-tla/src'
make[2]: Nothing to be done for `all'.
make[2]: Leaving directory `/home/octopus/tla-1.2/src/=build/docs-tla/src'
make[1]: Leaving directory `/home/octopus/tla-1.2/src/=build/docs-tla'
$

最後にインストールする。

$ make install
set -e ; \
for dir in build-tools hackerlab links tla docs-tla; do \
	make -C $dir install ; \
done
make[1]: Entering directory `/home/octopus/tla-1.2/src/=build/build-tools'
set -e ; \
for dir in standards; do \
	make -C $dir install ; \

…

set -e ; \
for dir in src; do \
	make -C $dir install ; \
done
make[2]: Entering directory `/home/octopus/tla-1.2/src/=build/docs-tla/src'
make[2]: Nothing to be done for `install'.
make[2]: Leaving directory `/home/octopus/tla-1.2/src/=build/docs-tla/src'
make[1]: Leaving directory `/home/octopus/tla-1.2/src/=build/docs-tla'
$

コンパイルがうまくいかないとき

コンパイルがうまくいかない原因はいろいろ考えられる。よく聞く話は、tla が利用する外部依存プログラムが古かったり GNU のものでなかったりする場合である。tla は GNU tar, GNU diff, GNU diff3, GNU patch を呼び出すので、これらのプログラムが GNU 準拠のものでなければ tla はうまく動作しない。君のシステム中にこれらのパッケージがインストールされていない場合には、まずはインストールしなくてはならない。そして上記の ../configure スクリプトに与える引数でそれぞれのプログラムの絶対パスを明示的に指定してやることになる。

tla のビルドシステムで利用する configure プログラムは GNU の標準的な buildconf/autoconf のものではなく独自に作られたものであるので混乱しないようにしてほしい。指定可能な引数は ../configure --help-options のようにすると一覧で表示される。

tla そのものが実行時に呼び出すわけではないが、tla コンパイル時にビルドシステムが sed などのプログラムも呼び出すようだ。これらのプログラムも GNU のものでなければエラーが出ることがある。さらにビルド時のシェルが問題を起こすこともある。この場合は GNU の bash をインストールするところから始めなくてはならないかも知れない。また、ビルドに必要な C コンパイラは GNU のものでなければやはり動作しない可能性が高い。この当たりの話はフリーの Unix ライクなシステムであれば最初から意識しないで済むことが多い。

このサイドバーは充実させていきたいと考えているので、コンパイルエラーと格闘後、生還した人はぜひ報告してほしい。逆に tla ビルドシステムのポータビリティーが向上してトラブルが減っていけばこのサイドバーの行数は減っていくだろう。最終的にこのサイドバーが消滅することを心から願っている。

実際に動作するかどうかは以下のコマンドで確認できる

$ tla help
                        tla sub-commands
                        ----------------

* help

                        help : provide help with arch


* User Commands

…

* Published Revisions Commands

                        grab : grab a published revision


* Miscellaneous Scripting Support

          parse-package-name : parse a package name
          valid-package-name : test a package name for validity


Use tla command -h for help on `command', or tla command -H for detailed help
$

かなりたくさんのコマンドがある。100近くもあるが、実際によく利用するのは一握りだ。あとは実験的なコマンドであるか、GNU arch に精通してからしか利用することはない。GNU arch のコマンドが多いのは、単純なコマンドを組み合わせることによってさまざまな複雑な機能を実現できるようになっているからだ。ちょうど Unix のツール群と同じ考え方です。ひとつひとつのコマンドはゾウリムシみたいに単純だが、うまく組み合わせると恐ろしくいろんなことができる。この考え方にはデメリットもある。実際の利用で、どのコマンドの後にどのコマンドを実行すればよいか、あるいはどのコマンドとどのコマンドをどのように組み合わせれば必要なひとまとまりの機能を実現できるか、がすぐにはわからないところだ。つまり、典型的なワークフローがどんなものか、すぐには見えない。

このドキュメントではよく利用されるコマンドと、その利用の順序についてグループ分けして説明していこうと思う。私の考えでは、ワークフローの観点から見たとき、GNU arch には 3 個のグループに分けるのがいいと思う。

インストール後の必ずやる必要のある設定
バージョン管理対象を追加するたびに一度だけやる操作
日々の操作

この三つだ。

最初のグループは、GNU arch をインストールしたら必ずやらなくてはならない作業で、一度やれば二度以上やることは非常に稀なもの。二つ目のグループは、新規に何かある特定のデータをバージョン管理しようとするときの初期化処理、最後のグループは、初期化処理が済んだバージョン管理下にあるデータに対しておこなう日々の処理。この 3 番目のグループに属するコマンドは非常に少なく、せいぜい 5 個くらいだろう。

もちろん、GNU arch に慣れるにつれて残りのコマンドにも興味がわいてくるだろう。そのいくつかは処理を高速化したり、他の人のアーカイブと協調して作業するのに必要だったり、GNU arch の根底を支える非常に原始的な—そしてそれゆえ深遠な—コマンドであったりする。詳しくは補遺のリファレンスを参照してほしい。一通り理解した後はリファレンス部分だけで話しが完結するような構成にしておいた。ここにはすべてのコマンドの一覧、書き込みの有無、典型的な例、CVS コマンドとの対応、などについての記述がある。特に書き込みが全く発生しないコマンドについては気軽に実行してその振る舞いを見ることができるだろう。そして人によっては GNU arch の泥臭い実装の背後にある恐ろしく単純なデザインにおどろくかも知れない^[3]。

このドキュメントは GNU arch のあらゆるレベルのユーザに対して役立つように書いたつもりだが、特にはじめて GNU arch を使おうという人の敷居をさげるのに役立てば、と思っている。

最初にやらなくてはならないこと

インストールが済んだ後、まずやらなくてはならないことが三つある。

UserIDの設定
アーカイブの作成
デフォルトアーカイブの設定

この三つだ。

UserIDの設定

GNU arch は分散型のバージョン管理システムであり、最終的には別のアーカイブとのデータ交換が発生する。データ交換する際には自分のアーカイブや後でのべるパッチログ、その他のデータが他の人のものと区別するための識別子が必要になる。集中型のバージョン管理システムの場合、識別子はアーカイブのあるマシン上で一元的に生成することができる。データ交換はあるマシン内で閉じており、マシン間でのデータ授受は発生しないからだ。しかし分散型システムの場合、いまこのように説明している時点でも地球上の別の場所にある別のマシン上で、新しいアーカイブが設定されているかも知れない。それは誰であるかあらかじめ知ることはできないし、その人との間で重複しないような識別子についての合意をとることもできない。誰ともあらかじめ合意せずに、重複しない文字列を生成するためのなんらかの仕組みが必要にになる。

GNU arch の UserID はこのようなユニークな識別子を生成するための仕組みの一つで、重複を避けるためにユーザの E-mail アドレスを使う約束になっている。ある特定の E-mail アドレスを持っているのはそのユーザただ一人であることが事実上保証されると考えられるからだ。

UserID は tla my-id コマンドを使って以下のように設定する:

$ tla my-id "foo bar <octopus@bluegate.org>"
$ tla my-id
foo bar <octopus@bluegate.org>
$

以下では、"foo bar" という名前の人間が、bluegate.org というマシン上に foo というアカウントを持っていて、ホームディレクトリは /home/foo, E-mail アドレスは octopus@bluegate.org であるとして話を進める。

E-mailアドレスを公開したくないのですが・・・

UserID のうち E-mail アドレスの部分を uid と言う。uid には E-mail アドレスを利用するのが基本だが、種々の理由で公開したくない人もいるかも知れない。新しいソフトウェアに初めて接する時のこの感性は実に納得できるものだし健全だ。この問題を回避するには以下のようにする。

uid がとりうる文字列には補遺に示したような制約がある。つまり、uid の後ろの部分が十分本物のメールアドレスに似ていなくてはならないのだ。そこでまず、uuidgen あるいはuuidというコマンドを実行して一意の文字列を生成し、それを E-mail アドレスとして以下のように利用する。UUIDについては補遺を見てほしい。

$ uuidgen
08eebb07-f9c9-4b0a-973e-8c73863aec7c
$ tla my-id \
   "anonymous <anonymous@08eebb07-…3aec7c.invalid>"
$ tla my-id
anonymous <anonymous@08eebb07-…3aec7c.invalid>
$

行が長くなってしまうので一部省略した。設定時には正しく UUIDを指定する必要がある。E-mail アドレスの最後が .invalid となっているが、これは今回のような用途のために特別に予約されたドメイン名なのだそうだ。このテクニックを使うことで、架空の E-mail アドレスで君のプライベートが保護されると同時に一意性も確保することができた。uid は一度設定すると通常あまり変更することはないが、変更してもシステムに問題を与えることはないので、 GNU arch が十分信頼できるようになったら、本当の E-mail アドレスに置き換えても良いだろう。

E-mail アドレスはユニークな ID を作り出すためだけに必要になるもので、何かの拍子に GNU arch が自動的にこのアドレスに E-mail を送信したり、このアドレスからどこか別の E-mail アドレスに対してメールを送信したりすることはないので安心してほしい。

これで UserID が設定された。

アーカイブの作成

GNU arch で言うアーカイブとは、コンピュータ用語で一般に利用される意味とは区別して考えたほうがいい。GNU arch の世界でいうアーカイブとは後で説明する基本的な管理対象単位である「バージョン」を(一般的には)複数格納するための領域のことで、GNU arch のデータオプジェクトの階層としては最上位に位置する記憶クラスだ。アーカイブは一つのコンピュータの上にも、別のコンピュータの上にもそれぞれいくつでも作ることができるが、それぞれのアーカイブは当然別の名前を持たなくてはならない。同じコンピュータの上に作った複数のアーカイブは別のコンピュータの上にあるアーカイブ相互間の関係と同様、相互に完全に独立している。アーカイブはアーカイブを作成したマシン上のオペレーティングシステムが管理するどれかのファイルシステム上の一つのディレクトリとして存在する。そして後述の「バージョン」はそのサブディレクトリとして存在する。

GNU arch は分散型システムなので、たとえ君が他のマシンとの間で今後いっさいデータの交換をしないとしても、アーカイブは作成時点からあらかじめそのことを見越して作成しなければならない。つまり他のアーカイブと区別できる名前をつけなければならない。しかも他のどの GNU arch ユーザと議論することなしに、だ。君がアーカイブを作成したとたんに、すでにそのアーカイブは地球上の GNU arch 分散システムの一構成要素なのだ。あるいは潜在的にはいつでもそのようにみなすことができる状態に置かれるのだ。そう考えると理解しやすい。

アーカイブの作成はアーカイブ用ディレクトリの作成と、実際のアーカイブの作成の二段階にわかれる。

$ pwd
/home/octopus
$ ls
Maildir  tla-1.2  tla-1.2.tar.gz
$ mkdir ARCHIVES
$ ls
ARCHIVES  Maildir  tla-1.2  tla-1.2.tar.gz
$ tla make-archive octopus@bluegate.org--2004 \
    /home/foo/ARCHIVES/octopus@bluegate.org--2004
$ tla archives
octopus@bluegate.org--2004
    /home/foo/ARCHIVES/octopus@bluegate.org--2004
$

アーカイブはファイルシステム中のどこに作成しても良い。が、 GNU arch を利用するユーザアカウントのホームディレクトリに作るのが普通だし、自然だろう。他のユーザとの間で特にアーカイブを共有する積極的な理由がある場合は /usr/local のような場所に作ることもできるが、GNU arch はアーカイブ間でデータの交換をすることができるので、ユーザごとに自分のホームディレクトリに自分専用のアーカイブを作る方が利用しやすいかも知れない。ここではユーザのホームディレクトリ配下に作成することにする。

アーカイブをホームディレクトリに直接作ることもできるが、それだと新しいアーカイブを作るたびにホームディレクトリにアーカイブ用ディレクトリが追加され、アーカイブ用サブディレクトリで一杯になってしまう。これはあまり楽しい状況ではないので普通はアーカイブ専用のサブディレクトリを作成し、その中に実際のアーカイブを作るようにするのが慣例だ。これを便宜的にアーカイブフォルダと呼んでおく。

アーカイブフォルダの名前にも特に約束ごとはないが、非常に重要なディレクトリであることだけは確かだ。まちがってアーカイブフォルダを削除してしまうと、GNU arch で保管してきた一切のデータが消えてしまう。だから重要であることを示す特徴的な名前をつけると良い。今回は単に ARCHIVES という名前にした。

人によっては、{archives}という特殊な名前をつけるのを推奨する人もいる。この方式の利点は、1.奇妙な名前なので間違った操作でアーカイブフォルダを削除してしまう危険が減る、2. '{' 文字でファイル名を始めると ls コマンドでディレクトリの一覧を表示する際にこのディレクトリの表示が一番最後の方にくる、ということがある。欠点は、すでに書いたように、1.シェルの補完機能がうまく働かなくなることがある、2.どうも馴染めない、3.シェルスクリプトで ${foo} のような記述と衝突する可能性があるのではないか? 4.どうも馴染めない、などがある。好みに応じて名称を選択してほしい。

実際にアーカイブを作るには make-archive コマンドを実行する。このコマンドで今回 ARCHIVES というディレクトリの中に作った実際のアーカイブがoctopus@bluegate.org--2004 だ。アーカイブ名にも命名規約があるがUserIDとは全く独立している。アーカイブ名の正確な命名規約は補遺を見て欲しいが、大雑把に言うと、e-mail アドレスの雰囲気を持った文字列が先頭に来て、その後ハイフンが二つ来たあとにアルファベットや数字やハイフンが来る、というものだ。--2004 の部分は省略してemailアドレスだけでも良い。

アーカイブ名の一意性は、UserIDよりも重要なものだ。UserIDの時と同じように自分の E-mail アドレスを利用するか、uuid の方法を使えば一意性は確保できるだろう。

アーカイブ名は論理的な名前であり、それがファイルシステム上のどの場所に具体的に結びつけられるかを示すのがアーカイブ位置だ。これをすでに作ったアーカイブフォルダの中に指定する。アーカイブ位置のファイル名部分はアーカイブ名とは独立に指定できるが、後で混乱が減るように、私は合わせるのが好きだ。上の例ではそのようにしてある。結果、ファイル名称として '@' のついたファイル(正確にはディレクトリ)がシステムにできてしまった。これは奇妙な文字が嫌いな私があえて奇妙な文字を利用する数少ない場面のひとつだ。

論理的な名前と、物理的な名前

論理名と物理名を区別してデータの参照にワンクッション置くやり方はコンピュータの世界では上等^H^H常套手段だ。こうしておけば、なんらかの事情で物理名が変更された場合でもデータを参照する側の名前(=論理名)をそのまま利用し続けることができる。たとえば愛国主義者が新しいシステム管理者となり、octopus 君のアカウント名を tako に変える必要がでてきたとする。そして octopus 君は /home/tako/ARCHIVES 配下に octopus@bluegate.org--2004 を移したいとする。このような場合には /home/octopus/ARCHIVES 配下をそっくりそのまま /home/tako/ARCHIVES にコピーし、ファイルの所有者情報などを tako に変更した上で、register-archive コマンドを以下のようして叩けば良い。

$ tla register-archive octopus@bluegate.org--2004 \
    /home/tako/ARCHIVES/octopus@bluegate.org--2004

これでいままで通り論理名 octopus@bluegate.org--2004 を利用し続けることができる。なおregister-archive は既存のアーカイブ位置を論理的なアーカイブ名と結びつけるコマンドで、 make-archive コマンド内部でも実行されるものである。少し細かい話になるが、make-archive コマンドは内部的に 1.アーカイブ用のディレクトリの作成と初期化、2.そのアーカイブの GNU arch システムへの登録、の二つの処理を実行するのだ。

tla archives コマンドは GNU arch システムに登録されているアーカイブ名とその位置を一覧表示するコマンドだ。確かに今作ったアーカイブができているのがわかる。アーカイブの登録情報は、内部的には ~/.arch-params/=locations というディレクトリに格納されている(また '=' 文字だ :)。直接編集することはないが、興味のある人は理解を深めるためにちらっと覗いてみるのも良いだろう。

デフォルトアーカイブの設定

GNU arch の多くのコマンドはデフォルトアーカイブに対して実行される。これはちょうと Unix のコマンドの多くがカレントディレクトリに対して実行されるのと同じような発想だ。すでに見たようにアーカイブ名は非常に長いのでデフォルトアーカイブを設定しておくとよい。いま作ったアーカイブを my-default-archive コマンドでデフォルトアーカイブとしよう:

$ tla my-default-archive octopus@bluegate.org--2004
$ tla my-default-archive
octopus@bluegate.org--2004
$

このコマンドは引数なしで実行すると現在のデフォルトアーカイブの内容が表示される。以降の章ではデフォルトアーカイブが設定されていることが前提となるので注意してほしい。

三つの困難

GNU arch の抱える三つの問題は、[1]奇妙な文字の問題、 [2]長いファイル名の問題(-- の問題含む)、[3]ファイル判別ロジックの複雑さ、である。これをもっと詳しく。

この章のまとめ

この章では GNU arch のインストールの仕方と、インストール後最初にしなくてはならない設定について説明した。環境設定に関していくつかの名前が出て来た。UserID, uid, アーカイブフォルダ、アーカイブ名、アーカイブ位置名。これらはいずれも必要に応じて命名規約を満たしさえすれば任意に指定できるが、できるだけ統一したほうが混乱が少なくて済むことを説明した。

次の章では新しいアーカイブバージョンを作成する方法について説明する。

^[3]し、もちろんしないかも知れない。

第3章バージョンの作成

前の章では、GNU arch インストール後に行なう GNU arch システム全体に関する設定をした。ここまでくればいつでも新しいバージョンをアーカイブに追加し、具体的なバージョン管理を始めることができる。この章ではまず GNU arch の世界でのアーカイブ、バージョン、リビジョン、などの言葉を正確に定義する。その上でテスト的なバージョンを作り、実際のファイルをバージョン管理下に置くための最初のデータ取り込み処理をする。これを初期インポートを行う。バージョンの作成は簡単だが、インポートではつまづくかも知れない。インポートしようとするファイルの性質によっては GNU arch がソースファイルとして認識しないことがあるためだ。ソースファイルを認識させるためには GNU arch のソースファイルの判別ロジックについての理解が必要になる。ここではあまり細部に立ち入らないように注意して、ファイル判別ロジックの概要を説明し、初期インポートすることにする。ファイル判別ロジックの詳細は、インベントリの概念とも密接に関連し、非常に複雑なので、章をわけて説明しようと思う。

GNU arch を利用する上でおそらく一番大きな障害の一つが、このファイル判別ロジックだ。あとは、名前空間の複雑さ、奇妙な文字の多様、と続く。GNU arch の根底にあるデザインは非常に単純なので、このような複雑さがあるのは残念なことだ。

この章では、他のアーカイブとのやりとりについての説明は避け、つまり君は自分だけで利用するデータを自分だけで管理している、そんな状況に話を絞った。他の人がそのデータに対してかかわってくることはない。君は必要に応じて自分のデータを修正し、区切りがついたところで新しいリビジョンを作る。リビジョンは時間の経過とともにどんどん増えていくが、枝分かれしたりすることはない。時間の方向に一列に並んでいる一本のラインだ。GNU arch が力を発揮するのは他のアーカイブのほかのバージョンとの間で分岐したりマージしたりする場面なのだが、そのような場合でもここでの操作が基本になる。

前提となる環境

この章では前の章の設定が済んでいると仮定する。つまり:

君は octopus というアカウントを持ち、今そのホームディレクトリにいる。
ホームディレクトリの名前は /home/octopus である。
tla が無事インストールされて利用できる状態にある。
tla my-id コマンドで UserIDが正しく設定されている。
/home/octopus/ARCHIVES という名前のアーカイブフォルダが作成されている。
octopus@bluegate.org--2004 という名前のアーカイブが作成されている。
そのアーカイブ位置は/home/octopus/ARCHIVES/octopus@bluegate.org--2004 である。
octopus@bluegate.org--2004 は君のデフォルトアーカイブとして設定されている。

以上の前提が成り立たない限り以下の説明は少なくともそのままでは動作しないので注意してほしい。厳密にこの環境を作りあげることができないのは明らかだろう。自分用のメールアドレスを設定したり、ホームディレクトリの名前が違っている場合には適宜自分の環境にふさわしい形に読みかえてほしい。

バージョンとは何か

さて、アーカイブを作ってはみたものの、まだそこには何も存在していない。空っぽである。これからこの中に GNU arch での最も基本的な管理単位である「バージョン」を作ってみようと思う。これには tla setup-archive コマンドを使う:

$ ls
ARCHIVES  Maildir  tla-1.2  tla-1.2.tar.gz
$ tla archive-setup test--proj--1.0
* creating category octopus@bluegate.org--2004/test
* creating branch octopus@bluegate.org--2004/test--proj
* creating version octopus@bluegate.org--2004/test--proj--1.0
$

「バージョン」とは、他のバージョン管理システムでは「リポジトリ」と呼ばれるものにあたる。バージョンの中に初期データをインポートし、その後データを修正してはコミットを繰り返すことで、時間と共にデータがバージョンに蓄積されていく。ある１時点でのバージョンの内容をリビジョンと言う。バージョンはリビジョンの集まりで、それぞれのリビジョンは作られた時間によって順序づけされている。リビジョンにゼロから始まる番号をつけて、この番号によって特定のリビジョンを指定することができる。これをリビジョン番号と言う。リビジョンはまた自分の性質に応じた名前をもっている。これをリビジョン名と言う。通常最初のリビジョン名は base-0 だ。それ以降のリビジョン名は普通 patch-n という名前になる。ここで n は 1 から順番に増えていく整数でリビジョン番号と呼ばれる。

バージョンという言葉の日常的使い方から連想されるものはリビジョンに近いことに注意しよう。たとえば「XYZ ソフトウェアのバージョン1 がバージョンアップしてバージョン 2 になりました。どうぞお買い求めください」というときの「バージョン」は、GNU arch でいう「リビジョン」の意味に近く、「XYZ ソフトウェア」が、GNU arch でいう「バージョン」に近い。「リビジョン」という言葉のこういう使い方は GNU arch に限らずモダンなバージョン管理システムではほぼ共通に使われている。「バージョン」という言葉のほうは他のシステムでは「リポジトリ」と呼ばれることが多いが、要するに「リビジョン全部」をまとめたもののことを指す。

いま作ったバージョンは、test--proj--1.0 という名前だ。GNU arch ではこのようにバージョン名は三つの単語を '--' でつないだ名前にしなくてはならないという規約がある。三つの部分を先頭から「カテゴリ名」、「ブランチ名」、「バージョン名」と言う。バージョンが、カテゴリ名、ブランチ名、バージョン名の三つの文字列の組み合わせで構成されていることには、論理的な必然性はまったくない。また、それぞれの名前から連想されるような名前間の制約や階層構造があるわけでもない。単に「第一名称部」、「第二名称部」、「第三名称部」と考えて問題ない。これらの名称に深い意味はなにもない。

今後バージョンに関する一般的な議論の時、バージョンを指すのにシンボリックに C--B--V と記述することがある。C, B, V はもちろんそれぞれの名前の頭文字だ^[4]。複数のバージョンを使った議論では、C1--B1--V1, C2--B2--V2, … のようにしていくつかのバージョンを示すこともある。「バージョン」と「バージョン名」の違いに注意してほしい。GNU arch の一部のドキュメントではこの区別があいまいなものもあるが、文脈に応じてどちらの意味かを判断してほしい。

バージョン、という言葉の日常的な意味からは、異なるバージョンとの間の関連を連想してしまうかも知れない。たとえばtest--proj--1.1 という名前の別のバージョンを作ることもできる、この場合、 test--proj--1.0 と test--proj--1.1 との間に、何か意味的につながりが生ずるのではないか、と。しかし、この両者はまったく別のバージョン、他のバージョン管理システムの言葉で言うと、まったく別のリポジトリだ。異なるバージョン間を「継続」という機能を使って関連づけることはできるし、それが似た名前のバージョンであったほうが人間にとっては都合が良いかも知れない。しかし、test--proj--1.0の継続を test--proj--1.1 とするかわりに、ergo--sum--100.0という名前のバージョンを作って継続し、test--proj--1.1 をまったく別の目的に利用することも、そもそもそのようなバージョンを作成しないこともできる。継続については別の章で詳しく議論する。

バージョンは必ず、どこかのアーカイブ中に作成される。今の場合だと octopus@bluegate.org--2004 という名前のアーカイブだ。tla archive-setup コマンドで、これを明示的に指定する引数はなかったが、これはデフォルトアーカイブを octopus@bluegate.org--2004 にあらかじめ設定しておいたからだ。いまはまだ一つのアーカイブしかないが、複数のアーカイブが存在して、デフォルトアーカイブ以外のアーカイブにバージョンを作成したい場合には -A というオプションを使って明示的に作成先を指定することもできる。バージョンは指定されたアーカイブ中にできるだろう。-A オプションは tla archive-setup コマンドに限らず、アーカイブの指定が必要なすべての tla コマンドで指定することができるオプションだ。そのようなコマンドで -A オプションを省略するといつでもデフォルトアーカイブが指定されたものと見なされる。

同じ名前のバージョンを別のアーカイブに作成することもできる。その場合、C--B--V だけを指定しても両者を区別することができない。この場合、アーカイブ名をつけて、 octopus@bluegate.org--2004/test--proj--1.0のように表現する決まりがある。この表現を使うと、ある特定のバージョンが完全に定まる。これは一つのマシン上に限ったことではない。アーカイブ名はE-mail アドレスを含んでいるので、地球上のすべてのマシンを考慮しても一意に定まる。 octopus@bluegate.org--2004/test--proj--1.0 は、君のマシン上にある、地球上で唯一ここだけにあるバージョンだ。^[5]後の章で、バージョン間でデータの交換をしなくてはならない場合に、この一意性が大切になる。このように A/C--B--V の形で指定したバージョンを、完全に修飾されたバージョン名、と言う。

アーカイブと、バージョンの関係を絵に書いてみる。すでに注意したように、カテゴリ名とブランチ名は、バージョンの階層構造にはまったく関係しない概念だ。つまり:

図 3.1. まちがったバージョンの階層構造

ではなくて:

図 3.2. 正しいバージョンの階層構造

のようにイメージしてほしい。地球上の無数のマシンの上に、異なる名前のついた無数のアーカイブがあり、その中にさまざまなバージョンが存在している。octopus@bluegate.org--2004 と、 bar@bogus.example.com--2003、上には、同じ名前のバージョン festina--lente--1.0 がある。これはたまたまそうなったのかも知れないし、二人のハッカーが関連するバージョンを表すのにお互いにわざと同じ名前を取り決めたのかも知れない。いずれにせよ、同じ名前のバージョンが別のアーカイブにあっても、地球上の GNU arch 分散システムが混乱することはない。別のディレクトリにある二つの readme.txt ファイルが何の関係もないのと同じことだ。

図 3.3. バージョン同士の関係

ふたつのバージョンは、同じアーカイブ内にあろうがなかろうが、別のアーカイブ内にある場合、その二つのアーカイブが同一マシンにあるかどうかには全くかかわらず、対等な関係にある。後の章でアーカイブ間の分岐やマージについて説明するが、このような特殊な関係にある二つのバージョンは、それぞれどのアーカイブの上にあっても同じように動作する。同じアーカイブ上になければできないような処理はない ^[6]。

さてあるアーカイブ中にどのようなバージョンがあるかは tla abrowse で確認することができる:

$ tla abrowse
octopus@bluegate.org--2004
  test
    test--proj
      test--proj--1.0

$

このコマンドも明示的にアーカイブを指定しなければ、デフォルトアーカイブに対して処理される。確かに今作ったバージョンが存在している。

謎の 3 階層名前空間

GNU arch の名前空間が、なぜカテゴリ名、ブランチ名、バージョン名の 3 階層からなっているか、そしてそれらをなぜ神秘的な二つのハイフン'=' で区切らなくてはならないかは、我々がたまたまわずかに左向きにパリティーの破れた 3 次元空間に存在しているのと同様、単に受容すべきことであって、論理的に理解すべきことではない。ちなみに GNU arch の名前空間管理モジュールを少し修正するだけで、N レベルからなる構成に変更することも、無限階層とすることも、逆に階層構造をまったく持たないフラットな名前空間にすることも可能だ。このような修正は、既存の 3 階層アーカイブとの間の互換性に問題を生じ相互連携が不可能になるため、修正自体は比較的容易だが意味の上では GNU arch のメジャーバージョンを上げなくてはならないような大きな修正になるだろう。

準備は整った。次の節では、このバージョンに対して実際にデータをインポートしてみる。何か新しいことを始めるとき—それは誰も挑戦したことのない問題を解くためのプログラムかも知れないし、歴史の本を書くことかも知れない—最初にやることになるのが、次の節での議論だ。

初期データのインポート

GNU arch の初期インポートの典型的なユースケースは三種類ある。

フルスクラッチから作ったソースコードを新規に GNU arch で管理していく場合
別の管理方法で既にパブリック管理されているソースコードを GNU arch で管理しようとする場合
既に GNU arch で管理されているバージョンから分岐を作る場合

以下では最初の利用方法について説明する。二番目については次章のインベントリの議論を通じて説明し、最後のものは分岐の章で説明しようと思う。初期設定に関してだけ言えば、二番目のケースが一番面倒で、最後のものは一番簡単だ。

概論

バージョンを作ったら、あとは初期データをそこにインポートするだけだ。「インポート」とは、これまでバージョン管理下になかったひとまとまりのデータを、最初にバージョンに格納することだ。このひとまとまりのデータは、全体としてひとつのディレクトリにまとめられていなければならない。格納したいデータの一部があるディレクトリにあり、残りのデータがそれとは親子関係のないディレクトリにあるような場合、そのままの形ではインポートすることはできない。このような場合は管理対象の単位をそれぞれに分割するか、新しいディレクトリの中に両者のコピーを作り、それをインポートする必要がある。このようにしてまとめたデータの最上位のディレクトリをツリーのルートと言い、この領域全体をツリーと言う。

ツリーの中にはどのような名前のファイルを置くこともできるし、またそれらがどのようなファイル形式であっても良い。ファイル形式は非常に大きくテキストファイルとそれ以外のバイナリファイルに区別できることはすでに述べた。そこでバージョン管理対象として差分管理をする場合にはテキストファイルが向いているという話をしたが、GNU arch の場合、バイナリファイルも管理することができる。ただしこれはとにかく管理することはできる、といった程度の話であって、バイナリファイルに対しては GNU arch は特に優れた性能を発揮するわけではない。たとえばこれもすでに述べたことだが、バイナリファイルを管理する場合、リビジョン間の差分を人間に理解可能な形で直観的に示すことはできない。できることは現在または過去の指定されたリビジョンのバイナリファイルをそのまま取り出すことだけだ。

GNU arch でバイナリファイルを管理するのは、大部分がテキストファイルだが、その一部がテキストファイルに付随したバイナリファイルであるような場合が多い。たとえば君が編集している HTML ファイルがあるドキュメントルート配下を GNU arch で管理しつつ、HTML ファイルが参照する一部のアイコンや小さな画像などを同時に管理対象としたいような場合が考えられる。あるいは、このドキュメント自身を考えてみてほしい。このドキュメント自身、何を隠そう tez@kamihira.com--2004s/Book--GNU-arch--0.0.1というバージョンで管理される立派なアーカイブだ。この中身はと言えば、ほとんどが XML 文書、つまりはテキストファイルで、文書中に現れる画像は OpenOffice の Impress というバイナリファイルから生成した png 形式のバイナリファイルだ。両方とも Book--GNU-arch--0.0.1 の一部としてバージョン管理されている。

ツリーの中のすべてのファイルとディレクトリがバージョン管理対象下に置かれるわけではない。もちろんそうすることもできるが、実際には管理したくないファイルやディレクトリが混じっていることがよくある。たとえば、C 言語の開発をしていて、ディレクトリにいくつかファイルがある場合、コンパイルの中間結果の *.o のような形のファイルや、エディタのバックアップファイルなどはバージョン管理したくはないだろう ^[7]。あるいは自分専用のメモ書きファイルのようなものがツリー中に含まれていてそのファイルについては広く公開したくないこともあるかも知れない。インポートする前には、どのファイルをバージョン管理下におき、どれをバージョン管理外にするかをあらかじめ指定する必要がある。

GNU arch ではこの指定をするには、まずは管理対象とするツリーを tla init コマンドを利用して、GNU arch 管理可能なプロジェクトツリーの形に変えなくてはならない。プロジェクトツリーとは、GNU arch の管理領域用のディレクトリ{arch} を最上位に含むようなツリーのことだが^[8]、この {arch}ディレクトリ中の設定ファイル、 =tagging-method^[9]の内容によって指定するためだ。tla init コマンドは {arch} 管理領域をツリーのルートに追加する以外のことは一切しない。

利用するサンプルプログラム

さて、そろそろ、何か良いデータのサンプルが必要になる。GNU arch はどのような種類のデータも管理することができるが、やはりプログラム言語のソースコードを管理することが多いので、C 言語のプロジェクトで説明しようと思う。複数のファイルを管理できることと、サブディレクトリも管理できることを示すため、四つのファイルからなるプロジェクトを考えることにする^[10]。このプロジェクトは 4 っつの通常ファイルと、それらを編成するための二つのサブディレクトリからなっている。以下のようなものだ。

$ pwd
/home/octopus/proj
$ find
.
./lib
./lib/tools.c
./inc
./inc/tools.h
./main.c
./cc.sh
$

main.c は tools.c にある関数を呼び出している。

$ cat main.c
#include "./inc/tools.h"

int main()
{
        hello_world();

        return (0);
}
$

呼び出される側の lib/tools.c は printf() で文字列を表示するだけだ。

$ cat lib/tools.c
#include <stdio.h>

void hello_world()
{
        printf("hello world\n");
}
$

lib/tools.c のプロトタイプ宣言は inc/tools.h にある:

$ cat inc/tools.h
void hello_world();
$

コンパイルは cc.sh という小さなスクリプトで行う。

$ cat cc.sh
#!/bin/sh

cc -o hw main.c lib/tools.c
$

とても単純だ。先に進む前にプログラムが本当に動作するかどうか確認しておこう。いまの例をエディタで実際に作成した場合には、 cc.sh を実行可能とすることに注意してほしい。その後、コンパイルし、実行を確認する。

$ chmod +x cc.sh
$ ./cc.sh
$ ls
cc.sh  hw  inc	lib  main.c  {arch}
$ ./hw
hello world
$

コンパイルによって hw という実行ファイルが作成された。確かに動作している。

初期インポート作業(1) - tla init-tree

では話を戻して、このディレクトリを、プロジェクトツリーに変え、デフォルトバージョンを前の節で作っておいた test--proj--1.0 に設定する。これには tla init-tree を使う:

$ ls
cc.sh  inc  lib  main.c
$ tla init-tree test--proj--1.0
$ ls
cc.sh  inc  lib  main.c  {arch}
$ tla tree-version
octopus@bluegate.org--2004/test--proj--1.0
$

{arch}という管理用のサブディレクトリができた。tla tree-version はデフォルトバージョンを表示するためのコマンドだ。確かに test--proj--1.0 になっている。tla init-tree コマンドはアーカイブの領域に対しては何も変更していない—参照すらしていない —ことに注意してほしい。このコマンドはあくまでもいま作ったプロジェクトツリーが、デフォルトで test--proj--1.0 バージョンに関連づいていることを指定しただけだ。

デフォルトバージョン

CVS のようなバージョン管理システムでは、プロジェクトツリーの概念に対応する作業ディレクトリを、作業コピーと言うが、GNU arch のプロジェクトツリーと CVS の作業コピーとはいくつかの点で異なっている。

まず、CVS の作業コピーは、かならずある特定のリポジトリに結びついており、後から別のリポジトリを指すようなことはできないし、そのような操作に意味をもたせることができない。これにたいしてGNU arch のプロジェクトツリーは、通常はデフォルトバージョンを設定することで、あるバージョンと緩やかな関係を持つが、別のバージョンともデータの授受を行うことができる。プロジェクトツリーに対するこのような使い方は高度な操作なので、章をわけて説明する。

次にプロジェクトツリーは、あるツリーデータをリポジトリにインポートする前に用意することができ、前もってリポジトリにアクセスする必要がないことだ。CVS のようなバージョン管理システムではいったんツリーの内容を特定のリポジトリにインポートし、それをチェックアウトと呼ばれるコマンドで外部に取り出した時点で初めて作業コピーが作られる。GNU arch の場合はあるツリーそのものをその場でプロジェクトツリーに変えることができるので、インポート時の不自然なワークフローを省略することができる。

初期インポート作業(2) - tla id-tagging-method

tla init-tree を済ませたら、IDタグづけの方法を選択しなくてはならない。IDタグづけの方法については次章で詳しく説明するが、プロジェクトツリー中のどのファイルをバージョン管理対象とみなしどれをそうみなさないかを決める方式のことだ。これには name, tagline, explicit の三種類がある^[11]現在の IDタグづけの方法を表示するには引数なしでこのコマンドを実行する:

$ tla id-tagging-method
explicit
$

explicit になっている。ここでは説明のために最も簡単なnames の方式に設定することにする。設定する場合には引数で指定すればよい:

$ tla id-tagging-method names
method set: names
$ tla id-tagging-method
names
$

これで names になった。

初期インポート作業(3) - インポートファイルの確認

IDタグづけの方法の設定が済んだら tla inventory コマンドを使って実際のインポート対象となるファイルを確認する:

$ tla inventory
S  cc.sh
S  hw
S  inc/tools.h
S  lib/tools.c
S  main.c
$

S という文字はソースファイル、つまりバージョン管理対象となるファイルを意味する記号である。この他にも P,B,J,T,U で表される状態がある。それぞれ、プレシャス、バックアップ、ジャンク、ツリー、アンリコグナイズ(非認識)の意味だ。詳しくは次章で説明する。

上記の一覧の中で、hw というファイルがソースファイルだと認識されているが、これはコンパイルの結果できたファイルであり、管理対象としなくはない。ファイルを管理対象外とするには {arch}/=tagging-method というファイルを編集し、exclude で始まる行の内容を調整する。{arch}/=tagging-method という文字列の並びは何度見ても気持が悪いかも知れないが、れっきとした普通のファイルである。vi を使っているなら:

$ vi {arch}/=tagging-method

emacs を使っているなら:

$ emacs {arch}/=tagging-method

でうまく編集できるはずだ。試してみてほしい。このファイル中、 exclude で始まる行があるはずだ。私の環境では以下のようになっていた:

exclude ^(.arch-ids|\{arch\}|\.arch-inventory)$

これは正規表現という決まりにしたがって記述された行で、「. arch-ids または {arch} または .arch-inventory という名前のファイルはソースファイルから除外してください」という意味になる。正規表現についてあまり詳しくない人は、GNU arch で利用するための最低限度の説明を補遺にしておいたので読んでみてほしい。しかし、カンが働く人なら正規表現を知らなくても、hw を除外するにはどうしたらよいか、あたりをつけることはできるだろう。そう、以下のようにしてやればよいのだ:

exclude ^(hw|.arch-ids|\{arch\}|\.arch-inventory)$

先頭のほうに、"hw|" という文字列を追加したのがわかる。これでファイル保存でエディタを抜け、もう一度 tla inventory コマンドの出力を見てみよう:

$ tla inventory
S  cc.sh
S  inc/tools.h
S  lib/tools.c
S  main.c
$

hw がいなくなってくれた。ソースファイルから除外されたのだ。これでインポートの準備がやっと整った。=tagging-method ファイルを編集して気がついたと思うのだが、このファイル中には exclude 行の他にもいろいろと怪しいことが書かれている。このあたりについても次章でじっくり説明するので楽しみにしていてほしい。

初期インポート作業(4) - インポート

おまたせしました、と心から言いたい気分だ。どうして使い始めからこんなに複雑なのだろう。たかがバージョン管理システムだろう。俺にとってはただの手段でしかないんだ。こむつかしいこといいなさんな、こっちはとっとと使いたいだけなんだよ、と。そう感じているなら、たぶんあなたは正常な人間だ。でも忍耐もここまでだ。インポート処理自体は、まるでアレキサンダー大王の最後みたいにあっけない。

$ tla import
* imported octopus@bluegate.org--2004/test--proj--1.0
$

あまりにあっけなくて本当にインポートできたかどうか不安になる。確認する方法はいくつかある。まずは、アーカイブ全体のようすをざっと見るための tla abrowse コマンドを実行すること。

$ tla abrowse
octopus@bluegate.org--2004
  test
    test--proj
      test--proj--1.0
        base-0

$

base-0 という表示があるだろう。これは最初のリビジョンの名前だ。確かに作成されているようだ。余談になるが abrowse コマンド出力が、カテゴリ名、ブランチ名、バージョン名のような階層構造っぽく表示されているのにだまされないでほしい。すでに言ったように、実際にはこれらの間に強い階層構造はない。

tla abrowse コマンドの出力でも安心できない場合には、実際にアーカイブ中の base-0 リビジョンを今のプロジェクトツリーとは別の場所に取り出してみればよい。これには以下のように tla get コマンドを使う:

$ pwd
/home/octopus/proj
$ cd ..
$ ls
ARCHIVES  proj	tla-1.2  tla-1.2.tar.gz
$ tla get test--proj--1.0 hogehoge
* from pristine cache: octopus@bluegate.org--2004/test--proj--1.0--base-0
* making pristine copy
* tree version set octopus@bluegate.org--2004/test--proj--1.0
$ ls
ARCHIVES  hogehoge  proj  tla-1.2  tla-1.2.tar.gz
$ cd hogehoge
$ ls
cc.sh  hw  inc	lib  main.c  {arch}
$

ホームディレクトリに戻って、hogehoge というディレクトリに base-0 リビジョンを展開してみた。やはりうまくインポートできているようだ。でなければうまく取り出せるわけがない。納得できたら hogehogeを消しておこう。せっかく get コマンドが出てきたので少し補足するが、get コマンドを最後の引数なしで実行してみよう。

$ pwd
/home/octopus/hogehoge
$ cd ..
$ ls
ARCHIVES  hogehoge  proj  tla-1.2  tla-1.2.tar.gz
$ rm -rf hogehoge
$ tla get test--proj--1.0
* from pristine cache: octopus@bluegate.org--2004/test--proj--1.0--base-0
* making pristine copy
* tree version set octopus@bluegate.org--2004/test--proj--1.0
$ ls
ARCHIVES  proj	test--proj--1.0--base-0  tla-1.2  tla-1.2.tar.gz
$ tla get test--proj--1.0
get: output directory already exists (/home/octopus/test--proj--1.0--base-0)
$

言いたいことはこうだ。展開先ディレクトリを指定しないと、 tla get はバージョンにリビジョン名をつなげたような名前のサブディレクトリ—いまの場合だとtest--proj--1.0--base-0—を作ってそこにリビジョン内容を展開すること、展開しようとするディレクトリがすでに存在する場合にはそれを上書きすることはないということ。展開先ディレクトリは必ず新しく作成されなくてはならない、ということ。確認したらディレクトリを消しておこう。

$ ls
ARCHIVES  proj	test--proj--1.0--base-0  tla-1.2  tla-1.2.tar.gz
$ rm -rf test--proj--1.0--base-0
$ ls
ARCHIVES  proj	tla-1.2  tla-1.2.tar.gz
$

もう信じてもいいだろう。我々は確かに base-0 という最初のリビジョンを手に入れたのだ。プロジェクトツリーとアーカイブの様子を図で示すと以下のような感じになっている。

図 3.4. プロジェクトツリーとアーカイブ

プロジェクトツリー(今の場合 /home/octopus/proj)を削除してもアーカイブ中にできた base-0 は影響を受けないことに注意しよう。プロジェクトツリーとは君が汗を流し、呻き、額を打ちつけ、格闘しつづける、おがくずと鉄の切りくずが散らかる、油の匂が漂う泥くさい「作業場」なのだ。あとで君のアーカイブからしみ一つない理路整然としたソースファイルを tla get で取り出した人間には、君のそんな姿などおそらく想像もつかないだろう。だがそれでいいのだ。それが本当の美学なのだから。

リビジョンとは何か

前節で最初のリビジョンをバージョン test--proj--1.0の中に作った。ここからはプロジェクトツリーに対して変更を加えてはコミットを発行することで、リビジョンが増えていく。ここではリビジョンという言葉について少し詳しく説明する。

バージョンはゼロ個以上のリビジョンを格納する場所で、アーカイブの中にある。バージョンにできる最初のリビジョンは base-0 という名前になる。二つ目以降のリビジョン名は patch-n という形になる。ただしn はコミットの順序を示す1から始まる整数である。^[12]

一度作成されたリビジョンは、修正されたり、削除されることはない。リビジョンはバージョンの中にあり、バージョンはアーカイブの中にあり、アーカイブはその性質上既存データに対する修正はありえないので、リビジョンを作成するのに利用したプロジェクトツリーを削除しても一度コミットしたリビジョンは削除されることはない。リビジョンはバージョンの中で順序を持っている。つまり、コミットした時間の順序に一列に並べることができる。リビジョンをこの順序に並べ、先頭のbase-0 を 0 番目として数えていった番号のことをリビジョン番号と呼ぶ。リビジョン名を指定すると、そのリビジョン番号がひとつ決まる。逆にリビジョン番号を指定するとそれに対応したリビジョン名が求まる。この意味で両者を同一視することができる。リビジョン名は、パッチレベルと呼ばれることがあるが、リビジョン番号を指す場合もあるのでどちらの意味で利用されているか文脈から判断する必要がある。リビジョン番号とリビジョン名の対応は以下のようになる:

0    base-0
1    patch-1
2    patch-2
…

リビジョン名は文脈によって二つの異る意味をもつ。リビジョン名は、そのリビジョンをコミットしたプロジェクトツリーの状態を示すと同時に、直前のリビジョンとの間の差分であるすチェンジセットをも意味する。その場合、このチェンジセットは直前のリビジョンといま問題になっているリビジョンの両方に対して等しく関係しているにもかかわらず、後の方のリビジョン名によってこのチェンジセットを参照することに注意しなくてはならない。

プロジェクトツリーとは何か

プロジェクトツリーとは、tla init-tree コマンド、あるいは tla get コマンドなどによって作成された {arch}管理領域を持つディレクトリツリーのことである。プロジェクトツリーはリビジョンとは違って一つ以上のバージョンと関係を持つことができる。しかし通常は主に一つのバージョンと関係するだけのことが多いし、またこれで十分である。プロジェクトツリーはデフォルトバージョンを設定することができる。プロジェクトツリーに対してはたらく多くのコマンドは特に指定しなければデフォルトバージョンに対してはたらく。

プロジェクトツリーは、通常はデフォルトバージョンに対して行なうコミットを、実は任意のバージョンに対して実行することができる。あるバージョンに対するコミットが成功するには、アーカイブ中にあるそのバージョンに含まれるすべてのリビジョンのパッチログを、そのプロジェクトツリーは持っていなくてはならない。この条件が満たされた時、そのバージョンの最新リビジョンとプロジェクトツリーとの間のチェンジセットが計算され、その内容によって新しいリビジョンがそのバージョンに追加される。両者のツリーの内容がいかに違っていたとしても、チェンジセットの差分の計算は(適用の計算と違って)常に成功するので、かならず新しいリビジョンを追加することができる。

あまり頻繁に起こる状況ではないが、プロジェクトツリーの内容をあるバージョンの最新リビジョンとして強制的にコミットしたい場合には、tla sync-tree を使って、該当バージョンのすべてのリビジョンのパッチログをプロジェクトツリーに追加すれば良い。sync-tree はある意味、コミットロジックをだますためのコマンドであるとも言える。

同じような視点でプロジェクトツリーの update を述べよ

日々の利用

概論

ようやく初期インポートが終わった。ここから先は単純だ。どんなバージョン管理システムでも、基本的な操作はたった二つしかない。それは:

プロジェクトツリーのファイルに修正を加えて
それをコミットする

これだけだ。この二つの操作を基本とした上で、じゃあ他のアーカイブのデータを取り込むことができるのか、二人以上の人間が同じ場所に変更したときうまく調停してくれるか、ネットワークをまたいでマージできるか、複数のファイルの変更をひとまとまりの変更としてまとめて取り扱ってくれるか、ドキュメントは充実しているか、サポートセンターはあるか、ロゴ入りマークのTシャツと携帯ストラップは扱っているか、作者はヤンキースファンであるかどうか、などの話が続く。

最初の操作。つまりプロジェクトツリーのファイルに対する修正は、 GNU arch とは無関係に行う処理になる。テキストファイルであればエディタを使って修正するかも知れないし、一括置換用のスクリプトを流してバッチ的に多くのファイルを変更するかも知れない。バイナリファイルであれば、たとえば画像ファイルならその画像を編集するためのお絵かきソフトか何かで編集してから保存する。どんな修正をしようと君の勝手だし、ここが大切なところなのだが、GNU arch はそれらの修正に対して一切口を出さない。いや、口を出さない、というのは正確ではない。GNU arch は能動的に何かをしないだけではなく、受動的に何かを監視するようなことすらしない。unix の言葉で言えば何かデーモンプロセスのようなものが走っているわけではない。「ははー、こいつ、いまこんな修正してやがる。じゃあ次のコミットに備えてこうしておこう」- その手の処理は一切しない。GNU arch は君が何をしているか知らないのだ。

GNU arch が君の変更を知るのは二番目にあげた処理、つまりコミットするために次に tla commit が実行された時だ。このコマンドが呼び出されると GNU arch は最後に tla commit あるいは tla import が呼び出された時点でのツリーの様子と現時点での様子の違いを完全に把握するためにプロジェクトツリー全体をスキャンする。君は言う。そんなことしたって無駄だ。だって直前のツリーなんてもうどこにも存在しちゃいない。いま修正を加えたばかりだぞ、と。正論だ。実はtla はこの比較のために、 commit/import するたびに、その時点のツリー全体を丸ごとコピーして {arch}管理領域にもう1セット保存しておくのだ。このコピーのことをプリスティンコピーと言う。まあ、世の中それなりにうまくできているのだ。

tla changes(1)

あまり話しを遠くまで進める前に、前のサンプルにちょっとイタズラしてみよう。main.c を適当にいじって保存し、tla changes コマンドを叩いてみる:

$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--base-0 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--base-0
M  main.c
$

M という文字で始まる行によって、main.c に修正が入ったことがわかる。実際の修正内容を見たい場合には --diffs というオプションをつけると良い:

$ tla changes --diffs
* looking for octopus@bluegate.org--2004/test--proj--1.0--base-0 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--base-0
M  main.c

* modified files

--- orig/main.c
+++ mod/main.c
@@ -1,5 +1,8 @@
 #include "./inc/tools.h"
 
+/*
+    main function:
+*/
 int main()
 {
         hello_world();

$

このように GNU diff 形式で表示してくれる。今回は 3 行コメントを入れたことがわかる。どんな変更をしたか確認したいことはよくある。たとえば昨日の晩徹夜で作業を続け、次の日の午後コンピュータの前でよだれを垂らして気を失っている自分に気がついたとする。最後に何をしたかなんてもちろん誰も覚えてはいない。そんなときにはこのコマンドを使って変更点を調べよう。コミットする直前に、おそらく 90 % 以上の確立で私はこのコマンドを叩く。一番よく利用されるコマンドかも知れない。

プロジェクトツリー内のファイルに対する修正についてもう少し詳しく考えてみよう。修正にはファイルの内容の変更のほかにももう少しいろいろな修正が考えられる。まずファイルのパーミッションを修正するような場合。それから、既存のファイルを削除したり、新しいファイルを追加したりするような場合だ。このうちファイルを新たに追加した場合にはやっかいなことがおこる可能性がある。前章で少し説明したように、新しいファイルの名前が =tagging-method が適切に設定されていなければ今回のコミットに伴うスキャンで GNU arch がそれをソースファイルと認識できない可能性があるのだ。

またいたずらしてみよう。まず main.c の修正はそのままにしておいて、cc.sh のパーミッションを変更してから tla changes を実行してみる:

$ ls -l
total 36
-rwxrwxr-x    1 octopus  octopus        40 May  5 11:54 cc.sh
-rwxrwxr-x    1 octopus  octopus     13667 May  5 12:07 hw
drwxrwxr-x    2 octopus  octopus      4096 May  5 11:53 inc
drwxrwxr-x    2 octopus  octopus      4096 May  5 11:53 lib
-rw-rw-r--    1 octopus  octopus       110 May  7 12:17 main.c
drwxrwxr-x    4 octopus  octopus      4096 May  5 19:04 {arch}
$ chmod -x cc.sh
$ ls -l cc.sh
-rw-rw-r--    1 octopus  octopus        40  5月  5 11:54 cc.sh
$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--base-0 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--base-0
-- cc.sh
M  main.c
$

-- cc.sh という行が増えている。-- はパーミッションに変化があったことを示す表示だ。やはり --diffs オプションをつけると詳しい状況がわかる:

$ tla changes --diffs
* looking for octopus@bluegate.org--2004/test--proj--1.0--base-0 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--base-0
-- cc.sh
M  main.c

* file metadata changed

    ./cc.sh
        --permissions 775
        => --permissions 664

* modified files

--- orig/main.c
+++ mod/main.c
@@ -1,5 +1,8 @@
 #include "./inc/tools.h"
 
+/*
+    main function:
+*/
 int main()
 {
         hello_world();

$

main.c の修正のほかに、--permissions のような行が表示され、 775 から 664 に変化したことを教えてくれている。このあたりの話はすべてプロジェクトツリー上でおきていることで、アーカイブ領域とは何の関係もない。

undo と redo

さあ、イタズラはこのくらいにして、元に戻そう。main.c をエディタでもう一度いじって、cc.sh に対しても chmod しなおせば良いのだがもっとスマートな方法がある。tla undo だ。このコマンドは修正する前に、最後に実行した import/commit コマンド時点の状態までツリーを戻してくれる:

$ tla undo
* linting the source tree
* reverting changes
M   main.c
--  cc.sh
$ ls
,,undo-1  cc.sh  hw  inc  lib  main.c  {arch}
$ ls -l cc.sh
-rwxrwxr-x    1 octopus  octopus        40  5月  7 13:19 cc.sh
$

main.c の内容を cat なり more なりで確認してほしい。cc.sh のパーミッションも元に戻っているのがわかるだろう。問題は ,,undo-1 という、奇妙なファイルがあることだ。このファイルの正体は、実はなんの変哲もないただのディレクトリで、チェンジセットと呼ばれるデータが入っている。,, でディレクトリ名が始まるのは GNU arch がジャンクファイルに分類するためだ。この形のファイルはいつなんどき勝手に削除されても文句は言えない。そういう決まりがある。ここにはついさっきやったツリーに対するイタズラの詳細が記録されている。絵に書くとこんな感じだ:

図 3.5. base-0, base-0 への修正を加えたツリー、,,undo-1 の間の関係

どこかで見た図だとは思わないだろうか? そう、第一章で説明した GNU diff と GNU patch の絵に似ている。はっきり言ってそっくりだ。あそこでは GNU diff/GNU patch が取り扱っていたのは一つのファイルだった。tla undo は GNU diff のツリーバージョンなのだ。ツリーとツリーの間の差分を計算して、それを ,,undo-1 に保存する。これが tla undo だ。とすると、それと反対のことをするコマンド、つまり GNU patch のツリー版も存在しなくては理屈に合わない。まったくその通りで、tla redo というコマンドがある。これは tla undo の結果を取り消す、つまり、もう一度イタズラをした状態にツリーを戻すためのコマンドだ。やってみよう:

$ tla redo
* linting the source tree
M   main.c
--  cc.sh
$ ls
cc.sh  hw  inc	lib  main.c  {arch}
$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--base-0 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--base-0
-- cc.sh
M  main.c
$

tla changes の結果が、イタズラしたときと同じになっているだろう。同時に ,,undo-1 というディレクトリが消えている。ツリーを元に戻すために tla redo が利用したからだ。いろいろ説明してきたが、我々はまだアーカイブ領域には一切手をつけていない。tla undo も tla redo もプロジェクトツリーにのみ作用し、アーカイブには一切書き込みしないことに注意してほしい。

修正のコミット

話を進めようと思う。今回のいたずらを実際の修正点と見なしてコミットしてみよう。コミットする一番簡単な方法は -L オプションの後にログメッセージをつけて単に tla commit を呼び出すことだ:

$ tla commit -L'hoge'
* update pristine tree (octopus@bluegate.org--2004/test--proj--1.0--base-0 => test--proj--1.0--patch-1)
* commited octopus@bluegate.org--2004/test--proj--1.0--patch-1
$

base-0 の次のリビジョン、patch-1 ができた。'hoge' は、日本版 'foo' のことだ^[13]。-L の後の文字列がログメッセージとして今回のリビジョン patch-1 に付随したメッセージとして保存される。アーカイブの状態を確認したい場合は例によって tla abrowse を実行する。オプションはたくさんあると言ったが、たとえば --desc オプションなどをつけると、かなりいろいろな情報をコンパクトに表示できる:

$ tla abrowse --desc
octopus@bluegate.org--2004
  test
    test--proj
      test--proj--1.0

        base-0    (initial import)
          Wed May  5 19:04:43 JST 2004      octopus <octopus@bluegate.org>
          initial import

        patch-1    (simple changeset)
          Fri May  7 14:01:34 JST 2004      octopus <octopus@bluegate.org>
          hoge

$

hoge の文字が表示されているのがわかると思う。tla abrowse はさまざまな引数をとり、いろいろな側面からアーカイブの内容を表示する機能を持っている。いずれもアーカイブに対する参照だけなので、ぜひ試してみてほしい。tla abrowse と同様の表示をする tla changelog というコマンドもある。似たようなコマンドが二つあるのは単に歴史的な理由からだ。tla abrowse の方が後にできた新しいコマンドなので、こちらを利用するのがおすすめだ。

ところで -L オプションではたいした量のログメッセージは書けない。腰をすえてじっくりログメッセージを作りたい人は、まず tla make-log コマンドを使ってログファイルの元になるファイルを作る。見るもおぞましいファイル名をもったログのテンプレートファイルがプロジェクトツリーのルートに作成される。

$ tla make-log
/home/octopus/proj/++log.test--proj--1.0--octopus@bluegate.org--2004
$ ls
++log.test--proj--1.0--octopus@bluegate.org--2004  hw	lib	{arch}
cc.sh						   inc	main.c
$

tla make-log はプロジェクトツリー上での実際の修正を済ませてこれからコミットするという直前に作っても良いし、修正前にあらかじめ作っておいても良い。more でこのファイルの中身をのぞいてみよう:

$ more ./++log.test--proj--1.0--octopus@bluegate.org--2004
Summary: 
Keywords: 

$

ファイルの中には Summary: とKeywords: の二つの文字列がある。ログのタイトルとなる要約の文字列はSummary: の後に書く。Summary: の後に最低一つは空白を置いてやるほうが良い。ログメッセージが長くなる場合には、Keywords: の行の下に一行空行をいれて、その後にログの本文を書いてやる。たとえばこんな具合だ(XXX:日本語の問題):

$ more ./++log.test--proj--1.0--octopus@bluegate.org--2004
Summary: add an empty file.
Keywords: 

add an empty file for the test of 'tla changes'.

$

このファイルの Summary: と Keyword: の文字そのものや、 Keyword: の後に一行空行を入れることに注意してほしい。このファイルは RFC822 準拠の形式をしているので、これに従わない場合にはエラーとなってしまう。もう一度コミットしてみよう。GNU arch では、コミットは少なくともツリーになんらかの変更がされない限り受け付けない。そこで、今度はイタズラで空のファイルを追加してみる:

$ touch sub.c
$ ls
++log.test--proj--1.0--octopus@bluegate.org--2004  hw	lib	sub.c
cc.sh						   inc	main.c	{arch}
$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--patch-1 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--patch-1
A  sub.c
$

sub.c というファイルを追加した。touch コマンドは空のファイルを作るためのコマンドだ。その後 tla changes の出力を見てみる。'A' で始まる行は追加されたファイルを示している。'M' と 'A' が出てきたが 'D' というのもあってファイルが削除された場合にはこの表示が出る。ではコミットしてみよう。ログファイルがあるので今回は -L は不要だ:

$ tla commit
A  sub.c
* update pristine tree (octopus@bluegate.org--2004/test--proj--1.0--patch-1 => test--proj--1.0--patch-2)
* commited octopus@bluegate.org--2004/test--proj--1.0--patch-2
$

リビジョン patch-2 ができて、嫌なログファイルも消えてくれた。tla abrowse してみよう:

$ ls
cc.sh  hw  inc	lib  main.c  sub.c  {arch}
$ tla abrowse --desc
octopus@bluegate.org--2004
  test
    test--proj
      test--proj--1.0

        base-0    (initial import)
          Wed May  5 19:04:43 JST 2004      octopus <octopus@bluegate.org>
          initial import

        patch-1    (simple changeset)
          Fri May  7 14:01:34 JST 2004      octopus <octopus@bluegate.org>
          hoge

        patch-2    (simple changeset)
          Fri May  7 16:50:28 JST 2004      octopus <octopus@bluegate.org>
          add an empty file.

$

ロ、ログファイルってやつは・・・

unix のエディタによっては、この '++...' というログファイルを引数にして起動しようとするとエラーになってしまうことがある。これは '+' で始まる引数をオプションと見なすためだ。emacs では問題ないが、vi ではこの問題が生じる。これを回避するには、たとえば vi の場合なら '$ vi ++...' とやるかわりに、'$ vi ./++...' のように'. /' をつけるとうまく編集できるようになる。この問題は GNU arch ユーザから年間 200 回くらい質問され、何度質問されても実にもっともな質問だと思うのだが、空間が 3 次元であったり、地球がたまたま左回りだったり、TV ディナーが日本のコンビニでは売っていなかったり、 esse の一人称単数現在が sum だったりするのと一緒で、私にはどうすることもできない。

ちょっとくどいが、'D' の出力を見るために sub.c を削除してからもう一度だけコミットを練習してみよう。こんな感じだ:

$ rm sub.c
$ ls
cc.sh  hw  inc	lib  main.c  {arch}
$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--patch-2 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--patch-2
D  sub.c
$ tla commit -L'delete sub.c'
D  sub.c
* update pristine tree (octopus@bluegate.org--2004/test--proj--1.0--patch-2 => test--proj--1.0--patch-3)
* commited octopus@bluegate.org--2004/test--proj--1.0--patch-3
$ tla abrowse --desc
octopus@bluegate.org--2004
  test
    test--proj
      test--proj--1.0

        base-0    (initial import)
          Wed May  5 19:04:43 JST 2004      octopus <octopus@bluegate.org>
          initial import

        patch-1    (simple changeset)
          Fri May  7 14:01:34 JST 2004      octopus <octopus@bluegate.org>
          hoge

        patch-2    (simple changeset)
          Fri May  7 16:50:28 JST 2004      octopus <octopus@bluegate.org>
          add an empty file.

        patch-3    (simple changeset)
          Fri May  7 16:54:08 JST 2004      octopus <octopus@bluegate.org>
          delete sub.c

$

何か重要な変更をした後でも、コミットが済んだらひと安心だ。君の修正はすべてアーカイブに保存されたことになるし、アーカイブは追加される一方で、削除されることはないからだ。ディスクがクラッシュせず、アーカイブ用のファイルシステムを GNU arch 以外のプログラムで直接いじらない限り、君の修正は永久に保存されたことになる。プロジェクトツリーは作業領域に過ぎないから、削除しても大丈夫だ。既に紹介した tla get コマンドでいつでもプロジェクトツリーを復元することができる。ぜひためしてみてほしい。

プリスティン・コピー

一番よく利用されるのは、tla commit だ。これは作業中のプロジェクトツリーの内容と、作業開始時点の内容、つまりアーカイブバージョンの中の最新リビジョンとの間の差分を計算する。GNU arch では差分の結果は単なるパッチファイルではなく、チェンジセットというデータ構造として求めるのだった。tla commit はこのチェンジセットをアーカイブの該当バージョン用の領域に追加し、リビジョンを増やす。リビジョンには commit のオプションで特に指定しなければ、patch-10 のような形のリビジョンを作る。patch-10 には二つの意味がある。ひとつは前のリビジョンと作業コピーとの差分を元にして計算したチェンジセット、もう一つはその結果追加されたリビジョンのことだ。

ところで、ここでよく考えてみてもらいたいのだが、最後のリビジョンとプロジェクトツリーの間の差分を比較するためには、本来であればリビジョンにアクセスしなくてはならない。ひとたびできたリビジョンは永続的なデータであり、それはアーカイブにある。後で説明するが、アーカイブは別にプロジェクトツリーのあるマシンと同じマシンになければならないという制約はない。もしリモートアーカイブなら、ネットワークにつながっていなくてはアクセスできない。これは不便だ。君は桜の木の下でラップトップを広げてひと仕事したかったのだ。

そこでプロジェクトツリーは自分が最後にアクセスした最新リビジョンのコピーを{arch}管理領域配下にデフォルトでは１世代だけキャッシュしている。これをプリスティン・コピーと言う。だから今話してきた差分の表示はプロジェクトツリーにアクセスできさえすれば実行できるのだ。

tla changes --diffs の結果が気に入らない場合、最後のリビジョンにプロジェクトツリーの内容を戻すことができる。これは普通は今言ったプリスティン・コピーをプロジェクトツリーの内容に上書きすることで行う。いま話したのと同じ理由で、この操作もアーカイブにアクセスすることなしに実行できる。これには tla undo コマンドを使う:

よくあるトラブル

ここでは日々の利用でよく遭遇する問題について説明する。良い質問を補遺にある方法のどれかで私に送ってもらえれば、この節はより一般的により豊富により洗練されたものとなっていくだろう。

プロジェクトツリー中に恐ろしい名前のファイルができた

GNU arch のコマンドの一部はアトミックな処理を必要としている。この実現のためにプロジェクトツリー中に一時ファイルを作成することがよくある。データベースに詳しい人ならご存知だとは思うが、こういうひとまとまりの処理をトランザクションと言う。トランザクションが途中で中断されると、トランザクションでやるはずだったすべての処理が取り消される。この場合トランザクションを構成するために必要だった一時ファイルは取り残される。君の見ている恐ろしいファイルはおそらくこの一時ファイルだと考えられる。具体的には以下のような名前のファイルだ(XXX:)

これらはいずれも安全に削除できる。慣れるまでは削除するのに抵抗があると思うが、問題はない。万が一間違ったものを消してしまったとしても、所詮プロジェクトツリー内部の問題だ。どうしてもわからなくなったのなら tla get でフレッシュなプロジェクトツリーを再構築するまでだ。

コミットに失敗する

コミットに失敗するとき、XX のようなエラーが出ることがある。これは前回のコミットが異常終了するなどして、内部的なロックファイルが残ってしまった場合におこる。これには tla lock-revision の -b オプションを使ってロックを解除する。

ロックを解除してもアーカイブにあるデータや、プロジェクトツリーの内容が壊れることはない。これは純粋に排他制御だけに関係した問題だからだ。

tla changes コマンドの出力についての詳細な説明。パーミッションが変わったときとかファイル名がかわったときとか。

外部インベントリタグを持ったファイルをファイルだけ削除してしまった

この章のまとめ

この章は、ちょっと盛りだくさんだったかも知れないが、最初自分が始めて GNU arch を使ったときにとまどったことなどをできるだけ思い起こして一歩一歩書いてみた。(XXX) この中で一番重要なコマンドをあげろと言われたら、tla commit, tla changes, tla undo, tla redo, tla abrowse の5個だろうか。これだけ知っていれば、パンと水だけ与えられた囚人程度には、なんとかやっていける。この中のコマンドでアーカイブに対して書き込み処理をするのは tla commit だけであることに注意してほしい。tla commit はアーカイブに対して書き込み処理を実行することができる GNU arch の数少ないコマンドの一つだ。

^[4]V の部分は補遺にあるようにいくつかの数字をピリオドで区切ったものになる。

^[5]このためにも、アーカイブ名に適切な E-mail アドレスを設定することが重要になる。

^[6]もちろんネットワークが切断されていたり、回線の早さからくる制約はあるが、論理的な制約ではない。

^[7]emacs エディタなら foo~ とか #foo.bar# のような雰囲気でディレクトリに残ることが多い。

^[8]CVS で言う、CVS ディレクトリにあたる。

^[9]これは通常のエディタで編集可能なテキストファイルである。

^[10]正直言って、このサンプルは明らかに改良が必要だと考えている。汎用的なデータを管理できると言っておきながら結局プログラム言語を例としなくてはならないことについては本当に申し訳ない気がする。もっと実践的でプログラムに依存しないような汎用的な例でこのサンプルは書き換える必要があると感じている。

^[11]正確には現在では利用されないが下位互換性を維持するための implicit という方法もあるがここでは扱わない。

^[12] 特殊なリビジョン version-0 と versionfix-n という形のリビジョンを作ることもできるが、これらの利用は推奨されていない。詳しくは補遺を参照してほしい。

^[13]しかし不思議なことに日本には'bar', 'baz' に当たるものはない。

第4章インベントリ

=tagging-method

第一のチェック - ファイルタイプチェック
第二のチェック - インベントリチェック

explicit による方法
tagline による方法

この章のまとめ

前の章では一人で一つの開発ラインをバージョン管理するのに必要な基本的なコマンドについて一通り見てきた。主に基本的なコマンドの紹介をすることが目的であったため、ファイルの個数も、ごく少数の構成にとどめた。この章では、すでに別の方法で管理されているソースファイルを GNU arch 管理下に置いたり、たくさんのソースファイルから構成される未管理のディレクトリをGNU arch管理下に置く方法について説明する。基本的には前章の応用だが、たくさんのファイルを一度にインポートしようとすると、ファイルタイプ識別やインベントリ識別からくるエラーでうまくいかないことが多くなる。そこで前半では GNU arch 特有の概念「インベントリ」について詳しく説明し、インベントリタグとファイルのアイデンティティー、タグづけの方法などとの関係について議論する。そして後半でこの応用として既存のプロジェクトを GNU arch 管理下に 2 通りの方法でインポートしてみる。この章を理解すれば、なぜある場面であるファイルがソースファイルと認識されたり、そうならなかったりするのか、また、明示的なタグ付けの方法ではなぜファイル名称の変更に注意しなくてはならないのか、また arch-tag: がなぜ必要なのかを明らかになるだろう。

=tagging-method

あるプロジェクトツリーをアーカイブバージョンの最初のリビジョンとしてインポートしたり、その後プロジェクトツリーに加えた変更点を直前のリビジョンからの差分としてコミットしたりする時点で、GNU arch は常に前のリビジョンの内容と比較して、プロジェクトツリーに何が起きたかをスキャンする。プロジェクト中のあるファイルには変更が加えられているかも知れないし、新しいファイルが追加されたり既存のファイルが削除されていたり、別のサブディレクトリに移動していたりすることもあるだろう。GNU arch はプロジェクトツリー中のすべてのファイルを管理対象にするわけではない。ある決まった規則にしたがっているファイルだけをバージョン管理対象ファイルとみなす。あるファイルがGNU arch の管理対象であるかどうかは、3種類のテストによって決められる。最初にファイル名称がどんな形をしているかのチェック、二番目に、ファイルに正しく「インベントリ」が振られているかのチェックだ。「インベントリ」と「非認識」という言葉が説明なしに出てきたが、これについても順を追って説明していく。

追加コマンドはどこに?

CVS を利用されている方なら、新しいファイルをバージョン管理対象下に置く場合、明示的にコマンドを入力する必要があることをご存知だろう。cvs add コマンドがこれです。GNU arch にはこのようなコマンドはない。GNU arch は commit や import などリポジトリにデータを追加するたび、まずプロジェクトツリー全体をスキャンして、それぞれのファイルが管理対象のルールに従っているかどうかを確認し、これにマッチすればファイルが追加されたと考える。

二つのチェックは設定によってかなり自由に変更することができる。設定は、主にプロジェクトツリーの{arch} 管理領域にある =tagging-method という定義ファイルの内容によって決まるが、それ以外の情報も関係してくる。=tagging-method ファイルは tla init-tree コマンドを発行してあるツリーを最初にプロジェクトツリーにした時点で、このファイルの内容はデフォルト値に初期化される。

第一のチェック - ファイルタイプチェック

最初は、ファイルタイプのチェックだ。GNU arch はファイルを以下の 6 種類に分類する決まりがある。プロジェクトツリー中のどのファイルも、必ず以下の 6 種類のどれかに分類されます。このような複雑な分類には、それぞれきちんとした意味があると考える人もいるが、少なくとも最初のうちはあまり深く掘り下げず、そのようなものだと考えると良いと思う。必ず覚える必要はないものだが、覚えようと思う人は不規則動詞の変化を覚える方の脳みそで覚えよう。いろいろな名前がついているが、言葉の意味を深追いせず、単にグループ1, グループ2 ... グループ 6 の別名だと考えても良いかも知れない。グループ 4 のソースファイルが、主なバージョン管理対象となる。

ジャンクファイル: ゴミファイル、たとえば作業用に一時的に使う中間ファイルなどを分類することを狙っている。主にディレクトリごとにある .arch-inventory ファイル、または=tagging-method ファイルの、junk 正規表現で設定するが、',,' で始まるファイルは常にジャンクと見なされる。
バックアップファイル: 管理対象ではないが、GNU arch が注意して扱う必要のあるファイル。エディタの作るバックアップファイルなどを分類することを狙っている。ディレクトリごとにある.arch-inventory ファイル、または =tagging-method ファイルの、backup 正規表現で設定する。
プレシャスファイル: 管理対象ではないが、GNU arch が注意して扱う必要のあるファイル。バックアップファイルとは少し違った扱いをするため、別のグループとして定義されている。主にディレクトリごとにある .arch-inventory ファイル、または=tagging-method ファイルの、precious 正規表現で設定するが、'++' で始まるファイルは常にプレシャスと見なされる。precious は「貴重な」という意味。
ソースファイル: 管理対象となるファイル。常にバージョン管理対象ファイルと見なされる。ディレクトリごとにある .arch-inventory ファイル、または=tagging-method ファイルの source 正規表現で設定する。
除外ファイル: 管理対象に含めないことを明示的に指定するために設定する。GNU arch はデフォルトでは import や commit 時に非認識ファイルが一つでもツリー中に存在するとエラーとする。このようなファイルを明示的に除外ファイルに加えることでエラーを回避することができる。除外ファイルはディレクトリごとにある .arch-inventory ファイル、または =tagging-method ファイルの exclude 正規表現で設定する。
非認識ファイル: 上記のどれにも当てはまらないファイルは、非認識ファイルとして「認識」される。非認識ファイルが存在する場合には、原則として GNU arch は import や commit でエラーを発する。あるパターンに合うファイルを明示的に非認識ファイルとして「認識」させるには、ディレクトリごとの .arch-inventory ファイル、または =tagging-method ファイルの unrecognized 正規表現で設定することもできる。

プレシャスはどのような意味で削除されないのか。junk はどのようなタイミングで削除されるのか、などなど。

どのファイルがどのグループに属するかは主に =tagging-method ファイルで行なう。ディレクトリごとに .arch-inventory ファイルを設定することもできるが、話が煩雑になるので GNU arch に慣れるまではあまり使わないほうが良い。

第二のチェック - インベントリチェック

インベントリチェックは、第一のチェックでソースファイルに分類されたファイルが、正しいインベントリidを持っているかどうかを調べる。インベントリidについてはあらためて説明するが、ここでは、ソースファイルを区別するための「キー」だと考えてほしい。GNU arch では、ファイル名の違いによってファイル同士を区別する場合のほかに、この「キー」の一致不一致によって二つのファイルの起源が同一のものかどうかを判断する場面があるので、ソースファイルはかならずインベントリid を持たなくてはならない。

インベントリid はインベントリidを計算するための元になる情報を、あらかじめ保持しているさまざまな情報から計算する。保持情報は大きく三つの場所に分類される。

ファイル名そのもの
ファイルの内部
ファイルの外部

ファイルの内部の保持情報は、特殊な文字列をファイルの先頭または末尾のほうに埋め込むことで表す。具体的には arch-tag: という文字列を書き、その後に文字列を続けることで表す。この文字列のことを arch タグと呼ぶ。arch タグの行は、本来そのファイルが表現しようとする内容とは無関係だ。たとえばこのファイルが C 言語のソースコードであったとしても、そのソースコードでやろうとしている目的とは何の関係もない。arch タグはファイルの中にありながら、そのファイル自身に関係した付加情報を表現する。このような情報のことを「メタ情報」と呼んだりすることもある。arch タグを埋め込むファイルがプログラムのソースコードのようなものである場合、arch-tag: の行が問題を起こさないように、それぞれの言語のコメントの中に書く必要がある。たとえば C 言語なら:

/*
    arch-tag: Tez Kamihira Fri Apr 16 16:15:11 JST 2004 (foo.c)
*/

シェルスクリプト、Perl, Python のような言語なら:

#    arch-tag: Tez Kamihira Fri Apr 16 16:15:11 JST 2004 (foo.c)

Pascal なら:

{
     arch-tag: Tez Kamihira Fri Apr 16 16:15:11 JST 2004 (foo.c)
}

htmlやXML なら:

<!--
     arch-tag: Tez Kamihira Fri Apr 16 16:15:11 JST 2004 (foo.c)
-->

のようになる。言語ごとの arch-tag: のサンプルについては補遺にまとめた。

arch-tag: に利用する文字列はまったくの任意だが、すでにプロジェクトツリー中に存在している別のファイルのタグと重複してはいけない。これに違反すると import や commit 時に GNU arch はエラーを出す。プロジェクトに新しくファイルを追加するときに、既存のファイルをもとにしようとコピーしたような場合によくおこる。この場合には新しいファイルの arch-tag: の部分だけを重複しないような文字列に変更してやるだけでエラーは表示されなくなる。

重複しないような文字列をいちいち考えずに作り出す方法があると便利だ。GNU arch コミュニティーのメンバーは、おおきく二つの流儀でこれをやることが多いようだ。一つはいまいくつかの例で示したような、名前、現在の時刻をしめす文字列、それからこのファイルの現時点での名前、これらを組み合わせた文字列だ。もう一つは UUID と呼ばれる文字列を利用する方法だ。UUIDについては補遺に詳しく書いた。C 言語で UUID を使ってタグを振ると、たとえば以下のようになるだろう:

/*
    arch-tag: 9d3a97ec-dc74-445f-bcf0-234ebb054702
*/

ファイルの外部の保持情報は、ファイルのあるディレクトリの、. arch-ids という名前のディレクトリに保存される。ところで GNU arch では、ディレクトリにもインベントリidをつけることができる。ディレクトリは通常のファイルと違って、内部タグを使うことができないので、必然的に外部タグを使って表現することになる。ディレクトリの外部タグ情報は、やはりそのディレクトリの .arch-ids ディレクトリに保存される。

外部タグの設定は tla add-id コマンドと、tla explicit-default コマンドで行う。tla add-id コマンドはファイルごとの個別の外部タグを設定するのに利用され、tla explicit-defaultコマンドはあるディレクトリにあるファイル全体に対する既定値に関係した情報を設定する。tla add-id で振られる個別の外部タグは、対象となるファイルの名前を foo としたとき、.arch-ids/foo.id というファイルに保存される。たとえば hello.c というファイルには .arch-ids/hello.c.id が、index.html というファイルには　. arch-ids/index.html.id がそれぞれ保存領域になる。ファイルの中には、実際のインベントリid の元になる文字列がある。すでに説明したとおり、インベントリidは他と区別がつく文字列であれば十分なので、 tla add-id コマンドで特に明示的な指定をしない限り、GNU arch が自動的に重複しないような文字列を設定してくれる。具体的にはさきほど説明した第一の方式に近い文字列が生成されるのだが、ほとんどのユーザにとってはその具体的な形にはあまり興味がないだろう。tla add-id コマンドはまた、ディレクトリ用の外部タグ情報を作ることもできる。これは、ディレクトリを d とすれば、つねに d/.arch-ids/=id という名前のファイルに保存するという決まりがある。これはファイルと同じように d/.arch-ids/d.id という名前にしてしまうと、このディレクトリ中にある通常ファイル d のタグと区別がつかなくなってしまうからだ。

あるディレクトリにあるファイルすべてに外部タグを設定せずに既定値を一つだけ設定できると便利だ。これには tla explicit-default コマンドを使う。デフォルト値には、強いデフォルト値と呼ばれるものと、弱いデフォルト値と呼ばれるふたつの値がある。 tla explicit-default コマンドはこの両方を個別に設定することができる。強いデフォルト値は、このディレクトリにあるファイルすべてに対して適用される。弱いデフォルト値は、このディレクトリにあるファイルで、内部タグを持たないものに対してのみ適用される。

では、内部タグと外部タグのどちらがどのような場面で利用されるのだろうか? 以下ではこの判断の詳細について述べる。

一つのファイルに関係した複数の保持情報が存在することがあるので、インベントリidを決めるには、この中のどの情報を使うべきか、また利用できる複数の情報があるとき、どの情報を他に優先して利用すべきかを決めなくてはならない。この優先規則のことをタグづけの方法と言う。タグづけの方法には以下の三種類がある。

explicit
tagline
names

警告

GNU arch システムでは「タグ」という言葉がまったく違った二つの意味で利用される。一つはここで取り扱っているインベントリ idを決めるタグづけの方法。もう一つは GNU arch のバージョンを分岐させるときに利用する tla tag コマンドだ。両者を区別して混乱しないようにしてほしい。

タグづけの方法は、tla id-tagging-method コマンドによって設定することができる。tla 1.2 ではデフォルトでは explicit の方法を利用するようになっているので、他の二つの方法を利用する場合にはこのコマンドで変更してやる必要がある。タグづけの方法は初期インポート後でも自由に変えることができるし、変更によって管理対象ファイルを失うことはないが、てを触れていないファイルが削除され、また追加されたような記録が残ることもあるので初期インポート時までに適切な形に設定することを推奨する。

チェックの詳細

前節での、インベントリに関するさまざまな概念を用いてファイル分類のアルゴリズムの詳細を以下に述べる。繰り返しになるが、この節での議論は、ファイル分類規則からくるトラブルにより import やcommit がうまく行かないような状況にないのであればぜひとも必要な知識というわけではない。私自身、今回このような形の文章を書くのでなければその詳細を知ることはなかったと思う。

まず第一のチェックをする。ファイル名の形だけから、ファイルを六つのどれかのタイプに分類する。分類の規則はファイルのあるディレクトリに .arch-inventory ファイルがあればその内容を、なければ {arch}/=tagging-method ファイルの内容を利用する。ただし ',,' で始まるは常にジャンクファイルとみなし、'++'　で始まるファイルは常にプレシャスファイルであるとみなす。非認識ファイルがひとつでもあれば、その時点でエラーになる。

第一のチェックでソースファイルにマッチしたものについて、第二のインベントリチェックをする。(XXX)。

...

tla inventory

プロジェクトツリー中のファイルがどのタイプに分類されるかを確認するには tla inventory コマンドを使う。このコマンドは非常にたくさんの引数をとる

tla inventory の出力は、二つ以上のグループを表示させるように指示した場合、S,P,B,J,T,U のいずれかの文字の後にオプションで '?' 文字がくる。'?' が表示された場合、名前のマッチング規則だけを考えた場合にはソースに分類されたが、それ以外の理由で別のグループに分類されたことを示している。具体的には現在のIDタグづけの方法では認識しない形式のインベントリidであったり、そもそもインベントリid が振られていないような場合である。文字の意味はそれぞれ、ソースファイル、プレシャスファイル、バックアップファイル、ジャンクファイル、ツリー、アンレコグナイズ(非認識)の意味である。その後に空白が一文字くる。-- kind オプションを指定した場合には、次に 'd', '>', 'r' のいずれかが来る。それぞれディレクトリ、シンボリックリンク、通常ファイル、の区別を表現している。最後にファイル名のプロジェクトツリーからの相対パス名が表示される。--ids オプションが指定された場合にはこの後にインベントリid が表示される。インベントリid を持たないファイルの場合は ??? が表示される。

--f オプションはディレクトリ以外のファイルについてのみ表示し、ディレクトリは含まない。これがデフォルトである。--d を指定すると逆にディレクトリのみを表示し、それ以外のファイルは表示しない。-b は両方を表示する。この三つは高々一つしか指定できない。

--all オプションは {arch}管理領域の配下についても表示するが、あまり利用されることはない。--explicit ... は、 {arch}/=tagging-method ファイルの内容によらず、指定のIDタグづけの方法によってチェックを行うことを意味する。

--untagged オプションはタグづけされていないファイルも表示に含める(多分これは触れないほうがいい。意味としては、ファイルパターンはソースだが、それ以外の理由でアンレコグナイズとみなされたファイルを表示するというもの。しかし、untagged-source ディレクティブが =tagging-method に追加された今では、意味があいまいになりつつあるのでは???XXX:)。

ファイルがディレクトリでかつ、その中に {arch} という名前のサブディレクトリがある場合、このディレクトリは別の独立した GNU arch 管理領域とみなされる。この場合そのディレクトリはツリー属性であるとみなされ(複数グループ表示時には) T で表示される。T の配下は別の GNU arch 管理領域だが、T 自身は現在のプロジェクトツリーの一部であることに注意すること。tla inventory は T と認識したディレクトリの内部は走査対象から除外する。

通常のファイルはファイル内部に arch-tag によってインベントリタグを埋め込むことができるが、明らかにディレクトリに対してはこの手法を使うことができない。このためディレクトリは外部タグをつけるか、タグをつけないかのいずれかを選ぶしかない。通常ディレクトリには外部タグを振らないことが多い。

--ids で表示されるインベントリid の意味の列挙。. /libarch/inv-ids.cの、file_id() の調査。

先頭が ? はファイル名によるタグづけであることを示している。 E_は .arch-ids 配下のファイル, D_ は .arch-ids ディレクトリ自身のインベントリidをそれぞれ示す。 A_ は {arch}管理下のファイル、明示的なタグがある場合 x_ 、.arch-ids/=all によるデフォルトタグの場合 a_, 内部インベントリタグによる場合 i_, 内部インベントリタグが存在しない場合に限って利用される弱いデフォルトタグの場合 w_, k_ (XXXよくわからない)、?_ (XXX)。意味はわからないが、シンボルの一覧は以上でおわりと考えられる。

tla tree-lint

tla tree-lint は本質的には tla inventory コマンドと同じロジックを使ってプロジェクトツリーを走査するがエラーメッセージがより詳細化されている。以下のようなエラーメッセージがある。

These files would be source but lack inventory ids (`tla add' or a tagline perhaps?):

「これらのファイルはソースファイルかも知れないが、インベントリid がついていない('tla add' あるいはtagline を使うと良いのでは?)

説明

These files violate naming conventions:

これらのファイルは名前規約に違反している

説明

These symlinks point to nonexistent files:

これらのシンボリックリンクは存在しないファイルを指している

説明

These apparent source files lack inventory ids:

明らかにソースファイルだが、インベントリid がついていない

説明

These explicit ids have no corresponding file:

明示的なid に対応するファイルが存在しない

説明

Duplicated ids among each group of files listed here:

それぞれのファイルグループ中に重複したインベントリidを持つものがある

説明

既存プロジェクトの移行

この節では既に存在している比較的規模の大きなソースコードを新たに GNU arch で管理し始める方法について検討する。GNU arch の実践的な利用においては ID タグづけの方法として explicit または tagline のどちらかを選択するのが現実的だが、この場合インベントリの問題が顕著に現れてくるため、そのままの形ではうまくインポートできないことが多い。この節ではインポートまでの手順について説明する。前節の内容を基本として理解できていれば一見奇妙に見えるエラーの内容も整理して理解することができるはずだ。初期インポートさえ済んでしまえば、あとは普通のアーカイブバージョンとなんら変わることはなくなる。第 3 章で説明した操作や、5章で説明するすべての操作が可能となる。

なお既存プロジェクトがすでに他のバージョン管理システムで管理されており、最新のソースだけではなくそのプロジェクトの履歴も含めて移行するケースについてはここでは扱わない。移行元が CVS の場合についてはサードパーティー製のツールがある。詳しくは補遺を見てほしい。

explicit による方法

tagline による方法

この章のまとめ

この章では、プロジェクトツリー中の各ファイルを、GNU arch がそれぞれどのような種類のファイルとして認識するかについて説明した。ファイルには 6 っつの種類があり、プロジェクトツリー中のすべてのファイルはこのどれかに分類され、この中のソースファイルのみがバージョン管理の対象となった。ソースファイルはファイル名のマッチング規則の他に、正しいインベントリid を持っている必要があった。ファイルのマッチング規則とインベントリidの決定方法は主に=tagging-method ファイルによって決まった。非認識のファイルがひとつでもプロジェクトツリーに残っていると import や commit 処理は失敗し、これが初期インポートのエラーの原因として考えられる大きな要因の一つであることを説明た。

次の章では、既存のバージョンの分岐を、自分のマシン上に作成する方法と、分岐後で親のバージョンとの間とのデータ交換に必要なコマンドについての説明をする。逆説的な話ですが、既存のバージョンからの分岐は、新規のバージョンでのインポートに関するトラブルが一切ない。分岐元のバージョンがすでにプロジェクトツリーを正しい状態に設定しているためだ。

インベントリid のタイプの説明。先頭に E_ とか ?_ とか付く話と、その分類。tla inventory のオプションごとの詳細な説明。

第5章ブランチとマージ

ブランチ(分岐)

アーカイブの公開

マージの技法

tla replay
tla update
tla star-merge

パッチログの限界

マージの失敗が意味すること

さて、この章から先が GNU arch の本当の凄さが発揮されることになる。ようやく私も一番話たいことについて語れる。ほとんど涙目になっている私の姿を想像してほしい。前章までの議論は CVS のような従来のシステムでも本質的に同じこどかできる。ひとり、もっと正確には一つのリポジトリで作業している時には GNU arch の本当の性質は表には出ない。それは単なる「また別の」バージョン管理システムでしかないのだ。そこまでの機能しか必要がないのであれば、GNU arch をわざわざ理解する必要はあまりないと思う。なんで同じようなことを二つも三つも憶えなくてはならないのだろうと思うかも知れない。しかし、ネットワーク越しに、別のリポジトリとの間でのやりとりが絡んでくると状況は一変する。

この章では、ネットワーク上の他のアーカイブバージョンの内容から分岐処理によって別のマシン上のアーカイブバージョンを作る方法と、この逆に自分のローカルマシン上のアーカイブを他のマシンから分岐できる形に公開する方法について示そうと思う。その後、リモートアーカイブ間でのデータの同期方法について議論する。データの同期はマージと呼ばれるが、マージのために用意された GNU arch のコマンドのいくつかを紹介する。マージに関する問題はモダンなバージョン管理システムすべてが現時点で抱えているもっともホットなトピックの一つだ。GNU arch もまだこの問題を完全には解いていないが、かなり良い振舞をするいくつかのマージコマンドを持っている。おそらく今現在この世に存在しているまともなバージョン管理システムの中では、最も良い結果をもたらすものの一つだと言えるだろう。それでも時にはぶさまなことになる。マージの問題をきれいに解くのは非常に難しい。人類でこの問題をきれいにといたものはまだいない。もし君がこの問題を完全に解いたら、間違いなくチューリング賞がもらえる。万が一もらえないようなら、私が受賞会場に乱入してメガホン片手に君の名前を書いた垂れ幕を振りかざして暴れよう。約束する。

この章を理解すれば、君は基本的に GNU arch について一定の理解をしているということができるのではないかと思う。GNU arch コミュニティーには自分のアーカイブを公開している人がたくさんいるので、それらのどれかを使って、この章での結果を是非自分で確認してみてほしい。アーカイブサーバになるのには少し知識がいるが、人のアーカイブの分岐を自分のマシン上に作るのは非常に簡単な作業で済むし、間違った操作によって親のアーカイブを壊してしまうようなことは一切ないので安心して試してみてほしい。

ブランチ(分岐)

いつものように君はインターネット上にある面白そうなソフトウェアを検索しているとする。で、お目当てのものが見つかった。それはフリーソフトウェアで自由に使ってよいことがわかった。実際にいじってみるが実に申し分のない動作をする。すばらしい。ただ、すばらしい機能拡張を思い付いた。どうしてもこの機能を実装してみたい。作者にメールして、いきなり一緒に開発してくれないかと切り出すのもおかしな話だ。なにせこの人とは会ったこともない。これからだって会う機会があるとは思えない。なにせ彼はアルゼンチンに住んでいるのだ。これじゃ地球の裏側ではないか。

こんな状況で、彼がもし自分のプログラムを GNU arch の公開アーカイブ上のバージョンとして管理していたとすれば、君は実に運がいい。彼になんのことわりもなく、一切彼のてをわずらわせることはなく、君のコンピュータ上に彼のプログラムのコピーを作ることができる。それもただのコピーじゃない。このコピーは自分の由来を理解している。自分のご先祖様が誰であったかを記憶しているのだ。いまどきそんな話、人間でもあまり聞かなくなった。今後、彼が彼のアーカイブバージョンに加えた修正点を追加で君のアーカイブに取り込みながら、君は君で自分の機能拡張作業を続けることができるのだ。このような用途のために君が自分のアーカイブ上に作ったバージョンを、彼のバージョンの「分岐」あるいは「ブランチ」と言う。君のブランチは、彼のバージョンととても良く似ている。でもほんのちょっとだけ違っている。君は拡張モジュールを作っているからだ。君のアイディアは良いものかも知れないし、そうでもないかも知れない。こういうことは普通、少しコーディングを続けてみないとはっきりしないことが多い。本質的に試行錯誤的な作業になることがおおい。一ヵ月夢中でハックしてみて、やっぱりうまくいかなかったとあきらめることになるかも知れない。でもそれが何だろう? 別に彼に何かを頼んだわけではない。黙って君がギブアップすれば良いだけのはなしだ。逆にアイディアが身を結び、君の機能はとても汎用的で、彼自身にも、そしてそのソフトウェアを使っている誰にとっても有益なものだと確信したとする。そんな時には彼にメールして、自分のアーカイブ位置を伝え、ちょっと面白いものを作ったから、よければ取り込んでもらえないだろうかと頼む。彼が気に入れば、これを取り込むことができる。これをマージと言う。マージは彼の意志だけでやることができる行為だ。君には関係がない。君がすることは自分のアーカイブをインターネット上に公開するだけだ。彼に対して特殊な設定をする必要は何もない。

CVS のような集中型システムではこうはいかない。分岐は、親のリポジトリと同じリポジトリ内にしか作ることができないからだ。もし今問題になっているプログラムが彼のマシン上の CVS で管理されていたとしよう。分岐を作ることができるのは君のマシンではなく、彼のマシンだ。ということは、まずは君は彼のマシンに対するアクセス権限を得る必要がある。これは君の仕事ではない。彼の仕事だ。しかしこれは実におかしな話だ。これからハックしようとするのは君だ。彼じゃない。なのにそのことで彼に作業が発生するのだ。これはおかしい。考えてもみてほしい。一度も会ったことのない男からある日突然メールが来て、あなたのプログラムの分岐を作りたいから、あなたのマシン上にアクセス権限をくれと言う。そんな人間においそれとアクセスを許すことができるだろうか?

百歩譲って、アクセス権限をくれたとしよう。くれた方はどんな気持だろうか。これだけのことを自分にしてくれたのだから、ぜひとも何らかの成果を出さなくてはならない。もちろんそんな義務はないのだが、ある日突然気が変わってギブアップというわけにはいかない。理由を彼に説明して、自分はこれこれこういう理由で拡張できると思って始めたけれど、うまくいかなかった、残念だ、という話をしなくてはならない。しなくてはならないわけじゃないが、良識のある人間ならそうするだろう。こんなことをしなくてはならないと思うと、じつに憂鬱だ。どうなるか分からないことを勝手に始めるのに、誰だって他人を巻き込みたくなんかないだろう。で、結局良いアイディアがひらめいても、そこまでして分岐を作る気にはならないだろう。これは重大な機会の損失だ。可能性は小さいかも知れないがもし成功していたとすれば、君だけじゃない、そのソフトウェアを利用しているすべての人にとっての損失だ。君は私が何か多げさなことを言っていると思うだろうか? 私はそうは思わない。

GNU arch ならこんな心配は何もしなくていい。君は勝手に始められる。そして勝手に辞められる。うまくいけば彼に伝える自由がある。もちろんそうしない自由もある。彼は彼で君の申し出を受け入れる自由も拒否する自由もある。誰も困らない。みんなトクをする。実際この仕組みで損をする人がいるとしたらいったいそれは誰だろう。私に教えてほしい。

GNU arch で人のアーカイブバージョンの分岐を作るには特殊な設定は何も要らない。まず、彼のアーカイブを登録する:

$ tla register-archive tez@kamihira.com--2004s \
      http://arch.bluegate.org/{archives}/tez@kamihira.com--2004s
$

分岐元のアーカイブバージョンを tez@kamihira.com--2004s/hello--world--1.0 とし、分岐先のバージョンを octopus@bluegate.org--2004/hello--world--1.1 として説明すると、まず分岐先アーカイブバージョンを作成する:

$ tla archive-setup hello--world--1.1
…
$

注意

分岐元のバージョン名と分岐先のバージョン名の間にはなんの制約もない。ふたつのバージョンが別のアーカイブに存在している場合であれば、まったく同一の名前にすることすら可能だ。今の場合であれば、tez@kamihira.com--2004s/hello--world--1.0 を foo@bleugate.org--2004/hello--world--1.0 なるバージョンに分岐することもできる。また、octopus@bluegate.org--2004/non--sense--0.1 のような名前に分岐することもできる。あとから混乱しないように自由にバージョン名を選択してほしい。

そして tla tag コマンドで実際に分岐バージョンを作る:

$ tla tag tez@kamihira.com--2004s/hello--world--1.0 \
          octopus@bluegate.org--2004/hello--world--1.1
…
$

注意

tla tag コマンドを実行すると、XXX のような警告が出ることがある。これは分岐元のアーカイブがサインつきアーカイブであることに関係している。詳しくはXXXのサインつきアーカイブを読んでほしい。

これで終りだ。本当にこれで全部なのだ。嘘じゃない。私を信じてほしい。あとは君の hello--world--1.1 のプロジェクトツリー上で思う存分ハックするだけだ。君がハックしている最中に、彼は彼で自分のリビジョンを進めることができる。こうして少しずつ君と彼のアーカイブバージョンはずれていく。彼とのずれをなくして同期させるには、君は彼の追加修正分を時分のアーカイブバージョンに取り込まなくてはならない。これがマージだが、3節で詳しく説明する。分岐元のバージョンと、分岐先のバージョンは明示的にマージコマンドを発行するまで独立に修正を加えることができる。この間両者にはデータの授受は一切発生しない。たとえばGNU arch がバックグラウンドでお互いのバージョンから作ったプロジェクトツリーに加えた変更点をリアルタイムに検出して、もう一方の関連したリモートアーカイブバージョンに情報を転送したりすることはない。 GNU arch が実際データを交換するのは、XXX のマージコマンドのどれかを実行したときだけだ。だからどちらかのマシンがラップトップパソコンで、分岐後、マシンをネットワークから外して、喫茶店で作業を続けてももちろんなんの問題も発生しない。マージしたくなったときにネットワークにつながっているだけで十分なのだ。

アーカイブの公開

1節では人のアーカイブバージョンの分岐を自分のマシンに作る方法を説明した。この便利さを本当に実感できたら、君だって他の人にこの便利さを味わってほしいと思うだろう。これがアーカイブの公開と呼ばれるものだ。こっちは少し設定が必要になる。公開用の通信方式はいくつか選択することができて、現時点で GNU arch がサポートしている主な方式は WebDAV と呼ばれる Apache のような httpd サーバを使う方法と、 sftp と呼ばれる sshd サーバを使う方法があり、それぞれ設定方法は違ってくる。ここではこの 2 種類の設定方法について説明する。

<IfModule mod_dav.c>
DavLockDB /tmp/dav.lock

Alias /arch /home/foo/arch

<Location /arch/>
Dav On
</Location>
</IfModule>

もう一つの方法は sftp というプロトコルを利用することである。 sftp は WebDAVほど有名ではないが、実は ssh プロトコル上に実装されたものであるので、ssh がインストールされているシステムであれば通常は特別な設定なしに常に利用することができる。WebDAV が自分のアーカイブを広く不特定多数の人々に公開するのに対して、sftp は自分だけが利用するインターネットにそれぞれ接続された複数のあるような状況で、どのマシンからもそのアーカイブを参照できるようにしたいという意味あいが強い。sftp は ssh 上で動作するので、ネットワーク上のデータは暗号化されて流れるためだ。もちろん WebDAV を利用しても https を利用すれば同じなのだが、http/https プロトコルは非常に一般的に利用されているので攻撃の対象となりやすい。また設定の仕方を誤ることで https に限定した設定を http の設定と混同したりする可能性も高い。人が大勢集まる野球場のすぐ横に国家の諜報活動機関用の建物を建てるようなものだ。(XXX:)。sftp は ftp と名前が良く似ているが、ソフトウェア構成上は何の関係もない。繰り返すが sftp は ssh パッケージの一部と考えることができるので、あらかじめセキュリティーを確保することが容易なのだ。

sftp には、サーバ側での設定は何もいらない。単に sshd が起動されていて、そのマシンがインターネットに接続されており、ssh と同じ設定にしたがったパスワードまたは公開鍵を手にしていさえすれば、そのまま利用できる。クライアント側では以下のように register-archive するだけだ:

$ tla register-archive octopus@bluegate.org--2004 \
      sftp://arch.bluegate.org/home/foo/{archives}/octopus@bluegate.org--2004
$

tla abrowse で接続テストをしてみよう:

$ tla abrowse -A octopus@bluegate.org--2004
…
$

ssh の設定によって、パスワードなどを聞かれることがある。これに正しく答えるか、公開鍵を使って自動的に接続できるように設定すればよい。このあたりの設定は ssh の設定そのものであるので、詳しくは ssh のマニュアルなどを参考にしてほしい。

マージの技法

マージに関係したコマンドは大きく三つの種類にわけて考えることができる。一つは実際のマージについての各種の情報を確認するコマンド、もう一つは実際にマージを実行するためのコマンド、最後にマージに関する記録を保持するパッチログと呼ばれるデータを管理するためのコマンド、この三つだ。普通は第1と第3グループのコマンドの一部を実行して、もしマージしたとしたらどのような結果になるかをチェックし、その後実際のマージコマンドを発行する形になる。チェックコマンドはプロジェクトツリーに対して書き込み処理はしないので気軽に実行できる。一方マージコマンドもプロジェクトツリーには書き込みが発生するが、アーカイブには手を触れないので、マージ後にプロジェクトツリーがどのように変形したかを確認することができる。確認の結果プロジェクトツリーが意図した形に変形していれば、コミットすることになる。これで始めてリビジョンが追加され、修正点がアーカイブに永続的に保存される。

プロジェクトツリーに実際に書き込むコマンドも二種類に分類できる。ひとつは過去にマージされたチェンジセットがどれであるかを記録したパッチログという情報を書き換えるもの、もう一つは実際のソースファイルを変形させるものである。パッチログは重複したマージを回避するために GNU arch が利用する重要な情報だ。パッチログの情報を調整すると、すでに一度適用したチェンジセットを適用しなかったことにしたり、逆に適用したことのないチェンジセットを適用したとみなしたりすることができる。通常はこのような操作は不要だが、特殊な場面では役にたつ。XXX のコマンドリファレンスにはすべての GNU arch のコマンドに対してデータの書き込みが発生するかどうか、発生するとすればどの領域に対してかを示した。これを見てこの章のコマンドをいろいろと試してみてほしい。

マージコマンドは用途や場面に応じてみっつある。

tla replay

このコマンドは三つのマージコマンドのうちでもっとも単純なものだ。replay に対する引数の与え方には三つの方法がある。まず、リビジョン名を指定すると、そのリビジョン名に対応するチェンジセットをプロジェクトツリーに対して適用する。これは成功するかも知れないし、衝突を起こして失敗するかも知れないが、いずれにせよ適用する。リビジョン名に対応するチェンジセットが存在しない場合にはエラーを返す。これは例えば継続によって作られたのではないベースリビジョン、 base-0 のようなものがそうだ。このコマンドは実際の適用前にパッチログを調べてすでにこのツリーに今回のチェンジセットが適用されていないかどうかを調べ、重複した適用を避けようとする。

引数にバージョン名を与えた場合は、そのバージョンに含まれるすべてのリビジョン名に対応するチェンジセットを適用する。適用はリビジョン番号が小さいものから順におこなわれ、やはりパッチログをチェックしてすでに適用されているものはスキップする。適用に衝突が起こると、処理はそこでストップする。すでに適用してしまった部分はそのまま生かす。(XXX: ほんと?)

引数は複数指定することができ、この場合引数の順序で上記を実行する。引数を指定しなかった場合には、デフォルトバージョンが指定されたのと同じ動作をする。

適用元のチェンジセットが存在するバージョンは、プロジェクトツリーとの間で共通の祖先を持つ必要はない。これは update と大きく違うところである。また適用前にプロジェクトツリーにプリスティン以降に加えられた修正分を退避しないのも update と異る。

他人のバージョンの一つまたは少数のチェンジセットを replay コマンドを使って選択的に適用することを、「チェリーピックする」と言う。おそらく、イチゴ狩りならぬ、さくらんぼ狩り、みたいなイメージの言葉だと思うのだが、実際に聞いたことはない。誰かのシャレた言葉の説明を本人に求めるほどヤボなことはない。

tla update

これは replay よりも概念的には上位にあるコマンドだ。引数の与え方は、完全に省略する場合、バージョンを指定する場合、リビジョンを指定する場合の三通りがあるのは replay と一緒だが、その意味合いは大きく異る。

まず、いずれの場合でも、update は実行に当たって、プロジェクトツリーに対して tla undo を内部的に実行する。つまり直近のリビジョンにプリスティンの内容を使って戻る。それから引数の内容に応じたチェンジセットの適用を実行し、最後に退避しておいたチェンジセットを tla redo でもう一度適用するのだ。

引数をなにも与えないと、デフォルトバージョンが指定されたものと仮定する。バージョンを与えた時の動作は、まずプロジェクトツリーのデフォルトバージョンと、指定したバージョンとの共通の祖先をチェックする。共通の祖先とは、この二つのバージョンが分岐した最後のリビジョンを言う。そのようなリビジョンが存在しなければ、つまりふたつのバージョンの起源が異っているなら、update はエラー終了する。このとき、共通の祖先より後に引数で指定したバージョンに追加されたチェンジセットを古いものから順にプロジェクトツリーに追加していく。引数に指定したバージョンやプロジェクトツリーのデフォルトバージョンが継続によって作成されたものである場合には、その祖先のバージョンまでさかのぼって共通の祖先を調べることに注意すること。どこかで衝突が起こった場合にはそれまでのすべての適用を含めて処理を完全に取り消す。プロジェクトツリー内のパッチログを確認して、重複マージを避けるのは replay コマンドと同様である。

引数にリビジョン名を指定した場合の動作もバージョンを指定した時と同様だが、そのリビジョンよりもリビジョン番号の大きなチェンジセットは適用しない。

もし君が誰かの別のバージョン、例えば A/C--B--V--R からの分岐を A1/C1--B1--V1 という形で作ったあと、このバージョンについて行くには、自分の変更を A1/C1--B1--V1 に追加していき、ときどき tla update を A/C--B--V という引数で実行すれば、君が分岐した後彼が加えた修正点のすべてを A1/C1--B1--V1 に取り込むことができる。

tla star-merge

このコマンドはマージ系コマンドの最上に位置するもので、大抵のマージはこのコマンドを使えばうまくいく。初心者はマージにはいつもこのコマンドを使うと良い。正確なアルゴリズムは以下のように非常に複雑だが、利用は簡単だ。原始的なコマンドを組み合わせることで高度な機能を実現するという GNU arch のコンセプトから行くと、tla をラップする形で外部コマンドとして実装しても良いほどマクロなコマンドだ。

このコマンドは、引数として指定した FROM リビジョンとバージョンREFERENCE との間の「一番近い共通祖先」にあたるリビジョンを計算し、それと FROM との差分をプロジェクトツリーに適用する。 REFERENCE を指定しなければプロジェクトツリーのデフォルトバージョンを指定したものとみなすが、通常はこれで十分だ^[14]。これだけの話だが、問題は何をもって「一番近い共通祖先」=M.R.C.A とみなすかである。これがすこし複雑になる。

まずはこの計算に必要な登場人物を整理する。

表 5.1. 登場人物

アイテム	要素種別	意味
`FROM`	リビジョン	マージしたいリビジョン。バージョンが指定された場合は、その中にある最新のリビジョンが指定されたとみなす。
`FROM-V`	バージョン	リビジョンFROM が属するバージョンのこと。
`TREE`	プロジェクトツリー	適用先のプロジェクトツリー。
`REFERENCE`	バージョン	マージの観点を示す。指定しなければ TREE のデフォルトバージョンが指定されたとみなす。
`MAYBE_ANCESTOR_1`	リビジョン	M.R.C.A.の第一候補。これはもし存在すれば FROM-Vに属する。
`MAYBE_ANCESTOR_2`	リビジョン	M.R.C.A.の第二候補。これはもし存在すれば REFERENCE に属する。
`LAST_MERGE_INTO_FROM`	リビジョン	計算途中で必要になる FROM-Vに属するリビジョン。

MAYBE_ANCESTOR_1 は FROM リビジョン中にある、FROM-Vに属するパッチログのうち、TREE に取り込まれた一番最後のものとして定義される。たとえば、FROM が A/C--B--V--patch-10 だとすれば、このリビジョンは A/C--B--V--base-0 ... A/C--B--V--patch-10 のすべてのパッチログだけは最低限必ず含むが^[15]、このうち TREE に存在するものが A/C--B--V--patch-3 と A/C--B--V--patch-7 であれば、この後者が MAYBE_ANCESTOR_1 になる。どれが選択されるにせよ、FROM-Vに属するリビジョンで FROM リビジョンそのものか、それ以前のリビジョンになることに注意。条件にあてはまるパッチログが一つも存在しなければ、 MAYBE_ANCESTOR_1は存在しない。

MAYBE_ANCESTOR_2 は REFERENCE 中のリビジョンのうち、FROM リビジョンに取り込まれたもので一番後のものとして定義される。条件にあてはまるパッチログがリビジョン FROM に一つも存在しなければ、 MAYBE_ANCESTOR_2 は存在しない。ところでリビジョン FROM は FROM-V に属するパッチログの他にもチェリーピックなどによって他のバージョンのパッチログも含むのが普通であることに注意してほしい。この事実により REFERENCE と FROM が属するバージョンが異っている場合でも FROM リビジョンが FEFERENCE バージョンに属するリビジョンのパッチログを含むことはあるのだ。

LAST_MERGE_INTO_FROM は MAYBE_ANCESTOR_2 が存在する場合に限って定義される。これは MAYBE_ANCESTOR_2 を最後にマージした FROM-Vのあるリビジョンを示す。FROM リビジョンが MAYBE_ANCESTOR_2 をパッチログとして持つので、LAST_MERGE_INTO_FROM は FROM そのものか FROM以前の FROM-Vに属するリビジョンであることに注意すること。

以上を前提として、M.R.C.A. は以下のようにして求める。まず MAYBE_ANCESTOR_1 と MAYBE_ANCESTOR_2 が共に非存在の場合には M.R.C.A.は定義されず、star-merge は何もせず終了する。どちらか一方が存在する場合には存在するほうのリビジョンとして定義される。両方存在する場合には、まずMAYBE_ANCESTOR_1 とLAST_MERGE_INTO_FROM の順序関係が比較される。両方共 FROM-V に属するリビジョンなのでこの比較は常に意味を持つ。MAYBE_ANCESTOR_1 の方が大きければ、 M.R.C.A. は MAYBE_ANCESTOR_1 と定義される。そうでなければ M.R.C.A. は MAYBE_ANCESTOR_2 とされる。あとは冒頭の差分を求め、結果を TREE に適用する。これが star-merge の動作のすべてである。

確定したアーカイブ中のリビジョンのもつ性質について

アーカイブ中にあるリビジョン、たとえばA/C--B--V--patch-5 を考えてみよう。このリビジョンは過去のある時点でこの世のどこかに存在していたマシン上の、どこかに存在していたファイルシステム上の、どこかにつくったプロジェクトツリーで、ただ一度、ある特定の誰かによって、コミットされ、そしてそれが永遠出来事として記録されたものだ。それ以後、修正は加わっていない。GNU arch はプロジェクトツリーがコミットできる条件として、新しく作成するリビジョンに至るまでのパッチログがすべて揃っていること、という制約を設けているのだった。つまり、プロジェクトツリーは、 A/C--B--V--base-0 ... A/C--B--V--patch-4 までのパッチログを (sync-tree などで強制的に持たせるにせよ、普通のコミットを続けて自然にそうなったにせよ)とにかく持っていなくてはならない。そしてその条件を満たした状態でコミットされた A/C--B--V--patch-5 は、いま言ったすべてのパッチログをとにかく保持していることが保証されるのだ。

パッチログの限界

あるプロジェクトツリーを考える。プロジェクトツリーはいままで自分自身に適用されてきたチェンジセットのログであるパッチログを記録している。これらのパッチログの由来について、すこし詳しく考えてみよう。

パッチログは大きくいって二つのことに由来する。ひとつはこのプロジェクトツリーをどこかのバージョンに — 通常はデフォルトバージョンに対してということになるが — コミットしたような場合である。この場合、そのコミットが作り出した新しいリビジョン名に対応したパッチログがプロジェクトツリーに追加される。一方アーカイブの対応バージョンには、一つ前のリビジョンと今回作り出されたリビジョンとの間の差分であるチェンジセットが新しいリビジョン名で作られるが、この中にもいま問題にしているパッチログが追加される。tla get でこの最新リビジョンを get すると、いま作り出されたばかりのパッチログも一緒にプロジェクトツリーに含まれることになる。

パッチログのもう一つの由来は、今回プロジェクトツリーがコミットしようとしているバージョン以外のバージョンからのチェンジセットをこのプロジェクトバージョン中にマージすることに由来している。たとえば今、A/C--B--V--R にいて、これとは別のバージョン中のリビジョンである A1/C1--B1--V1--R1 をマージしたとする。これは直接 replay コマンドで選択的に取り込んだのかも知れないし、それを含むようなもっと総括的なマージの一貫として取り込まれたのかも知れない。いずれにせよプロジェクトツリーには A1/C1--B1--V1--R1 のパッチログが追加される。そしてこのパッチログは、A/C--B--V--(R+1) のコミットで作られるチェンジセットに記録され、チェンジセットはアーカイブバージョンに追加されるので、アーカイブ領域にも記録されることになる。

ここからは議論を簡単にするため、コミットするバージョンに関係したA/C--B--V--R のようなリビジョン名を P と表すことにし、コミットバージョン以外のバージョンからのチェリーピックを p, q, r, ... と表すことにする。P に含まれているのは、プロジェクトツリーに対するマージコマンドの適用による、p, q, r, ... のパッチログと、自分自身のパッチログだ。一方チェンジセットとしての P の実際の内容は、p, q, r,.. の実際の内容と、P 自身の修正内容になる。マージコマンドだけを実行したのであればこれは空だが、エディタなどで直接プロジェクトツリーのファイルを修正した場合には空ではない。だから P = P + p + q + r ... となる(XXX: ひどい説明だ!)。

ものごとには順序に関係したことと関係しないことがあることの例

ここでの問題は、P に適用された P, p, q, r,... の順序が不明だということ、また P はアトミックではないということだ。たとえば foo.txt の先頭の方にある行を追加し、p, q, r を適用し、その後この三つのチェンジセットで追加された行の一部を削除したような場合を考えると、P という内容がはっきりしなくなってしまう。

問題は他にもある。たとえば p を適用した後、その適用を完全に取り消すような修正をプロジェクトツリーに手で加えてからコミットすれば、パッチログには p が適用されたという情報が残るにもかかわらず、実質的に p は適用されていない。

まだある。p, q, r の適用順序をパッチログは示していない。p, q, r の順序で適用されたのかも知れないし、q, r, p だったのかも知れない。チェンジセットの代数は一般的にはアーベル的ではないので、両者の結果は異なったものになることもあるのだ。

結論として、パッチログはパッチ適用の履歴についての完全な記述ではないということになる。これはせいぜいあるチェンジセットがすでに適用されているかどうかの目安にすぎない。だから場合によってはパッチログを操作して、まだ適用されていないチェンジセットがあたかも適用されていたり、実際にはすでに適用されたかチェンジセットがあたかもまだ適用されていないかのようにプロジェクトツリーを「だます」必要がある。こんな事態は頻繁におこるわけではないが、時には必要になる。GNU arch はもちろんこんな場合にそなえていくつかのコマンドを用意している。 tla add-log-version, tla remove-log-version, がそれである。

パッチログエントリを追加・削除するコマンドは存在しないのか? またこれは現実の場面では不要なのか?

マージの失敗が意味すること

マージの失敗はプロジェクトツリーにのみ関係しているので大きな問題にはならないことの説明。元に戻すための操作についての説明。

^[14] プロジェクトツリーはどれか一つのバージョンに結び付いているわけではないことに注意しよう。詳しくは XXX 参照。

^[15]なぜこう言えるのだろう? プロジェクトツリー中でコミットが成功する条件としてGNU arch が課している制約を思い出してくれればわかると思う。考えてみてほしい。

第6章最適化

リビジョンキャッシュ
アーカイブ・ミラー
リビジョンライブラリ
リビジョンの検索順序

この章では、GNU arch が必要なリビジョンやチェンジセットを高速に取得する方法について議論する。この章での議論はパフォーマンスに関してのことだけで、ここを読んでも本質的に何か新しい機能がつけ加わるわけではないし、基本的な設定をすませてしまえば、普段はあまり意識しないでこの恩恵にあずかることができる。普通免許さえあれば、誰でもベンツにも乗れるのと一緒だ。しかしある特定のバージョンの中に非常にたくさんのリビジョンを蓄積していく場合や、ネットワーク上の別のマシンにあるバージョンとのやりとりが発生するような利用が主な場合、ここでの技法は場面によっては速度を劇的に改善することがある。GNU arch を実践的に利用しようと考えているなら、いつかはこの章のどれかの技法が君を助けることになるだろう。誰だって料金がそんなに違わないならファーストクラスで行くだろう。

リビジョンキャッシュ

ひとつのバージョンに対して新しいリビジョンをコミットするたび、バージョンの中にはそのリビジョンを直前のリビジョンから作り上げるのに必要なチェンジセットが蓄積されていく。tla get などのコマンドで最新リビジョンを取得する場合、リビジョンが大きい程長い時間がかかるが、これはベースリビジョンに対して適用しなくてはならないチェンジセットの個数がリビジョンの数に比例して大きくなっていくからだ。tla get が表示するメッセージを見てもこれは明らかだろう。

$ tla get C--B--1.0
* from import revision: octopus@bluegate.org--2004/C--B--1.0--base-0
* patching for revision: octopus@bluegate.org--2004/C--B--1.0--patch-1
…
* patching for revision: octopus@bluegate.org--2004/C--B--1.0--patch-238
* patching for revision: octopus@bluegate.org--2004/C--B--1.0--patch-239
* making pristine copy
* tree version set octopus@bluegate.org--2004/C--B--1.0
$

patching for revision: で始まる行が直前のリビジョンに対して次のチェンジセットを内部的に適用していることを示す行だが、これはもちろんリビジョンが上がっていくにつれて増える。リビジョンを一から計算しないで適当なリビジョン間隔でキャッシュしておけばリビジョンの取得は早くなる。これをリビジョンキャッシュと言う。たとえば patch-50 patch-100, patch-150, patch-200 のリビジョンのキャッシュを保持していれば、たとえば patch-239 を取得する場合には patch-200 からの計算だけを考えれば良いことになるからだ。リビジョンキャッシュを作るには tla cacherev コマンドを使う。このコマンドはあるリビジョンの内容を tla get と同じアルゴリズムで計算し、アーカイブ中の、本来チェンジセットしか保持していないリビジョンの、リビジョンの内容全体を保存する。

あるバージョンが、別のバージョンからの継続として作られた場合ベースリビジョンをキャッシュするのは広く行なわれる最適化だ。こうしないと継続先のリビジョンを tla get しようとすると、継続元のバージョンにまで遡ってリビジョンを構築することになってしまう。継続元がネットワークをまたいだ別マシン上にある場合にはこの違いはより顕著になるのは明らかだ。

あるリビジョンに対するリビジョンキャッシュは、バージョン中のチェンジセットのサイズがごく小さいものだと仮定すれば、大体ベースリビジョンと同じ程度の領域を食うので、たくさんのリビジョンについてキャッシュするのはあまり得策ではない。こんな場合にはリビジョンライブラリを構築する方が良い結果が得られるだろう。

アーカイブ・ミラー

アーカイブ・ミラーは、あるアーカイブを別のアーカイブにそっくりそのままコピーしたものだ。GNU arch のアーカイブはネットワーク透過性を持っていることを思い出してほしい。つまり同じマシンの上にある二つのアーカイブ間でできることは、異るマシン間にあるアーカイブに対しても必ずできる、という GNU arch の設計上の大原則だ。この性質を利用すれば、アーカイブ・ミラーのソースとディスティネーションを別マシンに設定して、たとえばソースをリモートアーカイブ、ディスティネーションをローカルアーカイブとすることも、その逆も、また両方を同じマシン上の異るアーカイブとすることもできる。最初の場合はリモートアーカイブからローカルアーカイブへのコピーとなる。二番目はその逆になる。最後のケースは何の役にたつか不思議に思うかも知れないが、たとえば一方のアーカイブは外部に公開していない、プライベートなもので、もう一方は公開しているアーカイブだとする。そして普通はプライベートアーカイブ上のバージョンで作業をしていて、問題がないと確信した時点でその内容を公開アーカイブにも反映したいような場合、ローカルアーカイブ間のミラーも意味をもつ。

ミラー先のアーカイブには自分がミラーであることを示す情報があって、tla import や tla commit を実行しようとするとエラーになる。tla archive-mirror コマンドを利用する以外に、ミラーアーカイブに書き込みを行なうことはできない。

まず、いままで直接アクセスしていたリモートアーカイブのミラーをローカルに作り、このミラーにリモートアーカイブの内容を実際にミラーしたあと、このミラーにアクセスする例を示す。実際のミラーには非常に時間がかかることもあるが、いったん転送が済んでしまえば、アクセスは飛躍的早くなるのが普通だ。Tom Lord のマスターアーカイブを使って説明しよう。まず、Tom のアーカイブに直接アクセスするような形にアーカイブを登録する。それから tla abrowse でこのアーカイブを閲覧してみてほしい。かなり時間がかかるはずだ:

$ tla register-archive lord@emf.net--2004 \
      http://regexps.srparish.net/{archives}/lord@emf.net--2004
$ tla abrowse -A lord@emf.net--2004
…
$

次にローカルマシンにミラーを作るわけだが、tla make-archive コマンドを実行する前にアーカイブ名について少し考える必要がある。ミラーアーカイブに何という名前をつけるか、だ。lord@emf.net--2004 という名前はすでに Tom のマスターアーカイブとしてたったいま利用してしまっているので、同じ名前をミラーに対して利用することはできない。普通はアーカイブ名の後ろに "-MIRROR" という文字列をつけた lord@emf.net--2004-MIRRORという名前を使うが、必ずそうしなくてはならないという決まりはない。アーカイブ名の形式に従ったものならどんな名前をつけても良い。で、考えてみてほしいのだが、今後このミラーには頻繁にアクセスすることになり、あたかもこちらが Tom のマスターアーカイブだとみなしたほうが都合が良いだろう。こっちを lord@emf.net--2004 という名前でアクセスしたい。すると今度は Tom のオリジナルの方を別の名前で呼ぶ必要が出てくる。これももちろん可能だ。あるアーカイブ位置をどんな名前で呼んでも GNU arch が動かなくなることはない。結局、Tom のオリジナルを lord@emf.net--2004-SOURCE と呼び、ローカルミラーをlord@emf.net--2004 と呼ぶことにする。

$ tla register-archive -d lord@emf.net--2004
$ tla register-archive lord@emf.net--2004-SOURCE \
      http://regexps.srparish.net/{archives}/lord@emf.net--2004
$ tla make-archive --mirror lord@emf.net--2004-SOURCE lord@emf.net--2004 
      /home/foo/{archives}/lord@emf.net--2004
$

tla make-archive の前に、tla register-archive で lord@emf.net--2004 の削除と、同じアーカイブ位置を lord@emf.net--2004-SOURCEという名前であらためて登録していることに注意してほしい。それからミラーアーカイブを tla make-archive で作成している。tla make-archive コマンドは内部的に tla register-archive の処理も一緒に行なうので、lord@emf.net--2004 はローカルミラーとして登録される。次に実際にアーカイブの転送を行なう:

$ tla archive-mirror lord@emf.net--2004-SOURCE lord@emf.net--2004
…
$

これにはアーカイブの大きさにおうじて、通常は長い時間がかかる。何か別のことをやっていた方がよいだろう。ミラーが完了したらもう一度 tla abrowse を走らせてみよう:

$ tla abrowse -A lord@emf.net--2004
…
$

おそらく劇的に早くなっているはずだ。いったんミラーをつくれば、今後の tla archive-mirror は差分だけの転送になるのでそれほど時間はかからなくなる。この処理は cron でやらせるのがおすすめだ。私はもちろん Tom のすべてのアーカイブを自分のマシンにミラーしているが、一日一回ミラーするようにしている。これで Tom のマシンに何か恐ろしいことが起こっても、私のミラーを使って最悪 24 時間前の状態にまでは戻せる。分散システムならではのメリットだ。GNU arch コミュニティーにはこのようなバックアップ的な意味あいでのミラーを、もっと大規模に構築しているメンバーもいる。詳しくはXXXを見てほしい。

ミラーの話しに限ったことではないが、あるアーカイブから別のアーカイブに対する継続がある場合、最低限、継続のリビジョンでは tla cacherev コマンドでキャッシュしたほうが良い。そうしないと、せっかくあるアーカイブをミラーしても、そこからリビジョンを get しようとすると、継続をさかのぼって結局は別のアーカイブも参照しにいくことになり、そのアーカイブが登録されていないことでエラーになったり、登録されていてもスピードの恩恵にあずかることができないことになってしまう。これはミラーされる側のエチケットかも知れない。もちろん誰も彼にそんなことを強要することはできないが。人はみな、自由なのだ。

もうひとつの例は、公開用アーカイブと、ブライベートアーカイブとのミラーだ。XXX

ミラーの特徴は、ユーザが自発的にミラーする必要があることだ。 tla archive-mirror コマンドを時々実行しなければミラーの意味はない。これにたいして次節のリビジョンライブラリは、ユーザが通常の操作を行なう過程で自然とキャッシュされていような仕組みを持っている。ここが違うところだ。用途や場面に応じて、どの方法が最適か、自分で考えてみてほしい。

リビジョンライブラリ

最後の方法がリビジョンライブラリだ。まず最初に断っておくが、リビジョンライブラリは、通常のコンピュータ言語での開発で利用するライブラリとは何の関係もないので注意してほしい。リビジョンライブラリは大雑把にいって、アーカイブバージョン中のすべてのリビジョンを完全な形ですべて保持してしまおうという考え方だ。ある意味非常に露骨でもっとも単純で、それゆえ強力な方法だとも言える。すべてのリビジョンを展開した形で持つわけだから、莫大なディスク容量が必要に思えるが、リビジョン間で変更のないファイルについては unix のハードリンクの考え方を使い、一つの実体としてのファイルを複数の場所から指し示すことによって空間を節約する仕組みを持っている。もちろんこれは内部的な実装の話なので利用者から見ると、巨大なリビジョン群がそのままそこに存在し、その割にはディスクが消費していないような状況になる。あるリビジョンから次のリビジョンへの修正は通常それほど多くのファイルで起こるわけではないので、空間の最適化はかなり良い結果をもたらすことが多い。

リビジョンライブラリは、自分が必要だと思うリビジョンを明示的に指定して生成することもできるし、ある処理において副次的にリビジョンを計算しなくてはならない時に、暗黙にそのリビジョンをライブラリに常に追加するように設定することもできる。後者に設定しておけばいちいち tla library-add コマンドを発行しなくても、いろいろなアーカイブバージョンをいじっているうちに自然とパフォーマンスが向上していくような結果をもたらすはずだ。欠点としては自分があまり意識しないうちにディスク容量が消費されていくことだろう。

暗黙にリビジョンライブラリの内容を豊富にしていくのと同時にディスク容量もそれほど消費させたくない場合、折衷案をとることもできる。このためにもう一つ設定することのできるパラメータがある。この sparseを設定すると、あるリビジョンをライブラリに追加する際、そのリビジョンを作成するに当たってできた中間のリビジョンについてはライブラリに登録しない。

ライブラリを扱うコマンドはいろいろと存在するが、例によってカテゴリ・ブランチ・バージョンの 3 階層システムからくる複雑さであり、基本的には設定、追加、内容表示、の 3 っつの種類しかない。

リビジョンの検索順序

すでに見てきたように、GNU arch はさまざまなキャッシュを持っていて、ある特定のリビジョンを取得する場合、可能であれば本来のアーカイブの場所から取得するかわりに、より時間的なコストが安い場所から取得しようとする。ではそのような場所が複数あった場合にはどうするのだろうか? リビジョンの検索順序は以下のようになる:

リビジョンライブラリを検索する。あればそれを利用する。
プリスティン・コピーを検索する。あればそれを利用する。
最後にアーカイブを利用する。

リビジョンライブラリは複数の場所に保持することが可能で、この場合にはリビジョンライブラリ自身の検索順序で検索される。プリスティンコピーを利用するのは tla get コマンドのオプションで明示的にパスを指定するような特殊な場合に限られる。最後にアーカイブを利用する場合、アーカイブ中でそのリビジョンがキャッシュされていれば、それを直接展開する。そうでなければ、最後のキャッシュリビジョン、またはインポート時の初期リビジョンを取得した後に、そのツリーに対して順次次のチェンジセットを適用して必要なリビジョンを求める。この最後の場合には大雑把に言ってリビジョンの数に比例した時間がかかることになる。

アーカイブミラーの話が出てこなかったのは、tla get オペレーションにおいてはミラーと通常のアーカイブを区別することはないからだ。ミラーハキャッシュの検索順序の議論よりも 1 レイアー低い場所でキャッシュするしくみだと言うことができる。

第7章新しい概念

インベントリ
チェンジセット
パッチログ
継続

この章では、従来のバージョン管理システムではあまり馴染みのない概念について個別に説明しようと思う。基本的には GNU arch の基本的な利用方法が身についたあとで理解を深めるためにゆっくり読んでもらうことのできる章だが、運悪く初期インポートでつまづいてしまった時には「インベントリ」の節だけはあらかじめ読む羽目になるかも知ない。チェンジセットはパッチの一般化であるので概念的には易しいと思うのだが、何故か非常に難しく高尚な概念のように言われているようだ。パッチログについてはまとまった文献として説明しているものをあまり見かけないのでできるだけ詳しく説明したいと考えている。

インベントリ

初期インポート時に、正体不明のエラーが表示されてどうしてもうまく行かないことがある。これはたいていの場合、インポート対象としたいファイルがうまく認識されていないか、ディレクトリ中に認識できないファイルが残っている場合だ。GNU arch はインポート時にもコミット時にも、プロジェクトツリー全体をスキャンして、自分が認識できないファイルが存在しないかどうかを確認する。どのようなファイルを認識できないものにするかは、設定によってプロジェクトツリーごとにユーザが自由に設定できるのだが、結果として認識できないファイルがディレクトリに残っているとエラーを表示してコミットやインポートを中断する。これは、きちんと把握しているファイルのみがプロジェクトツリーには現れるべきだという GNU arch の思想を反映している。ただしこれには例外があって認識できないファイルがあったとしても、それを認識できるファイルとみなすように設定することもできるのだ。また認識できないケースにも二通りあって、ファイル名の形からくる場合と、インベントリidが正しく振られているかどうかからくる場合もある。また認識できるファイルは、諸事情でさらにいろいろなファイルタイプに分類されているし、インベントリid 自身の概念が通常のバージョン管理システムでは存在しないものであることなどが理由で、ファイルタイプの認識ロジックは非常に複雑なものになっている。

ここでは GNU arch のファイル判別ロジックの詳細を説明する。もし初期インポートにすでに成功していたり、分岐によってプロジェクトを始めたのであれば、すぐにこの章を読む必要はないと思う。しかし、新しいファイルをプロジェクトに追加したとたんにコミットができなくなった、とか、初期インポートがどうしてもうまくいかずエラーになる、という場合には、この章を読んで、GNU arch のファイル判別ロジックについて少し詳しく考える必要があるかも知れない。根底にある理屈がわかってしまえば、たいていのエラーは解消すると思う。一点だけ注意だが、GNU arch の場合、新しいファイルをプロジェクトに追加する場合、CVS など他のバージョン管理システムにあるような明示的なファイル追加コマンドは存在しない。インポートまたはコミット時のファイルスキャンで規則に合致すればそれは追加されたファイルになるし、合致しなければそうはならない。そして運悪くそれが認識不能ファイルに最終的に分類されればインポートやコミット自体が中断されてしまう。それだけの話だ。

ところで、私は語学が苦手だ。たとえば英語。わけのわからない規則が多すぎる。want の過去形は wanted だからということで、go の過去は goed だというと笑われる。一個と二個以上を区別するくせに、二個と三個は区別しない。三人称単数現在に限って動詞の最後に s をつける。で得意になって studys なんてやるとまたバカにされる。ラテン語なんて最悪だ。名詞には6っつも格があって、おまけに性がある。海がどうして女性名詞なのか教えてほしい。人魚が住んでるからだろうか? でも海坊主だってちゃんと住んでる。「バラ」は女なのに、「花」は男だと言う。わけがわからない。結局、こういうのは丸暗記するしかないのだ。

GNU arch にもよく似たところがある。もちろん、作者はご存命だし、もう少しは合理的にできているし、ほりさげていけば、いちいちちゃんとした理由もあるのだろう。でも、悪いことは言わない。最初はあまり深く考えないほうがいい。そういうものなんだと割り切ろう。

ルールその1: 　　GNU arch はファイルを以下の xxx 種類にとりあえず分類するという約束がある。　　これを一次分類と呼ぶ。ルールその2: 　　一次分類は、ファイル名の形だけをもとにして分類される。ルールその3: 　　一次分類でソースと見なされたファイルはインベントリidの存在/非存在　　によってさらにソースかどうかを判断されるこれを二次分類という。　　二次分類でソースでないことがわかったファイルは、とりあえず非認識とされる。ルールその4:

この結果、最終的にファイルが非認識とみなされれば、インポートやコミットは中断される。これを防ぐには、ファイルタイプをソースとなるように =tagging-method を書き換えてから、必要に応じてインベントリidをこのファイルにつける。つける方法は・・・・ファイルの個数が多い場合、これを手でやるのは大変だ。たとえばすでに別のバージョン管理システムで管理していたファイルを GNU arch に移行したいような場合だ。ありがたいことに自動的にインベントリidを振ってくれるツールを作成している人たちもいる。詳しくは・・・を見て欲しい。インベントリid については次の節で詳しく説明しようと思う。GNU arch にしか現れない重要な概念の一つだ。

ここでの議論は退屈で、見通しがわるく、しかも運が悪いと、GNU arch の使い始めから理解しなくてはならない場所になってしまう。それほど unix に詳しくない人なら、多分ここでさようなら、だろう。このシャープな学習曲線を緩くするうまい方法は見つけることは、GNU archにとって急務だと考えている。

インベントリとは、一言で言うと「バージョン管理下にあるそれぞれのファイルの由来を示す識別子の一覧」のことだ。あるファイルが GNU arch 管理下に置かれるには次の二つのどちらかのケースしかない。一つは、新しいバージョンをアーカイブにインポートする時にインポート対象になっている場合。もう一つは、すでに存在しているリビジョンから分岐したバージョンを作った場合だ。最初の場合には GNU arch システムから見た時にはそのファイルは新規に導入されたので、新しい識別子が必要になる。後の場合にはすでにあるファイルと由来を同じくするファイルができたので、識別子は分岐元のファイルと同一のものになる。分岐した後、一般には両方のバージョンで、二つのファイルは独立に変更されていくだろう。その独立した二つのファイルには同じインベントリidが振られているので、ファイルの自己同一性を示すというよりは、ファイルの由来の同一性を示す識別子である、と理解するのが正しいだろう。

インベントリの考え方自体は非常に単純なものだ。インベントリの問題を複雑にしているのは、既存の Unix 系ファイルシステム上でインベントリを実装しようとするのが難しいことと、GNU arch のファイル分類機構と一部干渉する部分があるからだ。GNU arch の初期インポートに失敗する場合、ファイル分類機構がエラーを出している場合と、インベントリの仕組みがエラーを出している場合がありこの判別が難しいのだ。本来、ファイル分類機構はインベントリとは何の関係もない話だが、あえてこの節で一緒にとりあげることで、初期インポート時のトラブルへの対処方法を示したいと思う。初期インポートという、一番最初の操作でつまづく可能性があるのは GNU arch の普及をさまたげる大きな原因の一つになりかねないのは残念なことだ。

チェンジセット

第1章の議論を思い出してほしい。私はバージョン管理手法の最も原始的な形態としてのバックアップを取り上げ、それからテキストファイルに対する差分管理について述べた。バックアップをとるかわりにファイルの差分をつぎつぎと保存していけば十分であるという議論だった。チェンジセットはこのひとつのファイルに対する差分を、ディレクトリツリー全体に対する差分へと拡張したものだ。だからチェンジセットのことをパッチと呼ぶ人もいる。ちょっと考えると、これはわざわざ鳴り物入りで言うほどのことではないような気もする。ファイルが N 個あるのなら、ファイルごとに管理した N 個の独立した差分を考えれば十分ではないか、と。 GNUdiff を使ったことのある人なら、-r オプションつきで実行すれば、N 個の独立した差分を一つのファイルとして表現することすらできると思うかも知れない。しかしここに罠がある。

まず、パッチファイルには、ファイルの生成、消滅を厳密に扱う方法がない。GNUdiff を使って同等のことを表現しようとすると、ファイルの生成は、ゼロバイトのファイルと、生成後のファイルの差分を作る形で表すしかないし、消滅の場合には、消滅前のファイルの内容と、ゼロバイトのファイルのファイルの差分を計算する形で表すより他ない。-N というオプションはこれを実行してくれる。しかしこれでは、その時点でファイルが生成されたことと、実はゼロバイトで存在していたことを区別することができない。消滅の場合も話しが逆になるだけで同様である。

次に、パッチファイルはファイルのパーミッションの変化について記録する方法がない。あるシェルスクリプト foo.sh に、うっかり実行権限をつけるのを忘れたとする。あるリビジョンで内容には一切変更を加えず chmod +x foo.sh のようなことをやって実行ビットを立てたとする。パッチファイルにはこのような変化を記録する方法がないのだ。他にもまだある。ファイル名称の変更だ。あるファイル、./foo.h を、./include/foo.h に移動したとする。パッチファイルではこれを表現できない。あるファイル ./foo.h がある日突然ゼロバイトになり、./include/foo.h というゼロバイトのファイルが、突然 ./foo.h の内容になったようにしか表現できない。これは都合がわるい。すでに述べたように、我々はファイル名の変更を追うための強力なしくみ、インベントリを手にしているのだ。これを生かさない手はない。しかしパッチファイルにはそれができない。

そんなこんなで、パッチの拡張であるチェンジセットのデータ構造が厳密に定義された。チェンジセットはパッチが一つのファイルであるのに対して決まった名前のファイルと構造をもつディレクトリとして定義される。これはチェンジセットを扱う GNU arch の内部ロジック、 dopatch()/mkpatch()が、このデータ構造中でランダムアクセス処理が発生するためだ。パッチファイルはただのファイルなのでもちろんバイト列が並んだシリアル形式のデータ構造だ。だからランダムアクセスには向かない。しかし、これは単なる実装上の問題でしかない。チェンジセットがディレクトリであることには本質的な意味は何も無い。

シリアル化チェンジセット

これは筆者の個人的な意見だが、現在のディレクトリ形式のチェンジセットのほかに、単一ファイルによるこれと等価な表現、いわばシリアル化チェンジセットのデータ構造を定義し、ディレクトリ形式との間の変換/逆変換プログラムを作るのは GNU arch の興味深い拡張だと考えている。理由は、単一ファイルであれば通常のエディタで内容を確認することもできるし、メールに貼り付けて他人と交換することもできる。チェンジセットがパッチの拡張として定義されたこともより直感的に把握できるのではないかと思う。細かい問題点はある。たとえばバイナリファイルはどう表現するか、とか、ファイル名の変更はどう表現するか、などだ。しかしバイナリファイルは base64 などでエンコードすることもできるし、パッチファイルの見だし行などをうまく拡張すれば、パーミッションの変更などは表現できなくはないと思う。GNUpatch のパッチフォーマットを完全上位互換な形で拡張できれば、さらにクールだ。

チェンジセットの厳密なデータ構造は補遺に示した。興味のある方はご覧いただきたい。

パッチログ

プロジェクトツリーが他のバージョンからのチェンジセットを適用すると、「そのチェンジセットはもう取り込んだ」という意味のログが、 {arch}管理配下に記録される。これをパッチログと言う。パッチログは通常のファイルで、中には RFC822形式に準じたいくつかの情報があり、人間への手がかりとなるが、GNU arch がシステム的に考慮するのは「パッチログが存在するか、否か」だけだ。つまり管理領域に A/C--B--V--R が存在すればこのチェンジセットはすでに受け取っているのであり、存在しなければ受け取ってはいない。それだけだ。プロジェクトツリーをコミットすると、パッチログはアーカイブバージョン中のチェンジセットにも記録され、永続的なものとなる。

GNU arch のマージコマンドは常に、マージするチェンジセットがすでにパッチログとして記録されているチェンジセットと一致しないかどうかを確認し、パッチログが存在しない場合に限りそれを適用する。これによって同じチェンジセットを二度以上適用してしまう、いわゆる重複マージの問題を回避することができる。

パッチログはチェンジセットにも含まれるが、その当のチェンジセットに対応したパッチログだけではなく、そのチェンジセットが間接的に受け取ったパッチログも含んでいる。たとえば C1--B1--V1--R1 というリビジョンで、Cx--Bx--Vx--Rx と、Cy--By--Vy--Ry という二つのパッチログを受け取り、C1--B1--V1--R1+1 というリビジョンをコミットしたとしよう。するとチェンジセット C1--B1--V1--R1+1 には、この三つのチェンジセットに対応したパッチログがすべて含まれる。このチェンジセット C1--B1--V1--R1+1 を受け取った Cz--Bz--Vz--Rz+1 には、自分自身もふくめて四つのパッチログをプロジェクトツリーに追加することになる。このようなパッチログの授受の連鎖によって、一度適用したチェンジセットを、もう一度同じバージョンから受け取ることを回避できるだけではなく、めぐりめぐって別のバージョンから受け取ることも回避できる。

コミットとパッチログとの間の関係パッチログの不完全性の説明パッチログを調整するコマンドの説明

継続

どんなバージョン管理システムにも共通の、当たり前の原則がある。それは過去に現れたデータは決して削除されない、というものだ。データを削除する、とは、削除された形の新しいリビジョンを「追加」する、ということでしかない。過去は消せない。髪を黒く戻して、ピアスを外してタバコを辞めても、タイムマシンに乗ればバレてしまう。

アーカイブ中で、リビジョンがコミットされるにつれ、データは増えていく。過去のデータは古くなるにつれ、監査や考古学的な興味を除けば、その価値は薄れていく。もし、新たらしい部分のリビジョンを取得するのに過去のリビジョンに強く依存しているとすると、これは問題がある。たとえばディスク障害が起こって、非常に古いリビジョンのほんの一部がわずかに壊れてしまったとしよう。これが理由で、アーカイブ中のすべてのリビジョンのデータが全滅したとすれば、それはまずい。腐ったリンゴを簡単に捨てちゃいけない。腐った部分だけ捨てて、腐ってないところをおいしくいただきたい。

GNU arch はちゃんとこのへんの事情を心得ていて、あるアーカイブバージョンのリビジョンが増えたら、別のバージョンに乗り移ることができる。これを継続という。私は何か新しいことを書いているようだが、実はこれは tla tag コマンドで分岐を作る行為そのものだ。だから分岐には実は二通りの、すこし異なるニュアンスがあることがわかる。一つは幹の開発をさまたげずに自分独自の修正を加えるための分岐。もう一つはリビジョンが大きくなりすぎたのでアーカイブバージョンをここらで新しくしたいと思って始める分岐。つまり継続。継続を作ったら、そのベースリビジョンはキャッシュしておくことを強く勧める。これで過去の分岐元のバージョンが腐っても、継続後のバージョンは被害を受けることはない。

継続バージョンを作ると、継続後のバージョンは自分の継続した祖先のバージョンを記憶している。tla ancestry コマンドはこの情報を元にしてあるバージョンの祖先をずっとたどってくれる。しかし逆はだめだ。あるバージョンの親は、自分にどのような子がいるか知らない。子供を列挙する方法はないのだ。無理にやろうとすれば、たとえばあるアーカイブ中をしらみつぶしに検索することになるだろう。これは現実的ではない。それに特定のアーカイブ中でしかこれはできない。しかし地球上には無数のアーカイブがあるのだ。この非対称性は、親に黙って分岐を作ることができる、という GNU arch の性質に対応している。もし親が子の情報をもつとすれば、黙って分岐を作ることができなくなるだろうが、それじゃブルーな世界に逆戻りだ。

第8章サインつきアーカイブ

チェックサムの計算
サインつきアーカイブ
サインつきアーカイブのチェック
デフォルトルールの設定

うる覚えなのだが、GNU の初期のサーバにはパスワードが振っていなかったそうだ。パスワードのないサーバが単にインターネットにぶら下がっていた。信じられないが本当らしい。過去にさかのぼればさかのぼるほど人間は素朴で素直で満ち足りていたというルソー的史観には常に胡散臭いものを感じてしまうが、ことコンピュータの歴史に関して言えば、当たっている部分もあるのかも知れない。インターネット上の雰囲気もずいぶん変わってしまった。いまではセキュリティーを考えることなしにどんなソフトウェアについても語ることはできなくなってしまった。GNU arch も tla-1.2 からセキュリティーを考慮するような仕組みが追加された。この章ではアーカイブに対して署名をつける方法について説明する。署名は任意のアルゴリズムが利用できるが、現実には pgp を利用することが多い。ここではこの具体例についても説明する。

チェックサムの計算

アーカイブには署名することができて、この機能を有効にするかどうかはアーカイブごとに選択することができるが、サインするしないにかかわらず、アーカイブに新しいデータが追加される時にはかならすその追加データに対するチェックサムが計算され、独立したファイルとして同時に保存される。アーカイブに対する追加は以下のどれかのコマンドでしか発生しない。つまり、import, commit, tag, cacherev である。 ^[16] 追加データが正しい内容であるかどうかは追加データのチェックサムをもう一度計算し、チェックサムファイルの値と一致するかどうかを確認することで検証することができる。ディスクの低レベルエラーや、作為的でないデータ検証はこれでおこなうことができる。

サインつきアーカイブ

チェックサムの計算だけでは、作為的な悪意のある改懺からデータを守ることはできない。チェックサムを計算する元データを変更して、それに対するチェックサムを計算し、元のファイルとそれぞれ置き換えればチェックサムの妥当性検証をすり抜けることができる。これを防ぐためにはアーカイブをサインつきとして設定する必要がある。サインつきアーカイブのアイディアは非常に単純である。前節で説明したチェックサムファイルに対してなんらかの暗号方式で署名するだけである。これで追加データを別の悪いあるもので置き換えたあとチェックサムを計算することはできても、そのチェックサムに正しい署名をすることは本人にしかできないので結果的にデータの改懺は不可能になる。

サインつきアーカイブを作るには、tla make-archive で --sign オプションをつけて作成するだけでよい。これはアーカイブをとにかくサインつきとすることを指示するだけであって、具体的にどのような暗号方式を利用するかを決めるものではない。具体的なサインの仕方は、

~/.arch-params/signing/アーカイブ名

というファイルに実際のサインの仕方を示す単一のシェルコマンドを指定する。典型的には、たとえば octopus@bluegate.org--2004 をサインつきアーカイブとして作成したあと

~/.arch-params/signing/octopus@bluegate.org--2004

という通常のファイルを作り、その中に

gpg --clearsign

のように書く。gpg は GnuPG と呼ばれる pgp の実装である。gpg そのものの説明や設定方法はこのドキュメントの範囲を越えている。

http://www.gnupg.org/

のページなどを参考にしてほしい。主要な unix 系 os であればパッケージに含まれていることが多いのでインストールは容易だと考えられる。

指定するプログラムは標準入力からチェックサムファイルの内容を受け取り、標準出力に対してサインした結果を返すような任意のプログラムを設定することができる。たとえば上の例では、gpg プログラムはパスフレーズと呼ばれるパスワードを起動のつど対話的に聞いてくる。つまり import, commit, tag, cacherev のようなコマンドを実行するたびにパスワードを入力しなくてはならない。これは頻繁にコミットするような環境では不便なので、パスワードをキャッシュするようなプログラムもある。たとえば agpg と呼ばれるようなプログラムは一度だけパスフレーズを入力するとそれ以降はメモリ中にその内容をキャッシュしておいてくれるものだ。このようなプログラムを使う場合には、

~/.arch-params/signing/octopus@bluegate.org--2004

という通常のファイルの内容は

gpg --clearsign

のかわりに

agpg --clearsign

のような設定になる。こちらについても詳しい説明は agpg のサイトを参照してほしい。

サインつきアーカイブのチェック

前節はサインつきアーカイブの作成方法と、それに対する具体的なサイン方式の設定についての方法だったが、逆にサインつきアーカイブから取得したデータの妥当性の検証方法の設定の仕方について説明する。こちらのほうは

~/.arch-params/signing/octopus@bluegate.org--2004.check

のような通常ファイル、つまりチェック方法を設定したいアーカイブ名の後に .check の拡張子をつけたファイルに、チェック方法を示すシェルコマンドを記述することでおこなう。典型的には

gpg --verify-files -

こちらについても、標準入力からテキストを入力し、その結果をステータスで返すようなプログラムであれば何でもよい。しかし現時点では上記のようなコマンドを設定するのがほとんど唯一の現実的な利用方法であると考えられる。

デフォルトルールの設定

サインつきアーカイブの数が増えてくると、いちいち前節や前々節の方法ですべてのサインつきアーカイブの設定をするのは大変である。特に指定していないアーカイブについてのデフォルトルールが設定できると便利だ。これには、実際のサイン、その検証それぞれのシェルスクリプトを

サインのルールのデフォルト
~/.arch-params/signing/=default

サインのチェックルールのデフォルト
~/.arch-params/signing/=default.check

にそれぞれ設定する。現実的な利用方法としては、もっとも保守的に、つまり安全に運用する場合は、それぞれ:

gpg --clearsign

gpg --verify -

と設定する。またもっともリベラルに、つまりサインもしないしチェックもしない場合には、両方のファイルをゼロバイトのファイルとして作成すると良い。

^[16]ところでアーカイブから例外的にデータを削除するコマンドがひとつだけある。uncacherev である。

第9章フックとレシピ集

フック

レシピ集

私の過去を返して!
プロジェクトツリーにいながらにして分岐したい
オフラインで分岐を作ってそちらにスイッチしたい
いまいるプロジェクトツリーの内容を tar ファイルに固めたい
いまいるプロジェクトツリーの中のソースファイルを grep したい

この章ではフックスクリプトと、よく利用される GNU arch のレシピについて説明する。

フック

ある種の重要なできごとが起こった時に、それに連動する形であらかじめ登録しておいた処理が実行されると都合がよいことがよくある。このような処理をフックと言う。これは別に GNU arch に限った話ではない。ソフトウェアに限った話ですらない。腰にぶら下げる万歩計を考えて見ればいい。足を一歩踏み出すたび、万歩計はカウントされる。これは足を一歩踏み出すという行動に対するフックだと言える。フックには二つの要素がある。ひとつはフックのトリガーとなる出来事、もう一つはフックの内容だ。出来事のことをフックイベントと呼んだりする。

GNU arch でのフックイベントは以下のとおりである:

表 9.1. フックイベント一覧

フックイベント	イベントの意味とタイミング
`make-archive`	新しいアーカイブが作成された直後に発生
`make-category`	新しいカテゴリが作成された直後に発生
`make-branch`	新しいブランチが作成された直後に発生
`make-version`	新しいバージョンが作成された直後に発生
`precommit`	コミット直前に発生
`commit`	コミット直後に発生
`import`	インポート直後に発生
`tag`	分岐作成の直後に発生

実際に呼び出されるフック用のプログラムは、 ~/.arch-params/hook である。どのイベントが起こった時でもこのプログラムが呼び出される。~/.arch-params/hook は実行可能ビットが設定されている必要がある。

~/.arch-params/hook は唯一の引数をとり、これは上記で列挙したフックイベント文字列そのものである。たとえばコミット直後には:

~/.arch-params/hook commit

という形でフックが呼び出される。フックスクリプト中で引数の内容によって分岐するようなシェルスクリプトにすることで各種フックイベント用の処理を切替えることができる。さらに必要に応じてフックは以下の環境変数が設定された状態で呼び出される。

表 9.2. 設定される環境変数一覧

環境変数	説明
`ARCH_ARCHIVE`
`ARCH_CATEGORY`
`ARCH_BRANCH`
`ARCH_VERSION`
`ARCH_REVISION`
`ARCH_LOCATION`
`ARCH_TREE_ROOT`
`ARCH_TAGGED_ARCHIVE`
`ARCH_TAGGED_REVISION`

以下は hook ファイルの例である:

#!/bin/sh

if [ "$1" == "commit" ]; then
   echo
   "${ARCH_ARCHIVE}/${ARCH_CATEGORY}--${ARCH_BRANCH}--${ARCH_VERSION}--${ARCH_REVISION}
   created" \
   | mail octopus@bluegate.org
fi

より複雑な例は以下である:

#!/bin/sh

case "$1" in
    precommit)
        ;;
    commit)
        ;;
    …
esac

レシピ集

すでに述べたように GNU arch には非常に原始的なたくさんのコマンドがある。これは Unix コマンドのようにパイプライン上などで組み合わせて利用することを前提として作られたプリミティブがたくさんあるからだ。これは融通が利く反面、利用しはじめた人にとってはどれとどれをどのように組み合わせれば作業が楽になるかがはっきりしない。実践的なワークフローを作るにはノウハウがいる。ここではそのような「必殺技」の数々をおめにかけよう。

私の過去を返して!

人生をやり直したい。残念ながらそんな深刻な君の悩みに対して私は何もできないが、君のアーカイブバージョンについてならまかせてほしい。いま、A/C--B--V--patch-10 をコミットした直後のプロジェクトツリーにいるとする。A/C--B--V--patch-8 に戻って、それをそのまま A/C--B--V--patch-11 としてコミットしたい。ここでのポイントは tla replay コマンドの --reverse オプションで時間を逆向きに進むというものだが、パッチログも patch-8 の状態に戻ってしまう関係でそのままではコミットできない。そこで最後に sync-tree を、お見舞いする。最初の undo はプリスティンからの変更があったときのことを考えて一応バックアップしてみたということ。

$ tla undo
$ tla replay --reverse patch-10
$ tla replay --reverse patch-9
$ tla sync-tree patch-9
$ tla sync-tree patch-10
$ tla commit -L'hello my new world.'
$

チェンジセット patch-10 は、patch-9 と patch-10 をつなぐものであることに注意。つまりチェンジセットの逆向きの適用は後のリビジョン名を指定すればうまくいく。

プロジェクトツリーにいながらにして分岐したい

今いる A/C--B--V--patch-5 のプロジェクトツリーの分岐を作ってそちらで作業を続けたい。たとえば、ちょっとした実験的な機能を思いついたから、分岐を作ってそっちで実験してみたいが、もともとの開発ラインをその作業で汚したくない。普通ならこうやる:

$ tla -S tag A/C--B--V--patch-5 A1/C1--B1--V1
$ cd [これからサブディレクトリを作るどこかのディレクトリ]
$ tla get A1/C1--B1--V1
$

これだとそれまでいたプロジェクトツリーとは別のディレクトリを用意してそちらに移る必要がある。こんなこと年中やるような処理でもないし、いいじゃないかという気もするのだが、君はそれすら面倒だと言う。このようなものぐさこそ、フリーソフトウェアの輝かしい歴史の原動力になるのだと君は理屈を言う。よろしい。私にまかせたまえ。君はいまプロジェクトツリーにいることが前提になる。

$ tla -S tag A/C--B--V--patch-5 A1/C1--B1--V1
$ tla join-branch A1/C1--B1--V1
$ tla set-tree-version A1/C1--B1--V1
$

実はこれは私が思いついたものではない。Miles Bader のアーカイブなどを参考にしてほしい。tla fork-tree のようなコマンドの実装がある。

オフラインで分岐を作ってそちらにスイッチしたい

あるリモートアーカイブにあるバージョンの内容をちょっと見たくて tla get してみたが、後で本格的な分岐を作ってハックしたくなったとする。ところがネットワーク障害でリモートアーカイブがダウンしていたり、いま自分がいる場所が電車の中でラップトップをいじっているような状況で、そのアーカイブに接続できない。tla tag コマンドはリモートアーカイブにアクセスしにいこうとするので、一つ前の方法ではローカルマシンに分岐を作ることができない。さて困った。こんなときには以下のようにすると、オフラインのまま分岐することができる。 tla rescue-tree とも呼ぶことのできる技だ。分岐先アーカイブバージョンを A/C--B--V とし、元アーカイブバージョンのプロジェクトツリーにいると仮定する。

$ tla undo
$ tla archive-setup A/C--B--V
$ tla set-tree-version A/C--B--V
$ tla add-log-version A/C--B--V
$ tla import
$ tla redo
$ tla commit -L'hehe, now switched. :)'
$

実はこうして作ったアーカイブバージョン A/C--B--V は base-0 リビジョンに継続情報を持たないので厳密に言えば本当の分岐ではない。しかし保持しているパッチログは本物の分岐と等価なので、これ以降の親バージョンからのマージについては update/replay/star-merge いずれも問題なく動作することを確認している。継続情報は実は分岐先のパッチログの数を減らすための最適化に関係した仕組みでしかないのだ。

いまいるプロジェクトツリーの内容を tar ファイルに固めたい

tla inventory はプロジェクトツリー内部のディレクトリのトラバースには欠かせない。君のプロジェクトを tar で固めてみよう。これには次のようにする。固めたファイルは一つ上のディレクトリにできるようなサンプルにしてみた。

$ tla inventory -s | tar -T- -zcvf ../`tla tree-version`.tar.gz
$

いまいるプロジェクトツリーの中のソースファイルを grep したい

tla inventory + xargs のような組み合わせもよく利用する。 unix の find(1) でも同じことができそうに思うが、{arch}サブディレクトリ配下がノイズになってしまう。君のプロジェクト内にあるソースファイル全体に対して grep してみよう。

$ tla inventory -s | xargs -l grep -H 'arch-tag'

tla inventory はソースファイルだけではなく、6っつのグループそれぞれを列挙するオプションがあるので、応用の仕方は明らかだろう。たとえば、「プロジェクトツリー内のバックアップ属性ファイルをすべて消す」などなど。

第10章マルチツリープロジェクト

概要
GNU arch internal
カスタマイズの方法

複数のプロジェクトツリーを一緒にして、何かのプログラムを開発したいということがある。たとえば汎用的なライブラリモジュールをひとつのアーカイブバージョンとして開発してあり、その上位にそのライブラリを利用した別のプロジェクトを作りたいような場合、プロジェクトを二つの構成要素に分離して、組み合わせることができると便利だろう。ライブラリモジュールは別のプロジェクトでも使いまわすことができるからだ。このようなプロジェクトをマルチツリープロジェクトと言う。

幸いなことに、マルチツリープロジェクトには良い例がある。GNU arch 自身が hackerlab というライブラリ上に作られており、hackerlab は tla とは別のアーカイブバージョンとして独立に管理されているからだ。この章では GNU arch のソースコード自身を例としてマルチツリープロジェクトの説明をしていく。その後、マルチツリープロジェクトの分岐を作る方法について説明する。これがわかれば君は GNU arch 自身をハックすることができるようになる。

概要

マルチツリープロジェクトはツリーの構成を記述しているだけの設定用アーカイブバージョンと、その設定から読み込まれる要素となるアーカイブバージョンから構成される。設定用アーカイブバージョンには設定ファイルがあり、どのアーカイブを、どのサブディレクトリに取り込むかを記述する。

GNU arch 本体の場合、アーカイブバージョン間の関係は以下のようになっている。

lord@emf.net--2004/dists--devo--1.0: 設定用アーカイブバージョン。以下のバージョンの構成方法についての記述がある。
lord@emf.net--2004/package-framework--devo--1.0: コンパイル/インストールするための汎用的なビルドシステム。
lord@emf.net--2004/tla--devo--1.3: GNU arch 本体。必要に応じて hackerlab ライブラリを呼び出す。
lord@emf.net--2004/hackerlab--devo--1.0: GNU arch 本体から呼び出されるライブラリ。pika など他のプロジェクトでも利用される汎用的なもの。

各構成バージョンのversion 名が、1.0 とか 1.3 とかまちまちになっていることに注意しよう。何度か言ってきたように、GNU arch は異なるバージョン間のバージョン名には、そのままでは何の関係もない。マルチツリープロジェクトを展開するには、設定用アーカイブバージョンを通常の方法で tla get する。マルチツリープロジェクトの一部として利用されるアーカイブバージョンと言えども、単独で見た場合には普通のバージョンとなんら変わることはなく、バージョンに対してできるすべての操作が可能であることに注意しよう:

$ tla get -A lord@emf.net--2004 dists--devo--1.0--patch-10 dists--devo--1.0
* from archive cached: lord@emf.net--2004/dists--devo--1.0--base-0
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-1
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-2
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-3
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-4
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-5
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-6
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-7
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-8
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-9
* patching for revision: lord@emf.net--2004/dists--devo--1.0--patch-10
* making pristine copy
* tree version set lord@emf.net--2004/dists--devo--1.0
$ cd dists--devo--1.0
$ ls
=ARCH-USERS-README  =INSTALL  =RELEASE-ID  COPYING  configs  {arch}
$

リビジョン番号は開発が進むにつれてもっと大きな番号になっているかも知れない。設定用バージョンには、他のどのアーカイブバージョンをどのディレクトリに読み込むかについての定義ファイルがある。定義ファイルはどのような名前にしても良いが、設定用バージョンのルートディレクトリか、ルートディレクトリの下の ./configs ディレクトリ配下に置かなくてはならないという決まりがある。定義ファイルは用途に応じた複数個を用意することもでき、個数が多いようなら ./configs ディレクトリの下にまとめた方が整理しやすくなる。./configs ディレクトリの下にはサブディレクトリを作り、更に細かく定義ファイルを整理することもできる。実際 GNU arch ではそのようにして ./configs/emf.net などのディレクトリが作られている。

定義ファイルの内容は

ディレクトリ名　　　バージョン名

のような複数行からなる。空白だけの行、# で始まる行をコメントとして利用することができる。GNU arch にある ./configs/emf.net/devo.tlaという定義ファイルは以下のようになっている:

# Check out a tla arch distribution from the devo branches.  Latest
# revisions.
#

./src                   lord@emf.net--2004/package-framework--devo--1.0
./src/tla               lord@emf.net--2004/tla--devo--1.3
./src/hackerlab         lord@emf.net--2004/hackerlab--devo--1.0

./src/docs-tla          lord@emf.net--2004/docs-tla--devo--1.0
./src/docs-hackerlab    lord@emf.net--2004/docs-hackerlab--devo--1.0


# tag: Tom Lord Sat Jun 14 14:54:15 2003 (emf.net/devo.tla)
#

各行の意味は明らかだろう。./src というサブディレクトリの下に、 lord@emf.net--2004/package-framework--devo--1.0 というバージョンを展開する、などの指定になる。実際の各バージョンの展開には tla build-config コマンドを使う:

$ tla build-config emf.net/devo.tla
…
$

余談だが、./configs ディレクトリにはこのほかにもさまざまな定義ファイルがあり、Tom Lord が作った GNU arch 以外の公開されたソフトウェアはすべてこれらの定義ファイルから構築することができる。tla build-config が終了すれば、通常 tar ファイルとして配布される tla のソースコードが展開されていることがわかる。XXX 章に書いた方法を使えばもちろんインストールできる。

GNU arch internal

せっかく GNU arch のソースコード本体について触れたので、ここで GNU arch そのもののソースコードの編成について説明しようと思う。ソースコードのディレクトリ構成はさまざまな理由で大きく変わる可能性はある。ここでは tla-1.3 のツリー構成について説明する。興味のある人はここでの説明を理解したら、次の節の方法で GNU arch の分岐を自分のマシンに作っていつでもハックし始めることができる。

際上位ディレクトリは以下のような雰囲気になっている。

$ ls
=ARCH-USERS-README  =INSTALL  =RELEASE-ID  COPYING  configs  src  {arch}
$

ここはあまり見るべきものはない。configs の下にマルチツリープロジェクト構築に必要な情報があるだけでどうということはない。重要なのは src ディレクトリの下だ。降りてみる:

$ cd src
$ ls
COPYING      Maintfile	  PLUGIN       configure       docs-tla   links  {arch}
ChangeLog.d  Makefile.in  build-tools  docs-hackerlab  hackerlab  tla
$

すこし面白くなってくる。この階層は基本的には Tom Lord が自分で作ったビルドシステムに関係している。./configure という名前のファイルがあるが、これが実際に tla をコンパイルする時に走らせるシェルスクリプトだ。tla 本体をハックする場合に関係するディレクトリは hackerlab と tla だけだ。hackerlab は tla とは独立したライブラリ群で、GNU の glibc のような感じのさまざまなルーチンが入っている。tla に降りてみる:

$ cd tla
$ ls
=THANKS		COPYING      Makefile.in  libawk      libneon  {arch}
=TODO		ChangeLog    PLUGIN	  libdate     tests
=gpg-check.awk	ChangeLog.d  libarch	  libfsutils  tla
$

だいぶ核心に近づいてきたが、まだごちゃごちゃしている。'='文字で始まるファイルは、例によって深く考えなくても良い。この下の libarch。ここが tla の心臓になる:

$ cd libarch
$ ls
=scraps			 cmd-get-changeset.h	    cmd-sync-tree.h
Makefile.in		 cmd-get.c		    cmd-tag.c
PLUGIN			 cmd-get.h		    cmd-tag.h
ancestry.c		 cmd-grab.c		    cmd-tree-lint.c
ancestry.h		 cmd-grab.h		    cmd-tree-lint.h
apply-changeset.c	 cmd-help.c		    cmd-tree-root.c

…

cmd-file-find.c		 cmd-show-changeset.c	    undo.c
cmd-file-find.h		 cmd-show-changeset.h	    undo.h
cmd-find-pristine.c	 cmd-star-merge.c	    whats-new.c
cmd-find-pristine.h	 cmd-star-merge.h	    whats-new.h
cmd-get-changeset.c	 cmd-sync-tree.c
$

ここには非常にたくさんのソースファイルがそのまま並んでいる。数が多いので詳細は省略した。大雑把に言うと、tla foo というコマンドに対応して、cmd-foo.c と cmd-foo.h という二つのソースファイルがほぼ必ず存在すると考えて良い。この cmd-foo.c に書ききれる程度の機能でしかないコマンドの場合には cmd-foo.c のみで話が終る。一つのファイルで記述するには規模が大きすぎたり、コマンド間で共通の機能としてくくり出す場合には、他のファイルが関係していることもある。この場合、 cmd-foo.c の他に、foo.c のような名前になることが多い。たとえば少し変則的だが、tla my-id に対応するソースコードは cmd-my-id.c であり、他の my がつくコマンドとの共通部分のソースコードは my.c に存在する、といった具合になる。cmd-my-id.c と my.c は、GNU arch のコマンドの、スケルトンと言っても良いくらい単純なので、新しいコマンドを追加しようとする人は、まずはここから読み始めるのがおすすめだ。

各コマンドのディスパッチテーブルは cmds.c にある。cmd-xxx.c で作ったコマンドをここに登録すれば tla help などの一覧でも表示されるようになり、実際に呼び出すこともできるようになる。

以下、特に注目すべきファイルを挙げる

namespace.c: GNU arch で利用されるさまざまな名前がどのような形式であるかを決めるモジュール。ここを書き換えるとさまざまな名前の規則を変更することができる。ハックは容易だが名前空間の変更はアーカイブの互換性を失わせる結果になることが多いので注意が必要である。
invent.c: ファイルのインベントリチェックや、グループ判別ロジックがある。あるファイルがどのグループに属し、ソースファイルである場合にはそのインベントリid は何であるかはここから inv-ids.c の関数を利用してで解析される。
make-changeset.c: GNU diff のツリーへの拡張である mkpatch() 関数のあるモジュール。
appply-changeset.c: GNU patch のツリーへの拡張である dopatch() 関数のあるモジュール。make-changeset.c と合わせて、GNU arch の核心をなしている。
star-merge.c: パッチログの履歴や、共通祖先などの状況を考慮した上で二つのツリーをできる限り適切にマージする star merge の実装。tla の内部では最も高いレイアにある部分。外部コマンドとして括り出しても良いくらいのモジュール。
archive-pfs.c: GNU arch のストーレージインターフェース用ファンクションディスパッチテーブルのあるモジュール。
archive.h: GNU arch のアーカイブオペレーション用ファンクションディスパッチテーブル、 struct arch_archive_vtable の定義があるヘッダ。このディスパッチテーブルの具体的な実装として現時点で存在しているのが pfs-dav.c, pfs-fs.c, pfs-ftp.c, pfs-sftp.c の四つで、それぞれ WebDAV、通常のファイルシステム、ftp、sftp の実装に対応している。
pfs.h: GNU arch のファイルシステムオペレーション用ファンクションディスパッチテーブル、 struct arch_pfs_vtable の定義があるモジュール。GNU arch のストーレージインターフェースは arch_archive_vtable とこの arch_pfs_vtable の二つのテーブルで完全に抽象化されている。

カスタマイズの方法

第1節で tla build-config を使って tla のソースコードを展開した。ここでは tla のソースコードに実際に手を入れる方法について説明しよう。既にのべたように tla はひとつの設定用アーカイブバージョンと、四つの独立したアーカイブバージョンをまとめたものだった。tla を修正する場合は、このうち、tla--devo--1.3 と hackerlab--devo--1.0 のどちらかに対して修正を入れることがほとんどなので、これを前提としてカスタマイズの仕方を考えてみる。まず、直接 Tom Lord のアーカイブを修正することはできないので、tla と hackerlab の分岐を、ローカルマシンに作る。ここでは分岐先アーカイブバージョン名を、それぞれ tla--foo--1.3と hackerlab--foo--1.0としよう。

$ tla archive-setup tla--foo--1.3
…
$ tla archive-setup hackerlab--foo--1.0
…
$ tla archive-setup dists--devo--1.0
…
$

通常の分岐を作る操作と全く同じで、それぞれのバージョンに対してtla tag を実行する。

$ tla tag lord@emf.net--2004/tla--devo--1.3 octopus@bluegate.org/tla--foo--1.3
…
$ tla tag lord@emf.net--2004/hackerlab--devo--1.0 octopus@bluegate.org/hackerlab--foo--1.0
…
$ tla tag lord@emf.net--2004/dists--devo--1.0 octopus@bluegate.org/dists--foo--1.0
…
$

dists--foo--1.0 を get する。当たり前だが dists--devo--1.0 とまったく同じものになる。

$ tla get dists--foo--1.0
…
$

独自の設定を作るため、./configs/emf.net/devo.tla をコピーする。ここでは ./config/emf.net/foo.tla としよう

警告

foo.tla は devo.tla を単にコピーしただけなので、タグラインの方法でインベントリidを付与されている devo.tla と、 foo.tla とのインベントリidが重複してしまう。これをさけるため、コピー後、foo.tla のインベントリidを別のものに変更する必要がある。

./config/emf.net/foo.tla を編集し、以下のように tla と hackerlab を分岐後のものとする:

# Check out a tla arch distribution from the devo branches.  Latest
# revisions.
#

./src                   lord@emf.net--2004/package-framework--devo--1.0
./src/tla               octopus@bluegate.org--2004/tla--foo--1.3
./src/hackerlab         foo@bleugate.org--2004/hackerlab--foo--1.0

./src/docs-tla          lord@emf.net--2004/docs-tla--devo--1.0
./src/docs-hackerlab    lord@emf.net--2004/docs-hackerlab--devo--1.0


# tag: Tom Lord Sat Jun 14 14:54:15 2003 (emf.net/devo.tla)
#

あとは、tla build-config をいま作った定義ファイルによって構築すればよい:

$ tla build-config emf.net/foo.tla
…
$

これからの修正は、tla の部分については ./src/tla、hackerlab の部分については ./src/hackerlab に降りていって行えばよい。コミットは個別のアーカイブバージョンのディレクトリで行なえばよい。繰り返すが、後は異なる 3っつのアーカイブバージョンのプロジェクトツリーがたまたま特別なディレクトリの上下関係の中に展開されているだけだ。

付録 A. 名前規約と各種ファイル形式

この補遺では GNU arch で利用されるさまざまな名前で利用できる文字についての詳細と、ファイル形式についての詳細を説明する。

名前規約

GNU arch ではいろいろな名前が利用される。それぞれの名前には名前規約を持つものが多い。名前規約は主に正規表現で定義されるが、それだけとは限らない。以下ではそれぞれの名前の定義と、その名前規約についてひとつづつ説明する。

User ID と UID

User ID は、tla my-id コマンドで設定される tla 利用者を区別するための識別子である。User ID はさらにその部分文字列として UIDを含む。これは直観的に言うと E-mail アドレスのような形の文字列を許す。

User ID の厳密な定義は正規表現で[ほぼ]以下のものである

^[a-zA-Z0-9 \t]*<[-+_.a-zA-Z0-9]+@[-_.a-zA-Z0-9]+>$

UID の厳密な定義は正規表現で[ほぼ]以下のものである

^[-+_.a-zA-Z0-9]+@[-_.a-zA-Z0-9]+$

アーカイブ名

アーカイブ名は[ほぼ]以下の正規表現で表されるものである

xxx@yyy.zzz
or
xxx@yyy.zzz--www

ただし xxx などは、^[-a-zA-Z0-9]+$ かつ、'-' 文字が連続しないような文字列

カテゴリ名とブランチ名

カテゴリ名とブランチ名はいずれも[ほぼ]以下の正規表現であらわされるものである

^[a-zA-Z][-a-zA-Z0-9]*$

ただし、'-' 文字が連続しないような文字列

バージョン名

バージョン名は[ほぼ]以下の正規表現であらわされるものである

^[0-9]+(\.[0-9]+)*$

パッチレベル名

パッチレベル名は[ほぼ]以下の正規表現であらわされるものである

^(base|patch|version|versionfix)-[0-9]+$

ただし、base の場合には base-0 のみが許される。

各種ファイル形式

GNU arch はファイルシステム中にさまざまな形式のファイル、ディレクトリを作る。ここでは GNU arch が作るこれらのアイテムの編成や形式について説明する。

チェンジセット

GNU arch の根幹を支えるデータ構造がチェンジセットであることは繰り返し述べてきた。新しいリビジョンを作るときに GNU arch 内部で処理されていることは、直前のリビジョンと今回のリビジョンの間差分をチェンジセットとして求めることだ。求まったチェンジセットを tar で固めてアーカイブに追加すればコミットは完了する。チェンジセットは決まった形式のディレクトリとして表現される。以下がその構造だ。

インベントリマップ

チェンジセットの最上位ディレクトリ内には、ファイルとインベントリidの対応表がある。変更前ツリー/変更後ツリーの区別、ファイル/ディレクトリの区別の組み合わせで四つのファイルがある。各ファイル内はタブで区切られた二つのフィールドからなる。最初がファイル名(ディレクトリ名)、次が対応するインベントリidである。いずれも sort -k 2 コマンドでソートされていると仮定してよい。

orig-dirs-index: 変更前ツリーに存在しているすべてのサブディレクトリとそのインベントリid の対応表
mod-dirs-index: 変更後ツリーに存在しているすべてのサブディレクトリとそのインベントリidの対応表
orig-files-index: 変更前ツリーに存在していたすべての通常ファイルとそのインベントリidの対応表
mod-files-index: 変更後ツリーに存在しているすべての通常ファイルとそのインベントリidの対応表

テーブル中の「通常ファイル」とは「ディレクトリ以外のファイル」という意味である。つまりシンボリックリンクなども含む。

ディレクトリメタデータ

削除されたディレクトリ、追加されたディレクトリのファイルパーミッションなどを保存するために二つのファイルがある。通常のファイルについては「ファイルの内容」を保存しなくてはならないので、そのファイルのパーミッションで表現できるが、ディレクトリは「ファイルの中身」が存在しないので、ファイルと同じ形式で持つのは無駄だ。そこで変更前、変更後用の二つのファイルに一覧を記録してある。一行は、[メタデータ]タブ[名前]の形になる。

original-only-dir-metadata: 変更元のみに存在していたディレクトリのパーミッションの一覧
modified-only-dir-metadata: 変更後のみに存在していたディレクトリのパーミッションの一覧

両方のファイルとも、sort -t '<tab>' -k 2 でソートされていることを仮定してよい。この二つのファイルに記録されるメタデータは今後の拡張で追加される可能性がある。

削除ファイル、追加ファイル

ディレクトリ以外のファイルで削除されたもの、追加されたものは、そのままの形で以下の二つのディレクトリに保存される。ファイルの元ツリー中での相対的なパスは保存される。たとえば、. /foo/bar/baz.txt というファイルが削除された場合には、

./removed-files-archive/foo/bar/baz.txt

という名前のファイルにそっくりそのまま内容が保存される。保存ファイルのパーミッションも厳密に保存される。

removed-files-archive: 変更前ツリーにのみ存在した全通常ファイルを格納するディレクトリ
new-files-archive: 変更後ツリーにのみ存在する全通常ファイルを格納するディレクトリ

パッチファイル

最後に、patches ディレクトについて説明する。チェンジセット最上位にあるこのディレクトリには変更前と変更後の差分に対応したパッチファイルが保存されている。ファイルの追加や削除がなければ、このディレクトリ内のパッチの情報が最も重要な情報になる。

それぞれのパッチは通常の GNUdiff の unidiff 形式のファイルだが、ファイルの内容に対する変更と同時にファイル名称変更があった場合には、変換前、変換後のファイル名称は異なる。patches ディレクトリ配下のすべてのファイルは、常に変換後のファイル名を基準にして格納されるという決まりがある。

よく考えると、これは少し奇妙なことだ。なぜなら GNU arch のチェンジセットは可逆な性質があり、変更前、変更後の情報に対して論理的には完全に同等の関係にあるからだ。しかし実際の表現方法を見ると、このようにパリティーが変換後に傾いている。これはなぜだろうか? おそらく実際の利用でのチェンジセットの適用は変換前から変換後の方法に向かうことがほとんどであり、このような構成にしておいたほうが処理が効率化されるのだろう。

patches ディレクトリにある具体的なファイルは以下のようなものである。ただし new_name は今いったように変換後の名前である。 new_name がサブディレクトリにあれば、patches 配下も対応したサブディレクトリができるのは remove-files-archive などのディレクトリと同じである。

new_name.link-orig: 変更前のシンボリックリンク名を含む
new_name.link-mod: 変更後のシンボリックリンク名を含む
new_name.original: 変更前のファイル内容をそのまま含む
new_name.modified: 変更後のファイル内容をそのまま含む
new_name.patch: 変更前・後のファイルの差分を unified 形式で持つ
new_name.meta-orig: 変更前のメタ・データを含む
new_name.meta-mod: 変更後のメタ・データを含む
new_name/=dir-meta-orig: 変更前のディレクトリ・メタ・データを含む
new_name/=dir-meta-mod: 変更後のディレクトリ・メタ・データを含む

チェンジセットの計算はリビジョン間だけではなく、任意のツリー間に対して行うことができる。リビジョン間のチェンジセットは {arch}サブディレクトリを管理領域として必ず含んでいることに特徴がある。

チェンジセットに関係してふたつの演算がある。チェンジセットを求める演算と、適用する演算だ。それぞれ tla changeset, tla apply-changeset コマンドに対応する。前者は任意のツリー間に対して必ず値が求まり成功するが、後者は失敗することもある。これは任意の数の２乗は必ず計算できるが、その逆の演算である平方根が常にもとまるとは限らないのと似ている。

{arch}管理領域

プロジェクトツリーのルートディレクトリにある{arch}管理領域直下には以下のようなファイルがある

表 A.1. ファイル一覧

ファイル名	F/D	説明
`++default-version`	F	tla set-tree-version で設定されるデフォルトバージョン名が、A/C--B--V の形で記録されている。
`++pristine-trees`	D	プロジェクトツリーに追加されたプリスティンツリーが保存される。このディレクトリに下に更に locked/ と unlocked/ というサブディレクトリが作られ、そこに格納される。詳しくは tla lock-pristine コマンドを参照のこと。
`,,inode-sigs`	D	インベントリスキャンを高速化するためのi-nodeキャッシュ情報があるディレクトリ。高速化にのみ関係しているので、',,' で始まる名称に従い junk ファイルとみなせる。つまり、常に (そのような場面はほとんどありえないが、とにかく)ディレクトリごと安全に消すことができる。ディレクトリの下には A%C--B--V--R という名前のサブディレクトリがあり、その中にリビジョンごとのi-nodeキャッシュ情報がある。
`.arch-project-tree`	F	このプロジェクトツリーのバージョン情報が入った通常ファイル。プロジェクトツリーの形式が今後大きく変わった場合にはこのファイル内容が区別できるような別の文字列になると考えられる。
`=tagging-method`	F	インベントリタグの大域的なタグづけ方法を決めたり、GNU arch が認識する 6種類のファイルタイプを定義するためのファイル。実際の利用において、{arch} 管理領域中、唯一手で編集されることのあるファイルである。
`上記以外のディレクトリ`	D	パッチログのためのディレクトリになる。カテゴリ名として存在する。

上記で、プリスティンツリーの構造は、 ./C/C--B/C--B--V/A/C--B--V--R/ のような構成になる。この最後のサブディレクトリの下にプロジェクトツリーのルートにあるツリーと全く同じ形式のツリーが保存される形になる。ただしプリスティンツリーのプリスティンツリーは存在しない。階層のループが発生してしまうので自明であろう。

パッチログの構造は、./C/C--B/C--B--V/A/patch-log/R という形になる。最後の R はリビジョン名をもつ通常ファイルである。

アーカイブ領域

アーカイブ領域は import/commit コマンドなどにより新しくできたリビジョンの差分情報を格納する場所である。いったん格納されたデータは永続的に保存され、以後修正が加わることはない。この意味でアーカイブは基本的にはサイズが増加する一方だと言える。例外はリビジョンキャッシュ情報で、tla uncacherev コマンドを実行するとアーカイブ中のキャッシュは削除される。もちろんこれはキャッシュの削除なのでアーカイブの論理的な情報量が減るわけではない。アーカイブは複数のバージョンから構成され、アーカイブ + バージョン一つの論理的なバージョン管理単位となり、他のバージョン管理システムで「リポジトリ」と呼ばれる単位にほぼ相当する。

表 A.2. ファイル一覧

ファイル名	F/D	説明
`=meta-info`	D	アーカイブ全体についてのメタ情報が格納されるディレクトリ。現時点では name, mirror, signed-archive の三つファイルが存在しうる。name はこのアーカイブの名前、 mirror はこのアーカイブのミラーとしての名前、 signed-archive はこのアーカイブがサインつきであることを示すファイルである。
`.archive-version`	F	アーカイブの形式を示すバージョン情報文字列を含むファイルである。今後の拡張でアーカイブの形式が大きく変わるような場合にはこの中の文字列が変更になると考えられる。
`上記以外のディレクトリ`	D	それぞれカテゴリを示すディレクトリ。この下に実際のアーカイブバージョンが格納される。

アーカイブの際上位ディレクトリの名前は、実際に結びつけられるアーカイブ名と一致させる必要はなく、任意の名前で作成してよい。アーカイブ名との関連は =meta-info/name ファイルによって知ることができるためである。しかし、特に理由がない限りアーカイブ名に一致したものとすることを勧める。これには tla make-archive コマンドでアーカイブ位置を示すディレクトリの最後の部分をアーカイブ名に一致させればよい。たとえば:

$ tla make-archive octopus@bluegate.org--2004 \
      /home/octopus/{archives}/octopus@bluegate.org--2004

のようにする。この規則を明示的に破る必要がある場面もある。詳しくはアーカイブミラーなどの章を参照してほしい。

上記の表での実際の個別のバージョンが含まれるサブディレクトリについてさらに詳しく説明する。サブディレクトリは、 ./C/C--B/C--B--V/R の形をしている。最後の R はリビジョン名でディレクトリである。このディレクトリ中にはリビジョンのタイプに応じて各種のファイルが格納される。リビジョンのタイプは、初期リビジョン[i]、チェンジセットリビジョン[x]、継続リビジョン[c]の三つがある。初期リビジョンとは import コマンドで新規に作成されたリビジョンで、チェンジセットではなく初期ツリー全体が格納されている。通常は継続コマンド以外の base-0 リビジョンがこれにあたる。チェンジセットリビジョンは通常のコミットで作成されたリビジョンで、直前のリビジョンからの差分情報のみをもつ。patcn-n の形のリビジョンは普通この形になる。継続リビジョンは tla tag コマンドによって作られた継続情報を持つような特殊なリビジョンである。

表 A.3. ファイル一覧

ファイル名	i/x/c	説明
`C--B--V--R.tar.gz`	icx	基本的には初期リビジョンのみで存在する、初期ツリーの状態そのものを tar で固めたファイル。このファイルを展開すれば初期リビジョンがそのまま取得できる。tla cacherev コマンドでリビジョンをキャッシュした場合にはチェンジセットリビジョンでも存在する。
`C--B--V--R.patches.tar.gz`	_xc	チェンジセットリビジョンでは直前のリビジョンからの差分を示すチェンジセット(これはディレクトリであることを思い出してほしい)を tar で固めたファイル。継続リビジョンの場合にも継続を示すチェンジセットが格納されるが、これはほとんど空で、継続を意味するパッチログのみを含む特殊なチェンジセットになる。
`CONTINUATION`	__c	継続リビジョンでだけ存在する。継続元のリビジョンが A/C--B--V--R の形式で保存されたファイル。
`checksum`	???	このリビジョンの本来の内容を示す *.tar.gz ファイルに対して計算されたチェックサムの値が入ったファイル。サインつきアーカイブの場合にはさらにこの結果にサインが施されている。
`checksum.cacherev`	???	このリビジョンが tla cacherev によってリビジョンキャッシュを含む場合、そのキャッシュ用の *.tar.gz ファイルに対して計算されたチェックサムの値が入ったファイル。サインつきアーカイブの場合にはさらにこの結果にサインが施されている。
`log`	???	このリビジョンのパッチログ。このファイルは .tar.gz ファイル中にまったく同一のものが存在するが、簡単に参照できるようにするため単独ファイルの形で重複して存在している。これを見れば .tar.gz を展開してその中のファイルをわざわざ取り出さなくてもこのリビジョンでどのような修正があったかを大まかに知ることができる。
`++revision-lock`	???	バージョン中の最新リビジョンディレクトリに存在する。リビジョンがこのバージョンに追加される際に排他制御を正しく行なうために存在するディレクトリ。トランザクション実行中以外は、このディレクトリには +contents という名前の、ファイルを一つも含まない唯一のサブディレクトリが存在する。リビジョン追加のトランザクションについては XXX を参照してほしい。

ライブラリ領域

ライブラリ領域は、実際に tla get されたリビジョンのプロジェクトツリーがそのまま集められた巨大な領域である。同じバージョン中のリビジョン同士では変更が加えられていないファイルも多いので、そのようなものについてはハードリンクの手法を利用することで空間を節約している。

表 A.4. ファイル一覧

ファイル名	F/D	説明
`=sparse`	F	ライブラリを sparse 属性にするかどうかを決めるフラグとしてのファイル。ファイル内容は空である。このファイルが存在すると、ライブラリは sparse とされる。sparse とは、あるリビジョンをライブラリに追加するときに副産物として計算することのできる別のリビジョンを同時に自動的に追加するかどうかを決めるもので、sparse を指定するとこの自動追加機能が働かない。結果としてライブラリ領域のサイズは小さくなる。
`=greedy`	F	ライブラリを greedy 属性にするかどうかを決めるフラグとしてのファイル。ファイル内容は空である。このファイルが存在すると、ライブラリは暗黙に計算されるリビジョンをライブラリに登録する。たとえば tla get コマンドであるリビジョンのプロジェクトツリーをどこかに構築した場合、このプロジェクトツリーを特に指定しなくてもライブラリに追加する。これはライブラリコマンドを実行しなくても自然とtlaシステムが高速化されることにつながる。
`その他のファイル`	D	アーカイブ名をもつディレクトリになる。このディレクトリ名を A とすると、 ./A/C/C--B/C--B--V/C--B--V--R というディレクトリができて、最下位のディレクトリ中に、リビジョン A/C--B--V--R のプロジェクトツリーの内容が実際に展開される。

./A/C/C--B/C--B--V/C--B--V--R 配下のプロジェクトツリーには通常展開されるプロジェクトツリーの内容に加えて以下のファイル/ディレクトリが存在する。

表 A.5. ファイル一覧

ファイル名	F/D	説明
`,,index`	F	プロジェクトツリー中のファイルとファイルに対応したインベントリid とのペアのリスト。
`,,index-by-name`	F	,,index と本質的に同じ内容だが、ファイル名でソートされている。
`,,patch-set`	D	このリビジョン名をもつチェンジセットが保存されているディレクトリ。通常のチェンジセットのほかに、=ancestor, =previous, =log.txt の三つの追加情報も保存されていて、パッチログメッセージやこのリビジョンの前のリビジョンなどの関係を把握することができるようになっている。

.arch-params

各種一時ファイル

ここでは GNU arch 内部で利用されるさまざまなファイルをできる限り網羅して説明する。これらのファイルは内部的に利用されるだけで通常利用者が直接考慮する必要はないものだが、ハックの際には必要だろう。列挙したファイルがすべてではないし、GNU arch の細かいバージョンによって増減や名称変更があると思う。この点についてはご了承願いたい。

UUID(GUID)

GNU arch では、「誰とも重複しないような名前」や、「誰とも重複しないような数」を必要とする場面がよくある。たとえば、君がこれから作るアーカイブ名は、地球上の別の誰とも異なっていなくてはならない。このために君の E-mail アドレスをアーカイブの一部として利用するという決まりがあるのだった。いま、わざわざ君の E-mail アドレスを自分のアーカイブとするような意地悪な人間がとりあえず地球上にいないとすれば、これで君のアーカイブは地球上の誰とも衝突することはない。GNU arch は他にもこういう場面がある。インベントリid を決める時だ。インベントリid も、他のどんなアーカイブのどんなインベントリidとも異なっていなくてはならない。ある特定のバージョンや、アーカイブ中で一意であれば済む問題ではない。地球上のすべてのアーカイブ中のすべてのインベントリidと衝突してはいけない。衝突したからと言って破滅的なことが起こることはないが、やはり奇妙なエラーが出るはずだ。tla id-tagging-method で names の方式が好まれないのはこのためだ。この方法だと、たとえば ?./README.txt のようなインベントリidが生成されてしまい、これは簡単に他のアーカイブバージョンのまったく無関係な ?./README.txt と衝突してしまうのだ^[17]

どうしたらいいだろう。そうだ、世界中の GNU arch ユーザがみんなでどこかに集まって番号を取り決めればよいかも知れない。「文字列発行専用メーリングリスト」を作って、たとえば、私が議長になって、新しい文字列が欲しいときには私にメールすること、とか言う決まりを作ればいい。で、私は 000000000000000000001 番から順番に、メールしてきた人順に +1 した文字列を払い出せばいい。これで原理的に決して衝突しない文字列を事実上無限に作り出すことができる。これは良いアイディアだろうか? とんでもない。最悪のしくみだ。なぜだろう?

まず第一に、私はこんな単純な作業をやりたくはない。

プレシャス、バックアップ、ジャンクの具体的な意味

プレシャス属性

GNU arch のファイルグループの一つに「プレシャス」がある。これはローカルにコピーされる場合にソースと共にコピーされるという性質を与えられたものだが、「ローカルにコピーする」とは一体正確にはどのような状況を指すのかを議論する。

プレシャスのコピーに関係したソースファイルは、

./src/tla/libarch/copy-project-tree.c

にある

arch_copy_project_tree()

関数であり、これが呼び出されるのは、以下の四つの場所である。

cmd-apply-delta.c:        arch_copy_project_tree (upon, dest, 1, 1);
cmd-join-branch.c:        arch_copy_project_tree (upon, dest, 1, 1);
cmd-sync-tree.c:        arch_copy_project_tree (upon_root, dest, 1, 1);
cmd-update.c:        arch_copy_project_tree (upon_root, dest, 1, 1);

つまり、これらのコマンドでは既存のプロジェクトツリー上で処理を実行するかわりに --dest オプションで新規ディレクトリを指定して実行することもできるが、この場合元になるプロジェクトツリー中のソースとプレシャスがそこにコピーされた後、それぞれのコマンドが実行される。

バックアップ属性とジャンク属性

バックアップとジャンクの属性の違いは、ジャンク属性が「安全に削除できる」ということで示されている。が、現時点(tla-1.2) のソースコードを見てもバックアップとジャンクのどちらかが特別に扱われている気配はない。これについて説明する。

現時点ではこの両者にははっきりした区別はない。ただし tla は内部的に ,, で始まるファイルを一時的なファイルとして利用しており、これは =tagging-method などの設定がどうであれ必ず junk と見なされる約束がある。このため、上記の意味にしたがって junk 属性を =tagging-method の中で適切に設定すれば、今後将来にわたっても

$ tla inventory -j | xargs rm -r

として、tla を内部的な一時ファイルを含むジャンクファイルすべてを削除することができる。そのような利用方法を狙っている。

トランザクション

以下は、archive-pfs.c のコメントからの抜粋である。

あるバージョン内にはリビジョンが一列になって並んでいる。新しいリビジョンはどれも順序づけされて、不分割で、独立し、永続的なものとして作成される必要がある。ファイルシステムアーカイブ中で、バージョンはディレクトリの形に実装され、リビジョンはその中にパッチレベル名を持ったサブディレクトリとして実装される。(base-0, patch-1 ... など)。通常の rename システムコールはこのための仕組みをほぼ用意してくれる: tla クライアントは,,wants-to-be-patch-1-txnidのような名前のディレクトリを作り、必要なリビジョンデータをそこに入れ、それから patch-1 のような名前に rename すれば良いように思える。クライアントはpatch-(N-1)が存在しない場合には patch-N を作らないものと取り決めておけば、patch-Nのコミットに成功した別のクライアントがある場合には rename を失敗するので、排他制御は正しく働くことになるように思える。

しかしここに罠がある。base-0 あるいは patch-N の後の名前は固定されたものではないのだ。patch-(N+1)かも知れないが、version-0 になることもある。patch-N (あるいは base-0 )の後続リビジョンとして、同時に patch-(N+1)と version-0 を作ろうとするクライアントがあった場合には悲惨なことになる。rename はこの問題を直接解くことはないのだ。(さらに、"継続する形のロック"もサポートしたい。実際にコミットする前に新しいリビジョンをロックしておくことで、そのリビジョンに対して別の誰かがコミットすることをあらかじめ防ぐようにしたい。)

で、かわりに以下のような仕組みを実装する。

あるバージョンのサブツリーは常に、唯一の(ネストしない) "リビジョンロック用ディレクトリ" を持つものとする。このディレクトリは常に +contents と呼ばれるサブディレクトリを持つ。通常、+contents ディレクトリは最終的には新しいリビジョン用のディレクトリとして rename されるものだ。

一般的に、リビジョンロックディレクトリの名前はロックの状態を示す。書き込みトランザクションがロックを取得するときには +contents ディレクトリ中に新しいリビジョン用のデータ(これはネストされた新しいリビジョンロックディレクトリがあるが)を入れ、それから +contents をpatch-N(あるいは version-0、base-0、versionfix-N の名前)に rename し、後始末をする。

とりうるリビジョンロックの状態は以下である。

[A,B,C,D,E]

特殊なリビジョンと状態遷移

GNU arch で通常利用されるリビジョンは base-0 か patcn-n という形のものだ。ここで n は 1 以上の整数。しかしこのほかにも version-0 と versionfix-n という形のリビジョンが存在する。この二つのリビジョンは tla commit コマンドで --seal と --fix オプションを使うと生成される。これらの関係を状態遷移の形で示すと以下のようになる。

図 A.1. コミットのオプションと状態遷移

これらの特殊リビジョンを過去の遺物と考え、利用を勧めない人も多い。私もその一人である。が、疑問を一つでも抱えると先に進むことのできないタイプの人間も多い^[18]。そして私はこちらにも属する。そんなわけで説明した。「それはあなたには関係ないから気にしなくていい」こういう説明は、私は嫌いだ。歴史家や考古学者にとって、自分に関係ないことなど一つもないのだから。

繰り返しになるが、個人的にはこれらの特殊なリビジョンの利用には反対である。また、特殊リビジョンをこれ以外にも定義して、それを利用した形で tla を拡張することにも反対である。われわれの生きる世界はもう十分複雑だ。さらに複雑にする理由は何もない。過去を繰り返す必要はない。理解するだけにしよう。

^[17]繰り返すが、このようなことがおきても致命的な話しにはならない。ただ GNU arch のすばらしい世界の一部が堪能できなくなることだけは確かだ。

^[18]小学生のとき、引いた数がどこに行ってしまうのかがわからなくて、大学で数学基礎論を学ぶまで、私は引き算が理解できなかった。そのことは誰にも言わないでほしい。

付録 B. GNU arch関連情報

ツール
リンク集

この補遺では GNU arch に関連したサードパーティー製ツールや、リンク集などについて説明する。

ツール

リンク集

文句なしに一番重要なのは以下の場所だ

http://wiki.gnuarch.org

残念ながら英語だが、GNU arch に関するまとまった情報がある。 wikiでできているので、誰でも貢献することができる。率直に言って GNU arch はまだまだドキュメントが不足している。私がこのドキュメントを書いているのもそれが理由だ。

上記の wiki からたどることができるが、

http://wiki.gnuarch.org/moin.cgi/Archive_20Registry

にはよく知られた有名なアーカイブの一覧がある。もちろんこのドキュメントの中で説明した方法で tla register して get / tag することができる。

メーリングリストは、

http://mail.gnu.org/mailman/listinfo/gnu-arch-users

で、ここが GNU arch 公式のメーリングリストだ。users という名前だが、利用者から開発者や貢献者まで入り混じっている。特に開発者用のリストは現時点では存在しない。このドキュメントを読んでも理解できない部分についてはぜひこのリストに質問を投げてほしい。君が質問してくれれば、この本の精度はそれだけ高くなる。これは立派な貢献のやり方の一つだ。

もし君が日本人なら、日本語のメーリングリストがある。これは私が自分のサーバに作って私が管理している非公式のリストだ。現時点ではあまり流量は多くないが、ある程度の質問には答えられると思う。

http://arch.bluegate.org/mailman/listinfo/arch-jp

付録 C. GNU arch コマンドリファレンス

tla my-id

プロジェクトツリーコマンド

tla init-tree
tla tree-root
tla tree-version
tla set-tree-version
tla undo
tla redo
tla changes
tla file-diffs

プロジェクトツリーインベントリコマンド

tla inventory
tla tree-lint
tla id
tla id-tagging-method
tla add-id
tla delete-id
tla move-id
tla mv
tla explicit-default
tla id-tagging-defaults

パッチセットコマンド

tla changeset
tla apply-changeset
tla show-changeset

アーカイブトランザクションコマンド

tla make-archive
tla archive-setup
tla make-category
tla make-branch
tla make-version
tla import
tla commit
tla get
tla get-changeset
tla lock-revision
tla archive-mirror

アーカイブコマンド

tla abrowse
tla rbrowse
tla categories
tla branches
tla versions
tla revisions
tla ancestry
tla ancestry-graph
tla cat-archive-log
tla cacherev
tla cachedrevs
tla uncacherev
tla archive-meta-info
tla archive-snapshot
tla archive-version
tla archive-fixup

パッチログコマンド

tla make-log
tla log-versions
tla add-log-version
tla remove-log-version
tla logs
tla cat-log
tla changelog
tla log-for-merge
tla merges
tla new-merges

マルチプロジェクト設定用コマンド

tla build-config
tla cat-config

ブランチとマージに関するコマンド

tla tag
tla update
tla replay
tla star-merge
tla apply-delta
tla missing
tla join-branch
tla sync-tree
tla delta

ローカルキャッシュ関連コマンド

tla changes
tla file-diffs
tla file-find
tla pristines
tla lock-pristine
tla add-pristine
tla find-pristine

リビジョンライブラリコマンド

tla my-revision-library
tla library-config
tla library-find
tla library-add
tla library-remove
tla library-archives
tla library-categories
tla library-branches
tla library-versions
tla library-revisions
tla library-log
tla library-file

公開用リビジョンコマンド

tla grab

スクリプト支援コマンド

tla parse-package-name
tla valid-package-name

この補遺は GNU arch のコマンドリファレンスです。ある程度内容が充実するようなら、独立した本にしたほうが良いかも知れませんが、とりあえず補遺の形で始めてみます。

リファレンスの見方

このリファレンスでは(XXX)。変更の項目では、そのコマンドがどのデータに対して書き込む可能性があるかを示しました。これは四つのシンボル、[AWCL]からなります。A はアーカイブ領域、W はプロジェクトツリー、C は設定領域(~/.arch-params)、L はライブラリ領域、をそれぞれあらわします。ライブラリ領域の書き込みについてはさまざまな処理の途中で暗黙に書き込みが起こる場合もあり、この記法では厳密には記述しきれていないものもあります。[----]となっているコマンドはどの領域にたいしてもせいぜいリードアクセスするだけなので気軽に試してみることができます。

オプションの項では、どのコマンドでも必ず利用できる以下の三つのオプションは省略しているので注意してください。

-h, --help     短い形式のヘルプを表示して終了します。
-H             長い形式のヘルプを表示して終了します。
-V, --version  リリース文字列を表示して終了します。

各コマンドに対する引数や説明中で、アーカイブ名、カテゴリ名、ブランチ名、バージョン名、リビジョン名、そしてそれらの組み合わせについて語る場合、それぞれの名前部分を、A, C, B, V, R の一文字で表す場合があります。たとえば A/C--B--V と書いた場合には、

octopus@bluegate.org--2004/hello--proj--1.0

のような文字列を思い浮かべてください。また、C--B と書いた場合には同様に

hello--proj

のような文字列を想像してください。GNU arch では名前空間が複雑で、さらに名前の構成部分とその構成結果の呼称があまり厳密に定義されていないので、このようにシンボリックに書き表すことで議論の対象をはっきりさせることにします。

tla サブコマンド

ヘルプコマンド

ユーザコマンド

この節ではすべてのユーザコマンドについて説明します。それぞれのコマンドは、アーカイブ(CVSで言うリポジトリ)、プロジェクトツリー(CVSで言う作業コピー)、そして設定管理領域(~/.arch-param)に対して読み書きすることがあります。これらの領域に対してアクセスが発生しないか、読み込みアクセスしか発生しない場合には '-'、書き込みが発生する場合 'w' でこの順に示すことにします。たとえば 'w--' と書けば、アーカイブに対する書き込みは発生しますが、プロジェクトツリー、設定管理領域に対する読み書きは発生しません。

名前

tla my-id — ユーザ id の表示と設定

用法

tla my-id [identify string]

説明

ユーザ ID は arch を利用する際にさまざまなアーカイブとログメッセージ中に記録される識別子です。一行からなる印字可能な文字からのみ構成されていなくてはなりません。以下の例のようなemailアドレスの形をしていなくてはならないという決まりがあります。

        Jane Hacker <jane.hacker@gnu.org>

<と>の間の部分の文字列は uid と言います。archは uid を使ってユニークなファイル名を生成することがあります。具体的には XXX と XXX です。id の厳密な定義は正規表現で書くと XXXです。id の後に引数がある場合、その内容が ~/.arch-params/=id というファイルに保存されます。idをコマンドラインから設定する場合には < や > のような文字がシェルの特殊文字と衝突してしまうので、ダブルクオート文字などでエスケープして指定してください。

-u (--uid)オプションを利用すると id 文字列の uid の部分だけが表示されます。-e (--errname)オプションを指定すると id の表示に失敗した場合にこのプログラムが呼び出されます。ある人たちはemailアドレスのような情報がシステムのいたるところに公開されてしまうのを嫌います。-e オプションは UUID 生成プログラムなどのような email アドレスには基づかない名前をかわりに利用することを狙ったものです。

このコマンドは、GNU arch のインストール後に必ず実行しなくてはならないものの一つです。一度設定してしまえばそれ以上利用することは少ないコマンドですが、このコマンドでなんらかの id を設定しないうちは GNU arch の多くのコマンドが利用できません。

別名

なし

変更: `[--C-]`

スイッチ

--errname (-e)
--uid (-u)

例

以下では、my-id の初期設定後、設定内容を確認しています。 Unix コマンドラインから id を入力する場合、'<'、'>'、その他の特殊文字を扱うため、二重引用符でくくって指定していることに注意してください。

$ tla my-id
arch: no arch user id set
$ tla my-id "Tez Kamihira <tez@kamihira.com>"
$ tla my-id
Tez Kamihira <tez@kamihira.com>

CVS対応コマンド

なし

プロジェクトツリーコマンド

GNU arch は他のオーソドックスなバージョン管理システムと同様に、二つのデータが主な役割を演じます。ひとつはアーカイブ、もうひとつは作業コピーです。アーカイブは、CVS で言うリポジトリのことです。作業コピーは GNU arch の世界ではプロジェクトツリーと呼ばれます。アーカイブには確定した情報が次々と蓄積されていきます。一度追加された情報を後で修正したり削除したりするコマンドはありません。一度アーカイブにデータを追加すると、それは永続的に残ります。プロジェクトツリーはアーカイブから取り出した情報を加工するための、まさに作業領域です。作業が一段落したらその結果をアーカイブに追加します。これがコミットです。ここでのコマンドは主にプロジェクトツリーの内容を参照したり、その内容を変化させるためのコマンドです。

名前

tla init-tree — 新しいプロジェクトツリーの初期化

用法

tla init-tree [options] [[archive]/version]

説明

このコマンドは引数で指定した VERSION のためのパッチログの領域を作ります。呼び出された直後にはこの領域にパッチログはありません。同時にこの VERSION が import や commit 処理でのデフォルトのアーカイブバージョンになります。

このコマンドを実行すると、{arch}という管理領域が作成されます。VERSION のためのパッチログ領域もここに作られます。パッチログ領域が存在しないバージョンにはそのバージョンのパッチログを追加できません。

このコマンドはこれからバージョン管理しようとするディレクトリを arch の管理下に置くものです。{arch}ディレクトリが作成される以外既存のファイルに対しては一切変更されません。CVS の場合、リポジトリに対する初期インポート後、リポジトリからのチェックアウト処理によって初めて作業コピーができますが、GNU arch では管理したいファイルのあるディレクトリをそのままプロジェクトツリーに変化させることができます。

あるディレクトリをバージョン管理するための最初のステップの一つです。tla archive-setup 、tla init-tree、tla make-log、tla import が、典型的な GNU arch での初期ワークフローです。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive  アーカイブを明示的に指定します
-d, --dir DIR  まず DIR に移動します
--nested       ネストしたプロジェクトツリーを初期化します

例

hello.cというただ一つのファイルからなるディレクトリをプロジェクトツリーに変えます。既存のファイル—この場合はhello.c—には一切手を触れずに、{arch}という名前の管理用ディレクトリが作成されます。hello--proj--1.0 というバージョンはあらかじめアーカイブに存在している必要はありませんが、 import前までには作成しておく必要があります。バージョンの作成についてはtla archive-setupコマンドを参照してください。

$ ls
hello.c
$ tla init-tree hello--proj--1.0
$ ls
hello.c  {arch}
$

CVS対応コマンド

なし

名前

tla tree-root — プロジェクトツリールートの表示

用法

tla tree-root [options] [dir]

説明

DIR または現在のディレクトリを含むプロジェクトツリーのルートを検索し表示します。GNU arch のプロジェクトツリーのルートには必ず {arch}管理領域があります。このプログラムは上位ディレクトリに向かって {arch} ディレクトリが存在しないかどうかを調べることでプロジェクトツリーのルートを判別します。{arch}管理領域はプロジェクトツリーのルートにしか存在しません。

--accurate オプションを指定すると以下の3種類の可能性をチェックします。まずプロジェクトツリーがコミットの途中であり、ツリーのパッチログ領域にログエントリを追加する前に中断された状態にあるかどうかを調べます。この場合アーカイブに対して実際にコミットが完了したかどうかを知ることはできず、{arch}ディレクトリには "++mid-commit" のようなログファイルが残っています。ツリーがこの状態にある場合にはエラーメッセージを表示して終了します。

プロジェクトはコミットを中断した状態にありますが、実際にはコミットが完了しています。この場合 "++commit-definite"のようなログファイルが残っています。ツリーがこの状態にある場合にはまずログファイルを正しく設定し、その後ツリールートを表示し、プログラムを正常に終了します。

プロジェクトツリーのパッチログは完全に更新されている場合。ツリーがこの状態であれば普通にツリールートを表示し、正常終了します。

別名

なし

変更: `[----]`

スイッチ

--accurate      トランザクション途中のツリーに対してエラーを報告します
-s, --silent    ステータスのみを返します

例

/home/foo/proj という名前のプロジェクトツリールートに hello.c というファイルとドキュメント用ディレクトリ doc があります。プロジェクトツリールートで実行しても、doc サブディレクトリで実行しても、プロジェクトツリールートである /home/foo/proj が返ります。

$ pwd
/home/foo/proj
$ ls
doc  hello.c  {arch}
$ tla tree-root
/home/foo/proj
$ cd doc
$ pwd
/home/foo/proj/doc
$ ls
README.txt
$ tla tree-root
/home/foo/proj
$

CVS対応コマンド

なし

名前

tla tree-version — デフォルトツリーバージョンの表示

用法

tla tree-version [options] [dir]

説明

DIR または現在のディレクトリにあるプロジェクトツリーのデフォルトアーカイブバージョンを表示します。デフォルトアーカイブバージョンは import、commit、などのコマンドで特にバージョンを指定しなかった場合に利用されるものです。ここで言うバージョンは CVS で言うリポジトリ名に対応するものです。tla set-tree-version も参照してください。

GNU arch での典型的なワークフロー

GNU arch には非常に多くのコマンドがあり、必ずしも整理されているとは言えません。たくさんのコマンドがある理由は多くのコマンドは非常に単純な処理のみを行うものが多く、利用者はこのような単純なコマンド—プリミティブと言います —をうまく組み合わせてさまざまな処理を行うことを前提しているためです。これはちょうど Unix の複数のコマンドをパイプを使って効率良く作業するのに似ています。

しかし、通常の利用ではこれらの「単純な」コマンドをすべて覚える必要はありません。典型的な使い方としては、まずアーカイブのディレクトリを作り、tla my-id, tla my-default-archive、tla make-archive を一度だけ実行します。ここまでは一度実行すればあとは滅多に行うことがありません。

日々の利用で必要なコマンドは大きく二つのグループに分けられます。ひとつは新しいバージョンを設定するためのコマンド、もう一つは実際のコミットに関係したコマンド。前者はやはりそれほど頻繁に実行されることはありませんが、これは典型的には tla archive-setup, tla init-tree, tla import です。後者が本当に頻繁に行う作業になりますが、tla make-log, tla commit, tla replay, tla star-merge, tla update などになります。結局、普段良く利用するのは最後のグループの 5 個程度ということになります。

別名

なし

変更: `[----]`

スイッチ

なし

例

プロジェクトツリーのルートでデフォルトツリーバージョンを確認しています。doc サブディレクトリの下で実行しても同じ内容が返ります。

$ pwd
/home/foo/proj
$ ls
doc  hello.c  {arch]
$ tla tree-version
octopus@bluegate.org--2004/hello--proj--1.0
$

CVS対応コマンド

なし

名前

tla set-tree-version — デフォルトツリーバージョンの設定

用法

tla set-tree-version [options] [archive]/version

説明

DIR または現在のディレクトリにあるプロジェクトツリーのデフォルトバージョンを設定します。デフォルトバージョンは import、commit、などでで特にバージョンを指定しなかった場合に利用されるものですが、ここで言うバージョンは CVS で言うリポジトリ名に対応するものです。tla tree-version も参照してください。

バージョンを指定する際のアーカイブは通常のコマンドライン引数の形で ARCHIVE/VERSION のように指定することもできますし、-A、-R オプションで指定することもできます。tla my-default-archiveのオプションを見てください。

単純な開発ラインの場合、このコマンドを使ってデフォルトバージョンを変更することはほとんどありません。デフォルトバージョンはプロジェクトツリー作成時点で一度だけ設定することがほとんどですが、この一度だけの設定には tla init-tree コマンドの引数として与えることもできるからです。このコマンドは複数のバージョンを同時に内包するような複雑な開発ラインを作る場合にのみ利用されます。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first

例

プロジェクトのデフォルトバージョンを変更してから tla tree-version コマンドで確認しています。

$ tla tree-version
octopus@bluegate.org--2004/hello--proj--1.0
$ tla set-tree-version bar@bluegate.org--2004/another--proj--1.0
$ tla tree-version
bar@bluegate.org--2004/another--proj--1.0
$

CVS対応コマンド

なし

名前

tla undo — プロジェクトツリー中内での変更取消

用法

tla undo [options] [revision]

説明

プロジェクトツリーの変更点を退避したあと修正前の状態に戻します。リビジョン REVISION から DIR にあるプロジェクトツリーの内容の差分をチェンジセットの形で求め、PATCH-DIR ディレクトリに保存します。PATCH-DIRディレクトリはあらかじめ存在していてはいけません。次にこのパッチを DIR にあるプロジェクトツリーに対して逆向きに適用します。この結果 DIR に対して加えられたローカルな変更点は取り消され、その修正点を示すチェンジセットは扱いやすい形で保存されます。

REVISION が指定されない場合、ツリーが利用しているデフォルトバージョンの直近の祖先まで戻ります。REVISION が VERSION の形で指定された場合はその VERSION 中の直近の祖先を利用します。

DIR が指定されなければ "." を仮定します。

PATCH-DIRが指定されなければ ,,undo-* という形の一時ファイル名が利用されます。

--no-output が指定されるとチェンジセットは保存されません。"tla redo", "tla changes" も参照してください。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive           アーカイブを明示的に指定します
-d, --dir DIR           DIR に移動してから処理を開始します
-o, --output PATCH-DIR  チェンジセットを PATCH-DIR に保存します
-n, --no-output         チェンジセットを保存しません
-N, --forward           `patch'コマンドに ---forward オプションを渡します
-q, --quiet             計算途中の進行状況を表示しません
-changeset

例

以下ではプロジェクトツリーは patch-1 まで開発が進んだ hello--proj--1.0 にローカルな修正を加えた状態です。これを patch-1 の状態まで戻すために tla undo を実行します。実行前に、プロジェクトツリーの履歴と、最新リビジョン patch-1 との間の差分を確認しています。また実行後に ls コマンドで ,,undo-1 ディレクトリが作成されていることを確認しています。

$ tla abrowse --desc
octopus@bluegate.org--2004
  hello
    hello--proj
      hello--proj--1.0

        base-0    (initial import)
          Mon Apr  5 11:36:16 JST 2004      foo bar <octopus@bluegate.org>
          initial import

        patch-1    (simple changeset)
          Mon Apr  5 11:37:45 JST 2004      foo bar <octopus@bluegate.org>
          add a printf() line.

$ tla changes --diffs
* looking for octopus@bluegate.org--2004/hello--proj--1.0--patch-1 to
compare with
* comparing to octopus@bluegate.org--2004/hello--proj--1.0--patch-1
M  hello.c

* modified files

--- orig/hello.c
+++ mod/hello.c
@@ -1,4 +1,4 @@
-main()
+void main(int argc, char* argv[])
 {
        printf("hello world\n");
 }

$ tla undo
* linting the source tree
* reverting changes
M   hello.c
$ ls
,,undo-1  hello.c  {arch}
$

CVS対応コマンド

なし

名前

tla redo — プロジェクトツリー中の変更の再適用

用法

tla redo [options] [changeset]

説明

CHANGESET をプロジェクトツリーに適用後そのCHANGESETを削除します。CHANGESET が指定されなければプロジェクトツリー中にある ,,undo-N の形のディレクトリで N が最も大きいものが利用されます。--keep を指定するチェンジセットディレクトリは削除されません。"tla undo", "tla apply-changeset" も参照してください。

別名

なし

変更: `[-W--]`

スイッチ

-N, --forward  pass the --forward option to `patch'
-k, --keep     do not delete the patch
-q, --quiet    no progress reports while computing changeset
-d, --dir DIR  Operate on project tree in DIR (default `.')

例

tla undo の項の例を実行した直後の状態にあるとします。 tla redo を利用して undo の結果を再びプロジェクトツリーに適用しています。実行前に ,,undo-1 ディレクトリを確認し、tla changesコマンドでプロジェクトツリーが patch-1 リビジョンと一致していることを確認しています。tla redo 後には hello.c に再びローカルな修正が加えられ、tla changes の結果でそれを確認しています。

$ ls
,,undo-1  hello.c  {arch}
$ tla changes
* looking for octopus@bluegate.org--2004/hello--proj--1.0--patch-1 to
compare with
* comparing to octopus@bluegate.org--2004/hello--proj--1.0--patch-1
$ tla redo
* linting the source tree
M   hello.c
$ tla changes
* looking for octopus@bluegate.org--2004/hello--proj--1.0--patch-1 to
compare with
* comparing to octopus@bluegate.org--2004/hello--proj--1.0--patch-1
M  hello.c
$ ls
hello.c  {arch}
$

CVS対応コマンド

なし

名前

tla changes — プロジェクトツリーのローカルな変更点の表示

用法

tla changes [options] [revision] [-- limit...]

説明

DIR にあるプロジェクトツリー(または現在のディレクトリ) と REVISION との間の差分をパッチ形式で表示します。デフォルトのリビジョンは、プロジェクトツリーにある指定されたバージョンに関するパッチログのうちで一番最後のものになります。デフォルトのアーカイブとバージョンは "tla tree-version" で表示されるものが利用されます。このコマンドは自分の加えた修正点を確認するためによく利用されます。重要なコマンドの一つです。

別名

なし

変更: `[----]`

スイッチ

-A, --archive     Override `my-default-archive'.
-d, --dir DIR     Change to DIR first.
-o, --output DIR  Save changeset in DIR (implies --keep).
-v, --verbose     Verbose changeset report.
-q, --quiet       Suppress progress information
--diffs           Include diffs in the output.
-k, --keep        Don't remove the output directory
                    on termination.

例

tla undo, tla redo の例を参照してください。

CVS対応コマンド

なし

名前

tla file-diffs — ファイルに対するローカルな変更点の表示

用法

tla file-diffs [options] file [revision]

説明

FILE と、キャッシュにされた REVISION 中の対応するファイルとの差異を表示します。指定したバージョンのデフォルトのパッチレベルはプロジェクトツリーにあるそのバージョンのパッチで一番最後のものです。デフォルトアーカイブとデフォルトバージョンは "tla tree-version" で表示されるものになります。

別名

なし

変更: `[----]`

スイッチ

-A, --archive   アーカイブを明示的に指定します
-N, --new-file  存在しないファイルをゼロバイトのファイルとして扱います

例

特定のファイルに対する修正点を表示します。これは GNU diff コマンドの出力と同じ形のものです。

$ tla file-diffs hello.c
--- orig/hello.c
+++ mod/hello.c
@@ -1,4 +1,4 @@
-main()
+void main(int argc, char* argv[])
 {
        printf("hello world\n");
 }
$

CVS対応コマンド

なし

プロジェクトツリーインベントリコマンド

ここでは GNU arch 独自の概念であるインベントリを扱うためのコマンド群を説明します。インベントリは CVS など他のバージョン管理システムでは、少なくとも明示的には存在しない概念です。インベントリとは一言で言うと「ファイルの名称が変更されてもその変化を追跡し続けるためのしくみ」のことです。この仕組みを実現するためにバージョン管理対象となるファイルのすべてにインベントリid と呼ばれるお互いを区別するキーが割り当てられます。GNU arch はこのキーを手がかりにして、マージ処理などで名前の違う二つのファイルが同一起源のものであるかどうかを判別します。

名前

tla inventory — プロジェクトツリーのインベントリ一覧

用法

tla inventory [options] [--] [dir]*

説明

プロジェクトツリーのインベントリの一覧を表示します。オプションを指定することでインベントリidで管理されているファイル以外のファイルも表示することができます。プロジェクトツリー中のファイルは、インベントリidの付与規則や、{arch}管理領域にある=tagging-method ファイル、そのほかの制御ファイルの状態によっていくつかのグループに分類されます。この規則は歴史的な経緯もあって非常に複雑ですが、tla inventory コマンドを使えばそれぞれのファイルがどのグループに分類されているかを確認することができます。

-r または --report を使うと、カテゴリオプション (--sourceなど)はそれらのファイルにたいしてのみ表示するようになります。オプションがなければすべてのセクションとファイルを含んだ内容が表示されます。-d, -f, -b オプションは相互に排他的です。ディレクトリが precious, junk, unrecognized である場合はディレクトリ名称自身のみが表示されます—その内容は検索されません。

すべてのコマンドオプションは対応するカテゴリオプションを暗黙に含んでいます(たとえば "--source-command" は "--source"を含みます)。コマンドの終了ステータスは無視されます。

このコマンドは、プロジェクトツリーの初期インポート時によく利用されます。初期インポート時にはどのファイルがソースファイル、つまりバージョン管理対象として GNU arch が認識するかが非常に重要になるからです。またインポート後でもすべてのソースコードに対して一括した処理をしたいような場合にunixのxargsコマンドとの組み合わせでよく利用されます。また tla tree-lint がエラーになる場合には、このコマンドの表示で詳しい原因がつかめるのが普通です。

別名

なし

変更: `[----]`

スイッチ

このコマンドは非常に豊富なスイッチがあります。

-s, --source        ソースファイルの一覧を表示します
-p, --precious      プレシャスファイルの一覧を表示します
-b, --backups       バックアップファイルの一覧を表示します
-j, --junk          ジャンクファイルの一覧を表示します
-u, --unrecognized  アンレコグナイズファイルの一覧を表示します
-t, --trees         ネストしたツリーのルートの一覧を表示します

-d, --directories   ディレクトリのみを表示します
-f, --files         ディレクトリ以外のファイルのみを表示します
-B, --both          ディレクトリとファイルの両方を表示します
--kind              ファイル種別を表示します

--all               GNU arch 管理領域のファイルも表示します
--nested            ネストしたツリーも表示します

--ids               id と共に表示します (ソースファイルのみ)
--untagged          id のないファイルも表示します

--explicit          明示的なidを使います
--implicit          暗黙のidを認めます
--tagline           タグラインidを認めます
--names             名前ベースのファイルidを使います

例

プロジェクトのルートに ,,undo-1 というディレクトリがありますが、これがソースファイルとして認識されないことを確認しています。",," で始まるファイルはすべて無条件にジャンクファイルとして扱われるという規則があります。ファイルの分類とインベントリについては(XXX)を見てください。

$ ls
,,undo-1  hello.c  {arch}
$ tla inventory
S  hello.c
$

もう一つの例は、プロジェクトツリーのソース全体を一つにまとめて、リリース用 tar ファイルを作るような場合です。説明のために tools.c というファイルを追加してあります:

$ ls
,,undo-1  hello.c  tools.c  {arch}
$ tla inventory -s  | tar -T- -zcvf release.tar.gz
hello.c
tools.c
$ ls
,,undo-1  hello.c  release.tar.gz  tools.c  {arch}
$ tar ztvf release.tar.gz
-rw-rw-r-- foo/foo          91 2004-04-05 14:23:06 hello.c
-rw-rw-r-- foo/foo          54 2004-04-05 14:29:31 tools.c

ソースコード中の文字列を検索します。この場合単純に find プログラムと grep コマンドを組み合わせると {arch}内のファイルなども検索対象となってしまいます。tla inventory と xargs コマンドを組み合わせて以下のようにするとうまくいきます。たとえばソースコード中の "#ifdef" 行全体を取得したい場合なら:

$ tla inventory -s | xargs -l grep -nH ifdef
hello.c:6:#ifdef
tools.c:2:#ifdef
tools.c:8:#ifdef
$

CVS対応コマンド

なし

名前

tla tree-lint — プロジェクトツリーの整合性をチェックします

用法

tla tree-lint [options] [dir]

説明

失われたファイル、タグづけされていないファイル、重複したインベントリid、そして名前規約で認識することができないファイルを調べます。デフォルトではこれらのテストで失敗するすべてのファイルを一覧表示します。オプションでどれか特定のテストを明示的に有効にするとそれ以外のテストは省略されます。つまり引数なしの tla tree-lint は tla tree-lint -sutmd と同じです。

別名

なし

変更: `[----]`

スイッチ

-s, --broken-symlinks     壊れたシンボリックリンクの一覧を表示します
-u, --unrecognized-files  名前規約に違反しているファイルの一覧を表示します
-t, --untagged-files      インベントリidがないファイルの一覧を表示します
-m, --missing-files       ファイルに対応しないインベントリidの一覧を表示します
-d, --duplicate-ids       重複したインベントリidの一覧を表示します
--strict                  異常があった場合にゼロ以外の終了ステータスで抜けます

例

プロジェクトツリー中に hello.c という唯一のファイルがあります。このファイルはタグラインによるインベントリidを持っていて、その値は i_0211e195-e8cb-4604-bfa8-8a96425b9cd2 です。もう一つのソースコードを作成するため、スクラッチから作らず hello.c をコピーして hello_sub.c としましたが、同じインベントリidを持つため tree-lint に怒られます。対処方法としては hello_sub.c 用に別のインベントリidを生成し arch-tag: ラインを修正するだけです。インベントリidの生成についてはXXXを見てください。

$ ls
hello.c  {arch}
$ tla inventory --ids
S  hello.c      i_0211e195-e8cb-4604-bfa8-8a96425b9cd2
$ cp hello.c hello_sub.c
…
$ tla tree-lint
Duplicated ids among each group of files listed here:

hello.c i_0211e195-e8cb-4604-bfa8-8a96425b9cd2
hello_sub.c

$

CVS対応コマンド

なし

名前

tla id — ファイルのインベントリid の表示

用法

tla id [options] file...

説明

ファイルのインベントリidを、オプションで指定した方法で表示します。

インベントリid

インベントリidは、ファイルのアイデンティティーを表すキーとなる文字列のことです。ファイルの名称は時々変わる場合があってもでも、そのファイルがそのファイルであること、つまりそのファイルのアイデンティティーは保存されると考えるのが自然です。「のりこ」さんが、「キキ」という名前で働いていたハプをやめて、「あすか」という舞妓さんになっても、のりこさんは—それなりの人生経験を積んだことは別として—やっぱりのりこさんなのです。インベントリid はこの「のりこ」に当たるものです。

インベントリidは単に他のインベントリidと区別するためだけが目的なので、お互いに衝突しない限りどのような名前を利用することもできます。ちょうどビジネスデータベースで利用される顧客id のようなものです。顧客id が A98105 の顧客についての情報は、この顧客 id を見ただけでは何もわかりません。他の顧客 id と区別するためだけに割り振られた番号だからです。

問題はどうやったらこのようなidを用意することができるか、です。XXX

インベントリidは、いろいろな名称で呼ばれます。 taglineの方法を使う場合にはarchタグと呼ばれる場合もありますし、単にインベントリと言う人もいますが、後者はあるプロジェクトツリーの含まれるファイルとインベントリidとの対応リストを指すものとして使う人もいます。文脈から判断して混乱しないようにしてください。

別名

なし

変更: `[----]`

スイッチ

--implicit      暗黙のidタグ付けの方法を使います
--tagline       タグラインのタグ付けを使います(規定値)
--explicit      明示的なタグ付けの方法を使います
--names         名前によるidタグ付けの方法を使います
--silent        ステータスのみを返し表示しません

例

hello.c という tagline でタグづけされたファイルに対して tla id コマンドを実行してみましょう:

$ ls
hello.c  {arch}
$ cat hello.c
main()
{
        printf("hello world\n");
}

/*
arch-tag: 0211e195-e8cb-4604-bfa8-8a96425b9cd2
*/
$ tla id hello.c
hello.c i_0211e195-e8cb-4604-bfa8-8a96425b9cd2
$

実験的に arch-tag 行を削除してもう一度 tla id を実行してみます:

$ cat hello.c
main()
{
        printf("hello world\n");
}

/*
   arch tag has removed.
*/
$ tla id hello.c

id: untagged file
  hello.c

$

今度は明示的なタグをつけてみましょう:

$ tla add-id hello.c
$ tla id hello.c
hello.c x_foo_bar_<octopus@bluegate.org>_Mon_Apr__5_14:56:03_2004_12028.0
$

'x_ … 以下は tla が内部的に生成した明示的なインベントリid です。他の tla ユーザのどのようなインベントリidとも衝突しないように、tla my-id の内容と、現在のシステム時刻を組み合わせたユニークな文字列を生成していることがわかります。

CVS対応コマンド

なし

名前

tla id-tagging-method — プロジェクトツリーのタグ付けの方法の表示・変更

用法

tla id-tagging-method [options] [method]

説明

DIR中(または現在のディレクトリで)のソースファイルを識別する方法を表示または変更します。変更する場合には METHODを指定しますが、これは以下のどれかになります:

表 C.1. idタグづけの方法

名前	意味
`names`	ファイルパス名だけでファイルを識別します
`implicit`	ファイルパス名でファイルを識別しますがインベントリタグによる方法も認めます
`explicit`	明示的なタグを要求します
`tagline`	パス名、明示的な方法、arch-tag:による方法、の組み合わせです

タグ付けを方法を表示させる場合、--strict オプションを指定したのにタグ付けの方法が明示的に指定されていない場合エラーが表示されます。

このコマンドはプロジェクトツリーの初期インポート時によく再設定されます。特に理由がなければ tagline の方法を使うことが推奨されますが、ユーザが意識して設定するように、デフォルトでは explicit になっています。初期インポート時にやらなくてはならない重要なことは、このコマンドの実行と {arch}/=tagging-methodの編集です。

別名

なし

変更: `[--C-]`

スイッチ

-d, --dir DIR  まず DIR に移動します
--strict       タグづけの方法が設定されない場合エラーで返ります

例

タグ付けの方法を確認し、explicit から tagline に変更します。これに応じて tla id の出力も変わります。

$ tla id-tagging-method
explicit
$ tla id-tagging-method tagline
method set: tagline
$ tla id-tagging-method
tagline
$

CVS対応コマンド

なし

名前

tla add-id — 明示的なインベントリidの追加

用法

tla add-id [options] file ...

説明

明示的なインベントリid を FILE に対して振ります。このファイルは通常のファイル、シンボリックリンク、ディレクトリ、いずれであってもかまいません。

明示的なインベントリidのありか

明示的なインベントリidは、その対象のファイルタイプによって違ってきます。通常のファイルやシンボリックリンクの場合には、そのファイルが存在する同じディレクトリ内に .arch-ids というディレクトリが作られ、そこに「ファイル名.id」という名前のファイルが作成されます。このファイルの中に元のファイルのインベントリidを保持します。インベントリidは別の場所で述べたように他と区別がつくような文字列であれば何でもかまいません。--idオプションを使って明示的に指定しなければ、以下のような文字列になります:

Foo Bar <FooBar@bluegate.org> Fri Apr  2 15:10:30 2004 12759.0

ここで先頭の部分は tla my-id コマンド設定したユーザ idで残りの部分は現在の時刻から作り出した文字列です。実際にはインベントリidは空白を含んではいけないという規則があるのでチェンジセット内部に記録される時点で空白はアンダースコア ('_')に変換されます。

インベントリidが付与されるファイルがディレクトリである場合には、そのディレクトリ中の .arch-ids ディレクトリに =idという名前の特別なファイルが作成され、その中にインベントリidが保存されます。形式については上で示したものと同一のものになります。

具体的にどんなインベントリidが振られたかは tla inventory --ids を実行すればいつでも知ることができます。

別名

なし

変更: `[-W--]`

スイッチ

-i, --id ID    自動的に生成されるidのかわりに特定のIDを指定します

例

hello.c というファイルに明示的なタグを自動生成した結果です

$ tla add-id hello.c
$ tla id hello.c
hello.c x_foo_bar_<octopus@bluegate.org>_Mon_Apr__5_15:37:15_2004_12146.0
$

CVS対応コマンド

なし

名前

tla delete-id — 明示的なインベントリidを削除します

用法

tla delete-id [options] file ...

説明

FILE に付与されていた明示的なインベントリidを削除します。ファイルは通常ファイル、シンボリックリンク、ディレクトリのいずれでもありえます。

別名

なし

変更: `[-W--]`

スイッチ

なし

例

すでに振られていた明示的なタグを削除します。hello.c には arch-tag によるタグが振られていたので削除後はこちらが有効になっているのがわかります。

$ tla id hello.c
hello.c x_foo_bar_<octopus@bluegate.org>_Mon_Apr__5_15:37:15_2004_12146.0
$ tla delete-id hello.c
$ tla id hello.c
hello.c i_0211e195-e8cb-4604-bfa8-8a96425b9cd2
$

CVS対応コマンド

なし

名前

tla move-id — 明示的なインベントリidの移動

用法

tla move-id [options] from to

説明

FILE に付与されている明示的なインベントリid を別のファイルのインベントリidに移動します。このコマンドは、いままであるファイルを指していたインベントリidで、別のファイルを指すようにしたい場合に利用します。このコマンドはインベントリidの情報を変更するだけであって、指されているファイルの名称を変更するのではないことに注意してください。指されているファイルの名称を変更すると共に、そのインベントリも移動させるtla mv との違いに注意してください。tla move-id は tla mv よりも原始的です。このコマンドを利用するのは非常に稀です。

別名

なし

変更: `[-W--]`

スイッチ

なし

例

あまり実践的な例ではありませんが、foo.c と bar.c という二つの明示的なタグをもつファイルがプロジェクトツリーにあるとしましょう。いま patch-3 の状態にあり、ここからローカルな修正は加えていません。

$ ls
bar.c  foo.c  {arch}
$ tla inventory --ids
S  bar.c  x_foo_bar_<octopus@bluegate.org>_Mon_Apr__5_15:48:47_2004_12194.0
S  foo.c  x_foo_bar_<octopus@bluegate.org>_Mon_Apr__5_15:48:43_2004_12193.0
$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--patch-3 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--patch-3
$

この状態で foo.c の明示的なidを bar.c に移してみます

$ tla move-id foo.c bar.c
$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--patch-3 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--patch-3
D  .arch-ids/bar.c.id
D  bar.c
=> .arch-ids/foo.c.id   .arch-ids/bar.c.id
=> foo.c        bar.c
$

コマンド実行後 tla changes の出力を見ると、foo.c というファイルが bar.c に名称変更され、さらに bar.c という元のファイルが削除されてしまったという内容になっています。これは foo.c のアイデンティティーを表すインベントリidで bar.c を指すようにしたためです。

CVS対応コマンド

なし

名前

tla mv — ファイル(あるいはディレクトリ、シンボリックリンク)を移動と、付随する明示的なインベントリidの移動

用法

tla mv [options] from to

tla mv [options] from1 from2 ... dir

説明

このコマンドは Unix コマンド mv(1) と同じ意味を持ちますが、タグづけの方法を問わず tla プロジェクトツリー中の任意のファイルの移動を正しく行います。これは明示的にタグづけされたファイル以外では mv(1)そのものですが、明示的にタグづけされたファイルの場合にはそのインベントリid情報ファイルも含めた移動を行います。これで移動後のファイルが移動前と同じインベントリidを持つことを保証します。

明示的なインベントリidを持つファイルを間違って unix コマンドの mv(1) によって移動してしまった場合には、元のインベントリid情報ファイルが孤立してしまいます。この場合でも tla move-idを利用すれば修復することができます。いずれにしてもこのコマンドはプロジェクトツリー内にしか書き込みが発生しないので、どうしてもわからなくなった場合には tla undo すれば良いだけの話しです。

別名

なし

変更: `[-W--]`

スイッチ

なし

例

いま、あるバージョンの patch-4 にいます。唯一のファイル foo.c がプロジェクトツリー内にあり、明示的なタグによってタグづけされています。

$ ls
foo.c  {arch}
$ tla inventory --ids
S  foo.c        x_foo_bar_<octopus@bluegate.org>_Mon_Apr__5_15:57:35_2004_12242.0
$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--patch-4 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--patch-4
$

ここで tla mv コマンドを使って foo.c を bar.c という名前に変更してみます。

$ tla mv foo.c bar.c
$ tla inventory --ids
S  bar.c        x_foo_bar_<octopus@bluegate.org>_Mon_Apr__5_15:57:35_2004_12242.0
$

変更後の bar のインベントリidが foo.c と同じものであることに注意してください。ここで tla changes を実行すると、GNU arch が foo.c -> bar.c のファイル名称変更を正しく認識していることがわかります。

$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--patch-4 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--patch-4
=> .arch-ids/foo.c.id   .arch-ids/bar.c.id
=> foo.c        bar.c
$

今度は unix コマンドの mv(1) で直接 foo.c を bar.c に変更してみましょう:

$ mv foo.c bar.c
$ tla inventory --ids
P? bar.c        ???
$ tla changes
* looking for octopus@bluegate.org--2004/test--proj--1.0--patch-4 to compare with
* comparing to octopus@bluegate.org--2004/test--proj--1.0--patch-4
D  foo.c

foo.c に対応した明示的なインベントリidを同時に移動しなかったので bar.c が孤立してしまいました。"P?" がこれを示しています。また foo.c から bar.c への名称変化を把握することができずに tla changes の表示で foo.c が削除されたと表示されています。

CVS対応コマンド

なし

名前

tla explicit-default — デフォルトインベントリidの表示と変更

用法

tla explicit-default [options] [ID-PREFIX]

説明

DIRあるいは現在のディレクトリにあるすべてのファイルに対して、明示的なインベントリidを持たないものに対して以下をデフォルトのインベントリidとして利用します:

ID-PREFIX__BASENAME

ここで BASENAME はファイルのベース名です。引数がなければ現在設定されている ID-PREFIX を表示します。デフォルトでは、このコマンドで ID-PREFIX を表示、削除、設定する場合、いずれも「強いデフォルト」が操作対象となります。強いデフォルトとは、暗黙のインベントリidを上書きする性質をもったデフォルトインベントリidです。

--weak を指定すると明示的なインベントリidによって上書きされるような「弱いデフォルト」を設定、あるいは表示します。--dont-care オプションを指定すると、該当ディレクトリに、"tla tree-lint"のようなコマンド時に表示されないような unidged files (XXX)を設定(あるいは -d オプションが指定されていればクリア)されます。

別名

なし

変更: `[-W--]`

スイッチ

-D, --dir DIR    cd to DIR first
-d, --delete     remove the default
-s, --strong     use the strong default (default)
-w, --weak       use the weak default
--dont-care      use the dont-care default

例

CVS対応コマンド

なし

名前

tla id-tagging-defaults — =tagging-method のデフォルト内容の表示

用法

tla id-tagging-defaults [options]

説明

=tagging-method ファイルを初期化する際に利用されるテンプレートの内容を表示します。

注意

=tagging-methodファイルは、プロジェクトツリーの {arch}管理領域に置かれるファイルで、[1]インベントリidのタグづけ方法の指定と、[2]プロジェクトツリー内のどのファイルをバージョン管理対象とするか、についての設定をするためのものです。ファイルの名前とはうらはらに[2]の役割も担っていることに注意してください。

別名

なし

変更: `[----]`

スイッチ

なし

例

単に引数なしで実行すれば、=tagging-method ファイルのデフォルト値が得られます。

$ tla id-tagging-defaults
# id tagging method
#
# This determines how "inventory ids", strings conveying
# logical file identity, are computed for each file, directory

    …

source ^[_=a-zA-Z0-9].*$

# Any files not classified by the above rules are classified as unrecognized.
# Traversal does not descend into unrecognized directories.

$

CVS対応コマンド

なし

パッチセットコマンド

この節のコマンドはある意味で GNU arch コマンドの中でもっと基本的で、もっとも原始的なコマンドです。いわば GNU arch の心臓ともいうべきコマンド群です。その内容は、二つのツリーの差分を計算しチェンジセットとして求めること、逆にそのように得たチェンジセットを元のツリー、あるいは別の任意のツリーに対して適用するコマンドです。GNU diff, GNU patch を一般化したコマンドであると考えればよいでしょう。単にツリーと書いたことに注意してください。ここにはまだ「プロジェクトツリー」の概念も、「リポジトリ」のような概念も現れません。あるのは生のツリーだけです。この節のコマンドは任意のツリーに対して適用することができるものなのです。

名前

tla changeset — チェンジセットの計算

用法

tla changeset [options] ORIG MOD DEST [files]

説明

二つのツリー間のチェンジセットを求めます。引数 ORIG と MOD はいずれもディレクトリで両者の間のチェンジセットがディレクトリDESTに求まります。DESTはあらかじめ存在してはなりません。これとちょうど逆の処理にあたる tla apply-changeset も見てください。

注意

チェンジセットは GNU patch を拡張した概念なので、文脈からその意味がはっきりする場合には単にパッチと呼ぶこともあります。GNU patch は単一のファイルですが、チェンジセットはディレクトリとして定義されていることに注意してください。これはプログラムで扱いやすかったためたまたまそのように設計されただけで深い意味はありません。これと等価の単一ファイルのチェンジセット—これをシリアル化チェンジセットといいます—を定義することは、GNU arch の興味深い拡張になるでしょう。

別名

mkpatch

変更: `[----]`

元のツリーには変更はありませんが、新しい DEST というディレクトリが作られ、そこには書き込みます。

スイッチ

--file-list FILES      指定したファイルについての差分のみを記録します

例

あまり実践的な例ではありませんが説明のために二つのディレクトリ a, b を用意しました。いずれのディレクトリにも file1.txt という名前の唯一のファイルがあります。b のほうにあるものは a にあるものに一行追加しただけのものです。

$ ls
a  b
$ ls
a  b
$ find
.
./a
./a/file1.txt
./b
./b/file1.txt
$ cat a/file1.txt
aaaaa
bbbbb
$ cat b/file1.txt
aaaaa
bbbbb
ccccc
$

このふたつのディレクトリ a, b の間の差分をチェンジセットの形でディレクトリ c に求めてみます。

$ tla changeset a b c
M  file1.txt
$ ls
a  b  c
$

ディレクトリ c が作成されました。このディレクトリは GNU arch で定義されたチェンジセットの形式になっています。

$ ls c
mod-dirs-index              new-files-archive  original-only-dir-metadata
mod-files-index             orig-dirs-index    patches
modified-only-dir-metadata  orig-files-index   removed-files-archive

今回場合、一番重要な情報は patches ディレクトリの中にあります。

$ ls c/patches
file1.txt.patch
$ cat c/patches/file1.txt.patch
--- orig/file1.txt
+++ mod/file1.txt
@@ -1,2 +1,3 @@
 aaaaa
 bbbbb
+ccccc
$

確かにファイルの差分が格納されています。この例で、引数として与えた a, b のディレクトリはプロジェクトツリーではなく一般的なディレクトリであることに注意してください。このコマンドは任意のツリーの間のチェンジセットを計算することができます。

CVS対応コマンド

なし

名前

tla apply-changeset — チェンジセットの適用

用法

tla apply-changeset [options] CHANGESET TARGET

説明

CHANGESET にあるチェンジセットを TARGET に適用します。 CHANGESETはGNU arch チェンジセットの定義を満たす形のディレクトリ、TARGET は任意のディレクトリです。

不完全パッチ

チェンジセットに関するもっとも困難な問題に不完全パッチの問題があります。二つのディレクトリ ORIG と MOD の間から求めたチェンジセット C を ORIG に対して適用すれば MOD が求まります。これは当たり前です。そのようにチェンジセットを定義したからです。問題は C を ORIG とは別のツリー XYZZY に適用したらどうなるか、です。もっと厳密に言うと、C を ORIG 以外のツリーに適用するという演算にうまく意味を持たせることができるか、そして持たせることができるとしたら、その結果はどのように定義されるか、です。

これは非常に難しい問題であることがわかっています。直感的には ORIG と「よく似た」ツリーに適用すれば MODと「よく似た」ツリーが得られる形に定義することです。しかしこんどはこの「よく似た」というのを厳密に形式化するのか難しいのです。

不完全パッチの問題はまだ誰も完全に解いてはいませんが、 GNU arch の apply-changeset はこれにたいしてある程度良い結果が出るような形の動作をしてくれます。

別名

dopatch

変更: `[----]`

このコマンドにはプロジェクトツリーの概念が現れないので上記の形でうまく表現できませんが、引数 TARGET のツリーには書き込みがおこります。

スイッチ

-N, --forward  pass the --forward option to `patch'
-r, --reverse  Apply the changeset in reverse

例

tla changeset の例での続きです。いま、a, b, c というディレクトリがあり、a と b の差分のチェンジセットが c にあります。この c を a に適用してみます。

$ ls
a  b  c
$ tla apply-changeset c a
M   file1.txt
$

これで a は b と同じツリーになっているはずです:

$ diff -ur a b
$

確かにそうなっています。

CVS対応コマンド

なし

名前

tla show-changeset — チェンジセットの内容を可読形式で表示

用法

tla show-changeset [options] [dir]

説明

チェンジセットの要約を人間が読める形式で表示します。

別名

なし

変更: `[----]`

スイッチ

--diffs        include diff output

例

tla changeset, tla apply-changeset の例でできたチェンジセット c をこのコマンドで表示してみます:

$ ls
a  b  c
$ tla show-changeset c
* modified files

    file1.txt

$

より詳細な情報が欲しい場合には --diffs オプションを指定します:

$ tla show-changeset --diffs c
* modified files

--- orig/file1.txt
+++ mod/file1.txt
@@ -1,2 +1,3 @@
 aaaaa
 bbbbb
+ccccc

$

CVS対応コマンド

なし

アーカイブトランザクションコマンド

このグループのコマンドはアーカイブに新しいバージョン用の場所を確保したり、そこに実際のデータを初期インポートしたり、その後におきた修正点をコミットしたりするような、アーカイブに対する書き込み処理と、逆にすでにアーカイブにある特定のリビジョンの内容をプロジェクトツリーの形に取り出したり、あるリビジョンと次のリビジョンの差分であるチェンジセットをその固有のディレクトリ形式で抽出したりするコマンドです。

名前

tla make-archive — 新しいアーカイブディレクトリの作成

用法

tla make-archive [options] [name] location

説明

NAME はアーカイブのグローバルな名前です。それは完全な emailアドレスの形で始まり、その後にオプションとして "--"と、文字、数字、'.'、'-'の任意の並びを続けることができます。-- mirrorオプションをつけると、新しいアーカイブを MASTERのミラーとして登録します。ミラーに対しては通常のコミットは失敗しますが、'tla archive-mirror'コマンドを使ってMASTERの内容をミラーに同期することができます。

二つの特別な利用方法があります以下のコマンド

tla make-archive --mirror MASTER LOCATION

は、以下と同じ意味になります:

tla make-archive --mirror MASTER MASTER-MIRROR LOCATION

そのため、"tla archive-mirror MASTER"は MASTERからの内容を新たに作ったミラーに反映することになります。

さらに以下のコマンド:

tla make-archive --mirror-from MASTER-SOURCE LOCATION

は、以下と同じ意味になります:

tla make-archive --mirror MASTER-SOURCE MASTER LOCATION

そのため、"tla archive-mirror MASTER"は MASTER-SOURCE からの変更を新たに作ったミラーに反映することになります。

ティップ

make-archive と似たコマンドに register-archive があります。これは既存のアーカイブロケーションとアーカイブ名を結び付けるだけのコマンドです。make-archive はアーカイブ領域を初期化すると同時に登録もします。そのため make-archive したアーカイブはあらためて register-archive する必要はありません。

アーカイブはローカルファイルシステムのどの場所にも作成することができますが、今後複数のアーカイブを作るかも知れないことを見越してアーカイブ専用の空のサブディレクトリを作り、そこに作成することが推奨されています。またこのサブディレクトリ名称は{archives}のような名前が良いとされていますが、通常の文字のみを含むような名前でももちろん全くかまいません。

このコマンドはアーカイブの入れ物を作るだけで、まだ何も含まれていません。具体的なバージョン管理を始める場合には、 tla archive-setup などのコマンドを使って、このアーカイブ中にバージョンを作成する必要があります。こうしてできたアーカイブバージョンが開発ラインの入れ物になります。通常make-archiveコマンドはそれほど頻繁には利用しません。archive-setupコマンドのほうは新しい管理対象の開発ラインをアーカイブに追加するたびに呼び出されます。

別名

なし

変更: `[A---]`

スイッチ

-m, --mirror MASTER              create mirror of specified archive
-M, --mirror-from MASTER-SOURCE  create pull-based mirror of specified archive
-l, --listing                    Keep .listing files up-to-date in this archive.
-s, --signed                     GPG sign the contents of this archive.

例

すでに octopus@bluegate.org--2004 というアーカイブがあり、それとは別の用途、たとえばプライベートなアーカイブを作ることにしましょう。

$ pwd
/home/foo
$ ls
Maildir  cset  proj  {archives}
$ tla archives
octopus@bluegate.org--2004
    /home/foo/{archives}/octopus@bluegate.org--2004
$ ls /home/foo/\{archives\}/
octopus@bluegate.org--2004
$ tla make-archive octopus@bluegate.org--2004-private
	  /home/foo/\{archives\}/octopus@bluegate.org--2004-private
$ tla archives
octopus@bluegate.org--2004
    /home/foo/{archives}/octopus@bluegate.org--2004
octopus@bluegate.org--2004-private
    /home/foo/{archives}/octopus@bluegate.org--2004-private

警告

この例ではいずれのアーカイブも、アーカイブ名と実際のアーカイブ位置のディレクトリの名前が等しくなっています。 GNU arch ではこのように必ず二つの名称を一致させなくてはならないという決まりはありませんが、名前に関する混乱をできるだけ避けるために特に理由がなければ名前を同じにしておくと良いでしょう。

CVS対応コマンド

なし

名前

tla archive-setup — 新しいカテゴリ、ブランチ、バージョンの作成

用法

tla archive-setup [options] [version ...]

説明

指定したカテゴリ、ブランチ、バージョンをアーカイブに作ります。たとえば空のアーカイブを指定せずに以下を実行すると:

$ tla archive-setup  proja--devo--1.0 projb

tla my-default-archive で示されるアーカイブに、アーカイブバージョン proja--devo--1.0 とカテゴリ projb を作成します。--file オプションが指定されると作成されるアイテムのリストがファイルから読み込まれます('-'を指定すると標準入力からになります)。--file オプションは同時に --branches も指定することができますが、この場合入力は一行につきふたつのカラムが必要です—作成しようとしているバージョンとそこにタグづけする際の元になるバージョンです。たとえば以下のような行を含むファイル:

proja--devo--1.0  his@foo.com/proja--devo--1.0

これを--branchesオプション付きで実行すると archive-setupコマンドはでデフォルトアーカイブ中に proja というバージョンを作り、そこに base-0 リビジョンを作りますが、これはhis@foo.com のアーカイブにある最後のリビジョンへのタグとします。この機能は、既存のアーカイブからのブランチを新しいアーカイブ中に一度にまとめて作成するような場合に便利です。

最後のリビジョン

コマンド引数の説明中に、よく、「最後のリビジョン」とか、「最新のリビジョン」とか「直近のりビジョン」のような言葉が出てきます。あるアーカイブバージョンの「最後のリビジョン」とは、そのアーカイブバージョンを A/C--B--V としたときに、tla revisions A/C--B--V を実行た場合に最後に表示されるリビジョンのことを言います。こんな回りくどい言葉を使う理由はリビジョンには base-0, patch-n, version-0, versionfix-n のようなさまざまな形式があり、最後のリビジョンがこれらのうちのどの形で終わっているかは状況によって異なるためです。

このような混乱を避けて議論する場合には、「リビジョン番号」という言葉を使います。リビジョン番号とは tla revisions A/C--B--V の出力行に上から順番に番号を振って言った場合の番号のことを言うと約束します。ここで一番最初のリビジョン番号をゼロである、と規約します。これで「最後のリビジョン」とは、最大のリビジョン番号を持つリビジョン名のこと、という形で明瞭に言い表すことができます。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive    Override `my-default-archive'
-f, --file FILE  read the list of desired versions from FILE
-b, --branches   make base-0 tags
-c, --cache      archive cache when creating base-0 tags

例

hello--proj--1.0 というバージョンのみを持っている octopus@bluegate.org--2004アーカイブに bug--goo--1.0 というバージョンを追加してみましょう:

$ tla abrowse
octopus@bluegate.org--2004
  hello
    hello--proj
      hello--proj--1.0
        base-0 .. patch-5

$ tla archive-setup bug--goo--1.0
* creating category octopus@bluegate.org--2004/bug
* creating branch octopus@bluegate.org--2004/bug--goo
* creating version octopus@bluegate.org--2004/bug--goo--1.0
$ tla abrowse
octopus@bluegate.org--2004
  bug
    bug--goo
      bug--goo--1.0

  hello
    hello--proj
      hello--proj--1.0
        base-0 .. patch-5

$

アーカイブの内部をざっと見るには tla abrowse を使うのが常套手段です。

CVS対応コマンド

なし

名前

tla make-category — 新しいカテゴリの作成

用法

tla make-category [options] category

説明

指定したアーカイブ中に新しいカテゴリ CATEGORY を作ります。あらかじめそのカテゴリが存在していてはいけません。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive  Override `my-default-archive'

例

省略します。かわりに tla archive-setup を利用することをお勧めします。

CVS対応コマンド

なし

名前

tla make-branch — 新しいブランチの作成

用法

tla make-branch [options] branch

説明

指定したアーカイブに新しいブランチ BRANCH を作ります。同じ名前のブランチがカテゴリに存在していてはいけません。 BRANCH は C--B のように指定します。ここで C はカテゴリ名、B はブランチ名です。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive  Override `my-default-archive'

例

省略します。かわりに tla archive-setup を利用することをお勧めします。

CVS対応コマンド

なし

名前

tla make-version — 新しいバージョンの作成

用法

tla make-version [options] version

説明

指定したアーカイブに VERSION という名前のバージョンを作ります。同じ VERSION が同一のカテゴリ、ブランチに存在していてはいけません。VERSION の指定は C--B--V のようにします。ここで C, B, V はそれぞれカテゴリ名、ブランチ名、バージョン名です。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive  Override `my-default-archive'

例

省略します。かわりに tla archive-setup を利用することをお勧めします。

CVS対応コマンド

なし

名前

tla import — ソースコード全体を含む完全な base-0 リビジョンを作ります

用法

tla import [options] [[archive]/version]

説明

DIR(あるいは現在のディレクトリ)にあるプロジェクトツリーの最初のリビジョンを保存します。新規にプロジェクトを始める時には常にこのコマンドを使います。--summary なしで --log-message を指定すると TEXT がログのタイトルと本体の両方に利用されます。

プロジェクトの始め方

プロジェクトを開始する場合、新規に作られるか、既存のプロジェクトから分岐させるか、のどちらかしかありません。最初の場合には tla import を使います。後の場合には tla tag を使います。プロジェクトを分岐させる場合、分岐元のアーカイブの管理者には(特殊な設定のような)作業は全く発生しません。元アーカイブの所有者はあなたが分岐したアーカイブバージョンを作ったことに気づきすらしないでしょう。CVS のような集中型のシステムの場合、元のリポジトリに対する書き込みアクセス権限などが必要になることに注意してください。GNU arch での分岐行為は誰にも頭を下げる必要がないのです。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive           Override `my-default-archive'.
-d, --dir DIR           Change to DIR first.
-l, --log FILE          Commit with log file FILE.
-s, --summary TEXT      log with summary TEXT plus log-for-merge output
-L, --log-message TEXT  log with TEXT
-S, --setup             Use `make-archive' if necessary.

例

以下は新しい開発ラインを始める時の典型的なセッションです。話しを簡単にするために names によるタグづけを選択しました。実際のプロジェクトでは特に理由がなければ tagline によるタグづけを利用することを推奨します。この場合、各ソースファイルの最後か先頭に arch-tag: でタグを埋め込みましょう。詳しくはXXXを見てください。

$ ls
main.c  main.h  tool.c  tools.h
$ tla archive-setup proj2--devo--1.0
* creating category octopus@bluegate.org--2004/proj2
* creating branch octopus@bluegate.org--2004/proj2--devo
* creating version octopus@bluegate.org--2004/proj2--devo--1.0
$ tla init-tree proj2--devo--1.0
$ ls
main.c  main.h  tool.c  tools.h  {arch}
$ tla inventory
P? main.c
P? main.h
P? tool.c
P? tools.h
$ tla id-tagging-method names
method set: names
$ tla inventory
S  main.c
S  main.h
S  tool.c
S  tools.h
$ tla import
* imported octopus@bluegate.org--2004/proj2--devo--1.0
$ tla abrowse
octopus@bluegate.org--2004
  hello
    hello--proj
      hello--proj--1.0
        base-0 .. patch-5

  proj2
    proj2--devo
      proj2--devo--1.0
        base-0

$

CVS対応コマンド

なし

名前

tla commit — チェンジセットベースのリビジョンを保存します

用法

tla commit [options] [[archive]/version] [--
file ...]

説明

DIR(あるいは現在のディレクトリ)にあるプロジェクトツリーの次のリビジョンを作ります。このリビジョンは内部的には直前のリビジョンとの間の差分を示すチェンジセットの形をしています。自動化された ChangeLog ファイルがある場合チェンジセットの計算の前にこれらに対する更新がまず発生します。--log-messages が --summary オプションなしに指定された場合 TEXT はログのタイトルと本体の両方に利用されます。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive           Override `my-default-archive'
-d, --dir DIR           cd to DIR first
-l, --log FILE          commit with log file FILE
-s, --summary TEXT      log with summary TEXT plus log-for-merge output
-L, --log-message TEXT  log with TEXT plus log-for-merge output
--strict                strict tree-lint
--seal                  create a version-0 revision
--fix                   create a versionfix revision
--out-of-date-ok        commit even if out of date
--file-list FILE        commit only changes to files listed in FILE

例

ログメッセージをエディタでいちいち書くのが面倒な場合には -L オプションを使ってコマンドラインでログ内容を指定することもできます:

$ ls
main.c  main.h  tool.c  tools.h  {arch}
$ tla commit -L"add another function to main.c"
M  main.c
* update pristine tree
(octopus@bluegate.org--2004/proj2--devo--1.0--base-0 =>
proj2--devo--1.0--patch-1)
* commited octopus@bluegate.org--2004/proj2--devo--1.0--patch-1
$

CVS対応コマンド

なし

名前

tla get — 指定したリビジョンのプロジェクトツリーを作ります

用法

tla get [options] revision [dir]

説明

REVISION をアーカイブから抽出し、ディレクトリ DIR に新しいプロジェクトツリーを作ります。DIRが指定されなければ、リビジョンの絶対名を持つようなサブディレクトリが現在のディレクトリに作成されます。どのような場合でもプロジェクトツリーとなるディレクトリはあらかじめ存在していてはいけません。

警告

--link オプションを利用する場合には、開発に利用するエディタがコピー・オン・ライト機能を使ったものであることを確認してください。さもなければリビジョンライブラリが壊れてしまうでしょう。

tla get と tla tag

既存のリビジョンのプロジェクトツリーを作るには二つの方法があります。tla get を使う方法と tla tag を使う方法です。大きな違いは tla tag を使えば取得後のリビジョンに対する修正後に、独自のコミット可能な領域を得ることができるというところです。これにたいして tla get で取得したリビジョンは、これが最後のリビジョンでない限り、一般にはコミットすることができません。tla get はりビジョンの内容をざっと参照したいような場合に、tla tag はそのリビジョンを分岐して本格的な作業がしたい場合に適しています。ところで tla get した後に元となったアーカイブが存在しているマシンにアクセスできなくなっても、プロジェクトツリーのみの情報を使って新たなアーカイブバージョンを「後から」分岐させることができます。このテクニックについては別のところで説明します。

別名

なし

変更: `[-W--]`

プロジェクトツリーが新たに作られるので当然書き込みがおこりますが、新規のディレクトリを作りそこに書き込むことが保証されています。

スイッチ

-A, --archive      Override `my-default-archive'
--cache DIR        cache root for trees with pristines
--no-pristine      don't save a pristine copy
--link             hardlink files to revision library instead of copying
--library          ensure the revision is in a revision library
--sparse           add library entries sparsely (--link, --library)
--non-sparse       add library entries densely (--link, --library)
-s, --silent       no output

例

hello--proj--1.0 の最新リビジョンを取得します:

$ ls
$ tla get hello--proj--1.0
* from import revision: octopus@bluegate.org--2004/hello--proj--1.0--base-0
* patching for revision: octopus@bluegate.org--2004/hello--proj--1.0--patch-1
* patching for revision: octopus@bluegate.org--2004/hello--proj--1.0--patch-2
* patching for revision: octopus@bluegate.org--2004/hello--proj--1.0--patch-3
* patching for revision: octopus@bluegate.org--2004/hello--proj--1.0--patch-4
* patching for revision: octopus@bluegate.org--2004/hello--proj--1.0--patch-5
* making pristine copy
* tree version set octopus@bluegate.org--2004/hello--proj--1.0
$ ls
hello--proj--1.0--patch-5
$ cd hello--proj--1.0--patch-5/
$ ls
foo.c  {arch}
$

カレントディレクトリに直接取得するのではなく、かならず新しいサブディレクトリを作ってからリビジョンを展開していることに注意してください。

CVS対応コマンド

なし

名前

tla get-changeset — アーカイブからチェンジセットを抽出します

用法

tla get-changeset [options] revision [dir]

説明

REVISION で指定されたチェンジセットを抽出し DIR で指定したディレクトリに保存します(あるいは REVISION.patches という名前のディレクトリに保存します)。DIR はあらかじめ存在していてはいけません。

リビジョン名の二つの意味

たとえば、patch-12 というリビジョン名があったとします。これは正確には何を意味しているのでしょうか? 答えは二つです。まず、最初のリビジョンから patch-12 にいたるまでのすべてのチェンジセットを随時適用して得られるリビジョンを意味します。しかし、リビジョン patch-11 と patch-12 の差分であるチェンジセットのことも意味します。tla get では最初の意味だと解釈されます。tla get-changeset では二番目の意味であると解釈されます。混乱しないようにしてください。

チェンジセット patch-12 には二つの能力があります。一つはリビジョン patch-11 に適用して、リビジョン patch-12 を得ること。もう一つはリビジョン patch-12 に逆向きに適用して、リビジョン patch-11 を得ることです。このような GNU arch のチェンジセットの性質を「チェンジセットの可逆性」と言います。

別名

なし

変更: `[----]`

新しいディレクトリを作って、そこに対する書き込みは発生します。

スイッチ

-A, --archive  Override `my-default-archive'

例

tla get と同様ですが、リビジョン全体ではなくチェンジセットを取り出してみます:

$ ls
hello--proj--1.0--patch-5
$ tla get-changeset hello--proj--1.0--patch-5
$ ls
hello--proj--1.0--patch-5  hello--proj--1.0--patch-5.patches
$ ls hello--proj--1.0--patch-5.patches/
mod-dirs-index              new-files-archive  original-only-dir-metadata
mod-files-index             orig-dirs-index    patches
modified-only-dir-metadata  orig-files-index   removed-files-archive
$

今度は hello--proj--1.0--patch-5.patches という名前のサブディレクトリを作り、そこにチェンジセットの内容を展開しています。通常の基本的な GNU arch の利用ではチェンジセットを明示的に扱うことはあまりありません。

CVS対応コマンド

なし

名前

tla lock-revision — アーカイブリビジョンのロック(アンロック)

用法

tla lock-revision [options] revision

説明

REVISION を作成するために必要なロックを獲得します。リビジョンは最新のリビジョンの次のリビジョンを指定しなくてはなりませんが、パッチが一つも存在しない場合には無条件に獲得することができます。リビジョンが指定されなければ最新のリビジョンがロックされます。(XXX)

このコマンドは非常に低レベルのもので、GNU arch の基本的な操作ではほとんど利用されることはありません。

別名

なし

変更: `[???---]`

スイッチ

-A, --archive  Override `my-default-archive'
-u, --unlock   release a lock owned by you
-b, --break    break any existing lock

例

CVS対応コマンド

なし

名前

tla archive-mirror — アーカイブミラーの更新

用法

tla archive-mirror [options] [from [to] [limit]]

説明

引数を指定しなければ 'my-default-archive'-MIRROR の形のアーカイブが、'my-default-archive'の内容で更新されます。 [FROM]アーカイブを指定すると [FROM]-MIRROR の形のアーカイブが[FROM]アーカイブの内容で更新されます。[FROM]と[TO]の両方が指定されると[TO]アーカイブが[FROM]の内容で更新されます。 LIMIT を指定する場合には、カテゴリ、ブランチ、バージョン、あるいはリビジョンのいずれかでなければなりません。FROM の中の指定された部分についてのみ TO にコピーされます。

別名

なし

変更: `[A---]`

スイッチ

--no-cached        don't copy cached revisions
-s, --summary      print the summary of each patch
--cached-tags      copy only cachedrevs for tags to other archives

例

CVS対応コマンド

なし

アーカイブコマンド

このグループのコマンドはアーカイブの構成内容をさまざまな形で表示させるためのものです。いくつかの例外をのぞいて、基本的には参照のみのコマンドで、アーカイブに対する書き込みは発生しません。カテゴリ、ブランチ、バージョンなど、GNU arch の名前空間の中間で利用される名前に関するコマンドがたくさんありますが、これらは新たに作られた tla abrowse コマンドですべて同じことができます。このような意味で、tla abrowse コマンドが最も良く利用されます。

名前

tla abrowse — アーカイブの閲覧

用法

tla abrowse [options] [limit]

説明

アーカイブの構成をさまざまな角度から表示します。LIMIT を指定するとその部分についてのみ表示されます。LIMIT は完全に修飾された名前であるか、あるいはアーカイブの名前であるかも知れません。(XXX 完全に修飾された名前、の説明)

別名

なし

変更: `[----]`

スイッチ

このコマンドは非常に豊富なスイッチをとります

-A, --archive          Override `my-default-archive'
-r, --reverse          sort revisions from newest to oldest
-s, --summary          print a summary of each patch
-c, --creator          print the creator of each patch
-D, --date             print the date of each patch
-k, --kind             show each revision kind (import, changeset or id)
--desc                 implies -s -c -D -k
--local-merges         list merges from the same archive
--foreign-merges       list merges from other archives
--merges               list all merges
--categories           show category names only
--branches             show branch names only
--versions             show version names only
--omit-empty           omit empty or unchanged-since items
--since SNAP-FILE      show revisions after those listed in SNAP-FILE
--since-limits         limit output to items in the since file
--snap SNAP-FILE       record the highest revisions shown
--force                overwrite an existing snap-file

例

CVS対応コマンド

なし

名前

tla rbrowse — アーカイブの構成の表示

用法

tla rbrowse [options] [REGULAR_EXPRESSION]

説明

アーカイブの構成を表示します。指定されたアーカイブのカテゴリ、ブランチ、リビジョンが表示されます。アーカイブが指定されなければ 'my-default-archive' が利用されます。引数を世紀表現で指定することに注意してください。

別名

なし

変更: `[----]`

スイッチ

-a, --search-all  Search all archives
-A, --archive     Use [archive] instead of default

例

CVS対応コマンド

なし

名前

tla categories — カテゴリの一覧表示

用法

tla categories [options] [archive]

説明

アーカイブ中のカテゴリの一覧を表示します。このコマンドは過去互換性のためにのみ存在しています。tla abrowse を利用してください。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla branches — ブランチの一覧表示

用法

tla branches [options] [category]

説明

カテゴリにあるブランチを一覧表示します。このコマンドは過去互換性のためだけに存在しています。かわりに tla abrowse を利用してください。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla versions — バージョンの一覧表示

用法

tla versions [options] [branch]

説明

ブランチにあるバージョンを一覧表示します。このコマンドは過去互換性のためにのみ存在しています。tla abrowse コマンドを利用するようにしてください。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-r, --reverse  sort from newest to oldest

例

CVS対応コマンド

なし

名前

tla revisions — アーカイブバージョン中のリビジョンの一覧表示

用法

tla revisions [options] [version]

説明

アーカイブバージョン中のリビジョンの一覧を表示します。通常このリストは古いほうから新しい方に無かって表示されますが -r(--reverse)オプションで変更することもできます。オプションでパッチ(XXX)を指定すると、もしそのようなパッチが存在していればそれについてのみ表示されます。パッチが存在しなければ終了コード 1 で異常終了します。-r(--reverse)フラグはこのパッチ引数に影響を与えません。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-r, --reverse  sort from newest to oldest
-f, --full     list fully qualified names
-s, --summary  print a summary of each patch
-c, --creator  print the creator of each patch
-D, --date     print the date of each patch

例

CVS対応コマンド

なし

名前

tla ancestry — リビジョンのバージョン間履歴の表示

用法

tla ancestry [options] [revision]

説明

リビジョンのアーカイブバージョンをまたいだ履歴を表示します。あるアーカイブバージョンが別のアーカイブバージョンを元にして tla tag コマンドで作られた場合、この新しい方のアーカイブバージョン中のリビジョンは、自分が属しているアーカイブバージョンを越えた履歴を持つことになります。この履歴は tla revisions コマンドだけでは表示することができません。tla ancestry コマンドはこの障壁を越えて過去を表示します。

ancestry コマンドは現存しているアーカイブについてのみ過去に遡れることに注意してください。たとえば A0/C0--B0--V0 -> A1/C1--B1--V1 -> A2/C2--B2--V2 という形で順次タグづけされたアーカイブバージョンががあり、A2/C2--B2--V2--R というリビジョンが最新リビジョンであるとします。ところが A0/C0--B0--V0 にはなんらかの形ですでにアクセス不能になっているとします。この場合 tla ancestry は、A1/C1--B1--V1 までの履歴しか表示できません。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first
-m, --merges   show merges into this development line
-r, --reverse  list oldest to newest
-s, --summary  print a summary of each patch
-c, --creator  print the creator of each patch
-D, --date     print the date of each patch

例

CVS対応コマンド

なし

名前

tla ancestry-graph — リビジョンのバージョン間履歴の表示

用法

tla ancestry-graph [options] [revision]

説明

tla ancestry と同じ目的のために存在しますが、別の形式で表示します。種に歴史的な理由で残されています。

別名

なし

変更: `[----]`

スイッチ

-A, --archive    Override `my-default-archive'
-d, --dir DIR    cd to DIR first
-m, --merges     show merges into this development line
-r, --reverse    list oldest to newest
-i, --immediate  show only the immediate ancestor
-p, --previous   show the (namespace) previous revision

例

CVS対応コマンド

なし

名前

tla cat-archive-log — アーカイブログエントリ内容の表示

用法

tla cat-archive-log [options] revision

説明

アーカイブ中の指定したリビジョンのログメッセージ内容を表示します。プロジェクトツリーではなく、アーカイブから取得することに注意してください。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
--headers      show only log headers

例

CVS対応コマンド

なし

名前

tla cacherev — アーカイブに完全なソースツリーをキャッシュする

用法

tla cacherev [options] [revision]

説明

アーカイブ中の指定リビジョンの完全なコピーをキャッシュします。これはそれ以降のリビジョンに対する tla get コマンドを高速化する意味があります。リビジョンを指定しなくてもプロジェクトツリー中で実行すればそのツリーのデフォルトバージョンにある最新リビジョンがキャッシュされます。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive    Override `my-default-archive'
--cache DIR      cache root for trees with pristines

例

CVS対応コマンド

なし

名前

tla cachedrevs — アーカイブ中のキャッシュされたリビジョン一覧

用法

tla cachedrevs [options] [version]

説明

アーカイブバージョン VERSION の、どのリビジョンがキャッシュされているかを表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla uncacherev — アーカイブ中のリビジョンキャッシュを削除します

用法

tla uncacherev [options] revision [dir]

説明

アーカイブからリビジョンキャッシュを削除します。 REVISION が指定されなくともプロジェクトツリー中で実行されればそのツリーのデフォルトバージョンにある最新リビジョンに対して処理がおこります。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla archive-meta-info — アーカイブ中のメタ情報の表示

用法

tla archive-meta-info

説明

アーカイブ中のメタ情報の内容を表示します。例えば:

$ tla archive-meta-info name

は、デフォルトアーカイブの公式な名前を表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla archive-snapshot — アーカイブスナップショットの更新

用法

tla archive-snapshot [options] dir [limit]

説明

DIR ディレクトリを現在のアーカイブスナップショットで更新します。LIMIT を指定すると、その部分についてのみ更新します。アーカイブスナップショットは、アーカイブ名、カテゴリ名、ブランチ名、バージョン名がこの順序で階層化されたディレクトリと、それぞれのディレクトリにディレクトリ.add という名前のゼロバイトファイルを含んだ形のネストしたディレクトリです。さらに最後のバージョンディレクトリ中にはそのバージョンに含まれるリビジョン名.add の形のファイルがすべて含まれます。リビジョン名. addのファイルの内容だけは腔ではなく、それぞれのリビジョンのパッチログになります。具体的には以下のような形になります:

$ tla archive-snapshot .
$ find .
./octopus@bluegate.org--2004
./octopus@bluegate.org--2004/a
./octopus@bluegate.org--2004/a.added
./octopus@bluegate.org--2004/a/a--b
./octopus@bluegate.org--2004/a/a--b.added
./octopus@bluegate.org--2004/a/a--b/a--b--c
./octopus@bluegate.org--2004/a/a--b/a--b--c.added
./octopus@bluegate.org--2004/a/a--b/a--b--c/a--b--c--base-0.added
./octopus@bluegate.org--2004/a/a--b/a--b--c/a--b--c--patch-1.added
…

このコマンドは make コマンドのような外部ツールと連係して、アーカイブへの新規追加されたアイテムに対して一度だけのイベントを発生させるために利用されます。

別名

なし

変更: `[----]`

スナップショットをとるために指定したディレクトリには書き込みが発生します。

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla archive-version — アーカイブ中のアーカイブバージョン表示

用法

tla archive-version [options]

説明

GNU arch アーカイブのアーカイブ識別子を表示します。

注意

ここでアーカイブバージョン、と言っているのは A/C--B--Vのようなものではなく、アーカイブそのものの形式のことです。アーカイブは今後の GNU arch の拡張によりそれまで以上に豊富な機能や、最適化される可能性、下位互換性についての考慮が必要になってくる可能畝があります。このためアーカイブ作成時にはこのアーカイブの識別子が内部情報として埋め込まれます。tla archive-version はこの識別子を表示するものです。識別子によって条件分岐するようなプログラムは、アーカイブの形式や能力が変化した場合でも下位互換性を失わずに実行することができるようになるでしょう。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla archive-fixup — アーカイブ中の補助ファイルの修復

用法

tla archive-fixup [options]

説明

このコマンドはアーカイブを正常な状態に復帰させるための包括的な修復のために用意されたコマンドです。現時点ではこの唯一の機能はアーカイブにある .listing ファイルを修復することだけです。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

パッチログコマンド

このグループは、二つの分岐した開発ライン間でマージする時に重要になる「パッチログ」というデータ構造を扱うためのコマンド群です。マージの際にパッチログを考慮することによって一度マージしたチェンジセットをもう一度マージしてしまう、いわゆる重複マージ問題を解決することができます。GNU arch のような分散型のバージョン管理システムではさまざまな分岐関係を経由して、同じチェンジセットが別の道筋で再び現れることがあるので、パッチログは重要なデータになります。このグループのコマンドはプロジェクトツリーに対する書き込みを発生するものもありますが、アーカイブに対する書き込みをするものはありません。このためプロジェクトツリーの最後のコミット後の変更点さえ保存しておけば^[19]、実験的に実行してもアーカイブがおかしな状態になることはありません。

名前

tla make-log — 次のログファイルの用意

用法

tla make-log [options] [version]

説明

DIR にあるプロジェクトツリーのルートに必要に応じてログファイルを作ります。このログファイルは VERSION 用のものです。作成されたログファイルの名称は標準出力に表示されます。

ティップ

ログファイルの名称はバージョン管理対象となるファイル名と重ならないように、'+'文字で始まる特殊な長いものが利用されます。このログファイルを編集する場合、vi のような一部のエディタではこのファイルをファイル名とは認識できず、オプションと解釈してしまいます。vi ++ログファイル名のかわりに vi ./++ログファイル名のように先頭に './' を付加することで回避できるエディタもあるようです。詳しくはそれぞれのエディタのマニュアルを参照してください。

別名

なし

変更: `[-W--]`

パッチログファイルが作成されますがプロジェクトツリー内の既存のファイルには一切書き込みは発生しません。またパッチログファイルは常に削除可能です。削除によってプロジェクトツリーの状態が不整合を起こすことはありません。

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first

例

CVS対応コマンド

なし

名前

tla log-versions — プロジェクトツリー中のパッチログバージョンの表示

用法

tla log-versions [options]

説明

DIR または現在のディレクトリに存在しているプロジェクトツリーはアーカイブバージョンごとに分類されたパッチログを持っています。このコマンドを使うとアーカイブバージョンの一覧を表示することができます。

このアーカイブバージョンは大きく二つに分類されます。一つはプロジェクトツリー自身のデフォルトアーカイブバージョン —tla tree-version で表示されます—と、その祖先のバージョン、もう一つはそれ以外のアーカイブバージョンです。前者は tla commit コマンドなどによって自分で追加してきたパッチログが保存されている場所で、後者は他の人のチェンジセットを tla replay、tla update、tla star-merge などのコマンドにより取り込んだ結果^[20]保持しているパッチログが保存されている場所です。

別名

なし

変更: `[----]`

スイッチ

-d, --dir DIR            cd to DIR first
-a, --archive ARCHIVE    list only logs for ARCHIVE
-c, --category CATEGORY  list only logs for CATEGORY
-b, --branch BRANCH      list only logs for BRANCH
-v, --vsn VERSION        list only logs for VERSION
-r, --reverse            reverse the sort order

例

CVS対応コマンド

なし

^[20]これをチェリーピックといいます。

名前

tla add-log-version — プロジェクトツリーに対するパッチログ用のバージョン領域の追加

用法

tla add-log-version [options]
[archive]/version

説明

DIR または現在のディレクトリにあるプロジェクトツリーに、 VERSION 用のパッチログ保存領域を作ります。初期状態ではこの領域は腔になります。プロジェクトツリーのパッチログは、そのパッチログのアーカイブバージョンにツリーを追加したり、そのアーカイブバージョンからのチェンジセットで更新する場合には常に必要になります。プロジェクトツリーに記録されるバージョンは完全なアーカイブバージョン名で記録されることに注意してください。つまり、A/C--B--V の形です。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first

例

CVS対応コマンド

なし

名前

tla remove-log-version — プロジェクトツリーからのパッチログバージョンの削除

用法

tla remove-log-version [options] [archive]/version

説明

DIR または現在のディレクトリにあるプロジェクトツリーから VERSION に関するパッチログをすべて削除します。このコマンドは注意して利用してください。プロジェクトツリーからあるリビジョンの履歴を消してしまいます。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first

例

CVS対応コマンド

なし

名前

tla logs — プロジェクトツリー中の特定のバージョンにあるパッチログ一覧

用法

tla logs [options] [[archive]/version ...]

説明

VERSION から DIR または現在のディレクトリにあるプロジェクトツリーに適用されたパッチを一覧表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive         Override `my-default-archive'
-d, --dir DIR         cd to DIR first
-r, --reverse         sort from newest to oldest
-s, --summary         print the summary of each patch
-c, --creator         print the creator of each patch
-D, --date            print the date of each patch
--local-merges        list merges from the same archive
--foreign-merges      list merges from other archives
--merges              list all merges
-f, --full            print full patch level names

例

CVS対応コマンド

なし

名前

tla cat-log — プロジェクトツリー中のパッチログの内容表示

用法

tla cat-log [options] revision-spec

説明

プロジェクトツリー内にある指定のリビジョンのパッチログを抽出しその内容を表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first

例

CVS対応コマンド

なし

名前

tla changelog — パッチログの内容による ChangeLog の生成

用法

tla changelog [options] [[archive]/version]

説明

DIR または現在のディレクトリにあるプロジェクトツリーの VERSION用 ChangeLog を生成します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive               Override `my-default-archive'
-d, --dir DIR               cd to DIR first
--no-files                  exclude file lists from ChangeLog
--untagged                  don't implicitly tag the output file
--new-entry PATCH,FILE      make FILE the first (top) entry
                              for patch level PATCH

例

CVS対応コマンド

なし

名前

tla log-for-merge — マージ用ログエントリの生成

用法

tla log-for-merge [options] [[archive]/version]

説明

VERSION へのマージを記述するログエントリの本体を生成します。アーカイブ、プロジェクトツリー、いずれに対しても書き込みは発生しません。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first
-r, --reverse  sort from newest to oldest

例

CVS対応コマンド

なし

名前

tla merges — 二つの分岐がマージされた場所の報告

用法

tla merges [options] INTO [FROM]

説明

パッチレベル名(XXX)のペアを一覧表示します。(XXX):

INTO-RVN  FROM-RVN

これは INTO のパッチレベル INTO-RVN でログエントリ FROM-RVNが追加されたことを示しています。FROM はブランチ名 (XXX)、バージョン名(XXX)、またはリビジョン名(XXX)のいずれかです。ブランチ名またはバージョン名の場合、そのブランチまたはバージョンからのすべてのマージを報告します。リビジョン名の場合には指定したリビジョンのマージポイントのみが表示されます。出力は最初のカラムのパッチレベルの順序でソートされます。FROM がリビジョン名でないかぎり完全な名前で表示されます。FROM がリビジョンである場合には明示的に --full オプションを指定すればそうなります。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first
-r, --reverse  sort from newest to oldest
-f, --full     print full patch level names

例

CVS対応コマンド

なし

名前

tla new-merges — バージョンに存在しないツリー中のパッチ一覧

用法

tla new-merges [options] [[archive]/version]

説明

DIR にあるプロジェクトツリーに存在し、VERSION にはまだマージされていないすべてのパッチログエントリを表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first
-r, --reverse  sort from newest to oldest

例

CVS対応コマンド

なし

マルチプロジェクト設定用コマンド

GNU arch には複数のプロジェクトを組み合わせて一つのまとまった大きなプロジェクトを構成する機能があります。これをマルチプロジェクト機能と言います。たとえば tla や、pika と呼ばれる schema の方言もこのようなマルチプロジェクトとして管理されています。両方とも hackerlab というライブラリが必要なので、これが一つのバージョンを構成し、tla も pika もマルチプロジェクトの構成要素の一つとしてこれを利用しています。

名前

tla build-config — マルチプロジェクト設定環境の構築

用法

tla build-config [options] config

説明

指定した設定環境を実際に構築します。"tla cat-config -H"も参照してください。

別名

なし

変更: `[-W--]`

構築によりいくつかのプロジェクトツリーが作成されますがいずれも新規ディレクトリに対してです。

スイッチ

-d, --dir DIR       cd to DIR first
--no-pristines      don't create pristine copies
--link              hardlink files to revision library instead of
-copying
--library           ensure revisions are in the revision library
--sparse            add library entries sparsely (--link, --library)
-r, --release-id    overwrite ./=RELEASE-ID for this config

例

CVS対応コマンド

なし

名前

tla cat-config — マルチプロジェクト設定環境情報の表示

用法

tla cat-config [options] config

説明

プロジェクトツリーから指定された設定ファイルを解析して表示します。設定ファイルはブランク行、"#"で始まるコメント行を置くことができます。$NAME という名前の設定ファイルはプロジェクトツリー中の ./configs/$NAME あるいは $NAME として保存それます。設定ファイル中で実際に意味のある行はプロジェクトツリーと相対的なパス名とその場所に保存するプロジェクトあるいはリビジョンの情報からなります。例えば以下のような行:

./src/arch   lord@emf.net--2003b/arch--devo--1.0

は、この設定を実際に構築した場合、arch--devo--1.0の最新リビジョンを ./src/arch としてツリー中に作成するような指定になります。プロジェクトの指定方法はブランチ名、バージョン名、あるいは特定のリビジョン名になります。(XXX)

--snap オプションは設定されているプロジェクト中のどのリビジョンが実際の構築対象となるかを調べ、その特定のリビジョンを指定する形での設定ファイルを表示します。例えば上であげた例であれば、以下のような出力が得られます:

./src/arch  lord@emf.net--2003b/arch--devo--1.0--patch-21

--output オプションを指定すると、出力内容が実際の新しい構成としてファイルに保存されます。この場合さらに --force オプションを指定すると既存の設定ファイルを上書きすることができます。

別名

なし

変更: `[----]`

スイッチ

-d, --dir DIR     cd to DIR first
-o, --output CFG  write the output as config CFG
-f, --force       overwrite an exiting config (with --output)
-s, --snap        Show current patch levels of subtree packages.

例

CVS対応コマンド

なし

ブランチとマージに関するコマンド

このグループのコマンドは、ある一つの開発ライン ^[21]を二つの開発ラインに分岐したり、そのように分岐された起源を同じくする開発ライン同士の一部分を相手から取り込んだりするためのコマンドです。このグループのコマンドが書き込む対象は基本的にはプロジェクトツリーです。アーカイブに対する書き込みは例外的なものを除いてありません。そのため、コミット前にマージの結果を常に確認することができます。^[22]

言葉の二つの意味—ブランチ

GNU arch では同じ言葉が二つの全く別の意味に利用されたり、言葉の利用の仕方が通常利用される意味と異なっていたりするものがいくつかあります。ブランチもその一つです。ここでのブランチは、一つの開発ラインから、別の開発ラインを分岐させることを言います。元の開発ラインを木になぞらえて、幹(trunk)と呼び、分岐したほうの開発ラインを枝(branch)と呼びます。英語では名詞も動詞もブランチですが、日本語では少し不自然なので、名詞の方をブランチ、動詞の方は分岐する、と表現します。

ブランチのもう一つの意味は、GNU arch アーカイブの名前空間に登場するものです。GNU arch アーカイブは、A/C--B--V のように書き表すのでしたが、この B の部分のことをブランチと言います。両者の意味はまったく関係がないので注意してください。

名前

tla tag — 継続リビジョンの作成(タグ、あるいは分岐)

用法

tla tag [options] SOURCE-REVISION TAG-VERSION

説明

TAG-VERSION で指定した継続リビジョンを作ります。このリビジョンはパッチログエントリが追加されることを除いて SOURCE-REVISION と意味的に同じ内容のリビジョンになります。ログエントリを明示的に指定しなければ最小限の情報を持ったログが自動生成されます。

警告

このコマンドで言うタグ、とは、インベントリタグとは何の関係もないことに注意してください。両者は別の概念です。混乱を避けるため、タグのかわりに継続ということばを使うのが良いでしょう。

別名

なし

変更: `[A---]`

スイッチ

-A, --archive   Override `my-default-archive'
-l, --log FILE  commit with log file FILE
--seal          create a version-0 revision
--fix           create a versionfix revision

例

CVS対応コマンド

なし

名前

tla update — アーカイブ済みの最近の修正を反映するためのプロジェクトツリーの更新

用法

tla update [options] [version/revision]

説明

VERSION(あるいはプロジェクトツリーのデフォルトバージョン) の最新リビジョンを取得し、プロジェクトツリーと最新リビジョンとの間の差分であるチェンジセットを適用することでプロジェクトツリーを更新します。マージが衝突した場合、警告が表示され新しいプロジェクトツリーには ".rej"ファイルが残ります。

updateとreplay

tla update と tla replay は処理内容が良く似ています。いずれも未適用のチェンジセットを逐次プロジェクトツリーに適用していきますが、一番大きな違いは、プロジェクトツリーに対して最後に加えられた最後の未コミットの差分の扱いです。tla update はこの未コミットの差分をいったん退避し、最後のコミット完了時点にプロジェクトツリーを戻してからチェンジセットを適用し、最後に退避しておいた差分を適用します。これにたいしてreplayは、現在あるがままのプロジェクトツリーの内容に対してチェンジセットを適用していきます。update は適用しようとするチェンジセットを優先するが、replay は自分が最後に加えた未コミット分の修正を優先する形で処理がおこります。

tla update, tla replay いずれも操作対象はプロジェクトツリーに対してのみですので、衝突が起こってもおこらなくてもコマンド終了後に tla changes --diffs などを実行すれば、今回の update/replay コマンドが実際には何をしたかを正確に把握することができます。この結果が気に入れば tla commit すれば良いですし、気に入らなければ tla undo で元の状態に戻ることができます。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive    Override `my-default-archive'
-d, --dir DIR    Update project tree in DIR (default `.')
-N, --forward    pass the --forward option to `patch'
--dest DEST      Instead of modifying the project tree in-place,
                 make a copy of it to DEST and apply the result to that

例

CVS対応コマンド

なし

名前

tla replay — プロジェクトツリーに対するチェンジセットの適用

用法

tla replay [options] [version/revision...]

説明

VERSIONまたはプロジェクトツリーのデフォルトバージョン中の未適用のチェンジセットを順次適用し、最初に衝突が起きた時点で処理を中止します。複数の VERSION が指定された場合には、指定した順序で逐次処理をします。VERSION のかわりにひとつ以上の REVISION が指定された場合にはそれらのみを適用し他のリビジョンは適用しません。ここで言うリビジョンは、厳密にはリビジョン名によって示されるチェンジセットのことです。

--listオプションを指定すると適用するチェンジセットの一覧をFILE(あるいは '-'を指定するすることで標準入力)から読み込みます。このファイルの格行は完全なリビジョン名を含んでいなければなりません。マージで衝突が起こった最初のチェンジセットで処理は中断され、以下の形のファイルが残されます:

表 C.2. replay時に残されるファイル

名前	意味
`,,replay.conflicts-in`	衝突を起こしたチェンジセットの名前
`,,replay.remaining`	適用されなかったチェンジセットの一覧

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive       Override `my-default-archive'
--list FILE         read a list of patches to apply
--new               replay only new patches
--reverse           reverse the named patch
-N, --forward       pass the --forward option to `patch'
-d, --dir DIR       Operate on project tree in DIR (default `.')
--dest DEST         Instead of modifying the project tree in-place,
                    make a copy of it to DEST and apply the result to that
--skip-present      skip patches that contain 1 or more patch logs already in this tree

例

CVS対応コマンド

なし

名前

tla star-merge — 相互にマージされた開発ライン間でのマージ

用法

tla star-merge [options] [FROM]

説明

プロジェクトツリーに FROM からの変更点をマージしますが、この際、プロジェクトツリー側の参照基準点をバージョン REFERENCE とみなした上て FROM との間の共通の祖先を考慮します。 REFERENCEを指定しなければプロジェクトツリーのデフォルトバージョンが利用されます。FROM が指定されなければ、プロジェクトツリーのリビジョンが利用されます。このコマンドの目的は、双方向にマージが起こる可能性のある二つの開発ライン間の変更をマージすることです。マージに関する履歴をうまく利用することによって'相互マージ'からおこる過剰な衝突を最小限に押えようとします。

処理の詳細を以下に述べます。まず FROM はあるリビジョンを示しています。リビジョンのかわりにバージョンが指定された場合は、そのバージョンにある最新のリビジョンが指定されたものと考えます。次に TREE を実際のマージがおこるプロジェクトツリーであるとします。このとき star-merge は REFERENCE と FROM リビジョンとの間の「直近の共通祖先」 ANCESTOR を計算し、それから以下のチェンジセット:

delta (ANCESTOR, FROM)

を、TREE に適用します。つまり ANCESTOR と FROM の差分を TREE に適用します。

あとは「直近の共通祖先」を定義すれば話しが終ります。このため更に MAYBE_ANCESTOR_1, MAYBE_ANCESTOR_2, LAST_MERGE_INTO_FROM を補助的に定義します。

MAYBE_ANCESTOR_1 は、TREE と FROM の双方が持っているパッチログでバージョン REFERENCE に属するもののうち、最も大きなパッチレベルに対応したリビジョンです。言い替えると TREE にすでにマージされた FROM が属するバージョンにあるリビジョンのうち、REFERENCE に含まれる最後のリビジョンのことです。 MAYBE_ANCESTOR_2 は FROM と REFERENCE の両方にあるパッチログのうち、REFERENCE 中での最も大きなパッチレベルとして定義されます。言い替えると、すでに FROM にマージされたリビジョンのうち、REFERENCE バージョンに属する最後のリビジョンのことです。 MAYBE_ANCESTOR が空でない場合、これはは FROM のバージョン中のあるリビジョンで FROM にマージされたはずです。このリビジョンを LAST_MERGE_INTO_FROM と言います。 MAYBE_ANCESTOR_1 も MAYBE_ANCESTOR_2 も空であれば star-merge は何もしません。どちらか一方のみが空であれば、もう一方の腔でない方を ANCESTOR とします。両方共空でない場合は LAST_MERGE_INTO_FROM と MAYBE_ANCESTOR_1 が比較されます(両方とも FROM のバージョン中のリビジョンであることに注意してください)。もし MAYBE_ANCESTOR_1 の方が新しければこれを ANCESTOR とします。そうでなければ MAYBE_ANCESTOR_2 を ANCESTOR とします。

star-merge のアルゴリズムはこのように複雑ですが、利用するのは簡単です。重要なことは 1. このコマンドはほとんどの場合にマージ作業をうまくやってくれること、2. マージの結果はプロジェクトツリーに反映させるだけでアーカイブへの書き込みはおこらないこと、3. star-merge が何を実行しようとその実行結果は tla changes --diffs コマンドで確認できること、4. 実行結果が気に入らなければいつでも tla undo で取り消せること、です。マージのアルゴリズムについては star-merge の他にもいくつかのアイディアが模索されています。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive            Override tree archive
-c, --changes OUTPUT     Generate but don't apply the changeset.
-r, --reference VERSION  Set reference version (default: project tree version)
-N, --forward            pass the --forward option to `patch'
-t, --three-way          Perform a 3-way (diff3-style) merge.
-d, --dir DIR            Operate on project tree in DIR (default`.')

例

CVS対応コマンド

なし

名前

tla apply-delta — 任意の二つのツリー間で計算されたチェンジセットのプロジェクトツリーへの適用

用法

tla apply-delta [options] FROM TO

説明

FROM と TO の間の差分をチェンジセットの形に求め、結果をDIRまたは現在のディレクトリにあるプロジェクトツリーに適用します。ここで FROM も TO もプロジェクトツリーに限定されない一般的なツリーであれば良いことに注意してください。プロジェクトツリーであってももちろんかまいません。終了ステータスは以下のような意味を持ちます。

表 C.3. 終了ステータスの意味

終了ステータス	意味
`0`	チェンジセットの適用時に衝突はなかった
`1`	チェンジセットの適用時に衝突があった
`3`	内部エラー

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive    Override `my-default-archive'
-N, --forward    pass the --forward option to `patch'
--cache DIR      specify a cache root for pristine copies
-d, --dir DIR    Operate on project tree in DIR (default `.')
--dest DEST      Instead of modifying the project tree in-place,
                 make a copy of it to DEST and apply the result to that

例

CVS対応コマンド

なし

名前

tla missing — 未適用チェンジセット一覧の表示

用法

tla missing [options] [revision]

説明

VERSION に関して DIR にあるプロジェクトツリーに適用されていないチェンジセットの一覧を表示します。DIRが省略されると現在のディレクトリが、VERSION が省略されるとプロジェクトツリーのデフォルトバージョンが利用されます。--merges を指定すると、表示されるチェンジセットごとにそのチェンジセットが含んでいる別のチェンジセットを 2 カラム形式で表示します。例えば:

PATCH-A        PATCH-A
PATCH-A        PATCH-B
PATCH-A        PATCH-C

は PATCH-A が PATCH-B と PATCH-C を含んでいることを示しています。(どのようなチェンジセットでも、少なくとも自分自身は必ず含んでいます)。

別名

なし

変更: `[----]`

スイッチ

-A, --archive       Override `my-default-archive'
-d, --dir DIR       cd to DIR first
-r, --reverse       sort from newest to oldest
-s, --summary       display a summary of each missing patch
-c, --creator       display the creator of each missing patch
-D, --date          display the date of each missing patch
-f, --full          print full revision names
--merges            print a merge list for each missing patch
--skip-present      skip patches that contain 1 or more patch logs already in this tree

例

CVS対応コマンド

なし

名前

tla join-branch — 指定したバージョン用のプロジェクトツリーの構築

用法

tla join-branch [options] revision/version

説明

REVISION はプロジェクトツリーの祖先の継続(例えばタグ) でなければなりません。このコマンドはプロジェクトツリー中の REVISION のチェンジセットを replay しますが、それはそのブランチのログを追加する効果があります(結果のツリーの祖先にタグをつけることになります)通常の規約にしたがって、REVISION がバージョン名である場合にはそのバージョンの base-0 リビジョンが指定されたものと考えます。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive    Override `my-default-archive'
-d, --dir DIR    Operate on project tree in DIR (default `.')
--dest DEST      Instead of modifying the project tree in-place,
                 make a copy of it to DEST and apply the result to that

例

CVS対応コマンド

なし

名前

tla sync-tree — 指定したリビジョンを示す形にプロジェクトツリーのパッチログを統合する

用法

tla sync-tree [options] revision

説明

リビジョン REVISION に含まれるパッチログで DIR または現在のディレクトリにあるプロジェクトツリーに含まれないものを追加します。実際のマージはおこりません—パッチログ情報のみが修正されます。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive    Override `my-default-archive'
-d, --dir DIR    Operate on project tree in DIR (default `.')
--dest DEST      Instead of modifying the project tree in-place,
                 make a copy of it to DEST and apply the result to that

例

CVS対応コマンド

なし

名前

tla delta — 二つのツリー間チェンジセットの計算

用法

tla delta [options] TREE-A TREE-B [destdir]

説明

TREE-A と TREE-B の差分であるチェンジセットを計算し、 destdirに保存します。TREE-A 、TREE-B はいずれも任意のツリーであっても、リビジョンツリーであってもかまいません。

例としては:

$ tla delta tla--devo--1.1--patch-6 \
            tla--devo--1.1--patch-8 ,,changes

は、tla--devo--1.1 バージョンから patch-6 と patch-8 のリビジョンを抽出し、両者間のチェンジセットを ,,changes ディレクトリを新規に作って保存します。

別名

なし

変更: `[----]`

処理結果のディレクトリには書き込みが発生しますがこのディレクトリは新規に作成されたものであることが保証されます。

スイッチ

-A, --archive       Override `my-default-archive'
--cache DIR         specify a cache root for pristine copies
--report            output a changeset report
-n, --no-changeset  don't save the delta

例

CVS対応コマンド

なし

ローカルキャッシュ関連コマンド

プロジェクトツリーに加えた変更点を元に戻したい場合、アーカイブに対して最後のリビジョンを再ロードする必要がありますが、これだとアーカイブとプロジェクトツリーは常にネットワークで接続された状態になければなりません。これではプロジェクトツリーだけを用意したコンピュータ上でオフライン開発する場合には不便なので、通常最後のリビジョンをプロジェクトツリー内の {arch} 領域にもう一セット保存しておきます。このコピーのことをプリスティンコピーと言います。このグループのコマンドはプリスティンコピーに対する操作です。ここでのコマンドもアーカイブに対する書き込みは発生しません。また基本的にはプロジェクトツリーに対する参照のみですが、add-pristine だけは書き込みが発生します。しかしこの場合でもキャッシ領域に対する書き込みなので、作業中のデータが変更されることはありません。

名前

tla changes — プロジェクトツリーに加えたローカルな変更点の表示

用法

tla changes [options] [revision] [-- limit...]

説明

DIR または現在のディレクトリにあるプロジェクトツリーの内容と REVISION との間の差分をパッチ形式で生成し表示します。バージョンが指定された場合のデフォルトリビジョンはプロジェクトツリーがパッチログを持っている最新のリビジョンです。バージョンが省略された場合にはデフォルトバージョンを利用します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive     Override `my-default-archive'.
-d, --dir DIR     Change to DIR first.
-o, --output DIR  Save changeset in DIR (implies --keep).
-v, --verbose     Verbose changeset report.
-q, --quiet       Suppress progress information
--diffs           Include diffs in the output.
-k, --keep        Don't remove the output directory
                  on termination.

例

CVS対応コマンド

なし

名前

tla file-diffs — show local changes to a file

用法

tla file-diffs

説明

このコマンドはすでに一度説明しました

別名

なし

変更: `[----]`

スイッチ

-A, --archive   Override `my-default-archive'
-N, --new-file  Treat missing file as empty

例

CVS対応コマンド

なし

名前

tla file-find — ファイルのバージョンの検索

用法

tla file-find [options] file [revision]

説明

REVISION のキャッシュコピー中にある FILE に対応したファイル位置を表示します。バージョンを指定した場合のデフォルトのパッチレベルはそのプロジェクトツリーがパッチを持つ最新のレベルになります(XXX)。デフォルトのアーカイブバージョンは 'tla tree-version' で表示されるものになります。

別名

なし

変更: `[----]`

スイッチ

-A, --archive   Override `my-default-archive'
-N, --new-file  Print missing file as `/dev/null'

例

CVS対応コマンド

なし

名前

tla pristines — プロジェクトツリー中のプリスティンの一覧

用法

tla pristines [options] [limit]

説明

DIR または現在のディレクトリにあるプロジェクトツリーがキャッシュしているプリスティンリビジョンの一覧を表示します。

別名

なし

変更: `[----]`

スイッチ

-d, --dir DIR   cd to DIR first
-u, --unlocked  return only unlocked pristines
-l, --locked    return only locked pristines
-r, --reverse   reverse sort order

例

CVS対応コマンド

なし

名前

tla lock-pristine — プリスティンのロックとアンロック

用法

tla lock-pristine [options] revision

説明

DIR または現在のディレクトリにあるプロジェクトツリーが持っているリビジョン REVISION のプリスティンにロックします。これはそのリビジョンが自動的に回収されてしまうのを防ぎます。

別名

なし

変更: `[???---]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first
-u, --unlock   unlock, rather than lock

例

CVS対応コマンド

なし

名前

tla add-pristine — 特定のプリスティンリビジョンのプロジェクトツリーへの追加

用法

tla add-pristine [options] revision

説明

アーカイブから REVISION を抽出し、プリスティンコピーを作ります。このコピーは DIR または現在のディレクトリにあるプロジェクトツリー中に保管されます。

別名

なし

変更: `[-W--]`

スイッチ

-A, --archive  Override `my-default-archive'
-d, --dir DIR  cd to DIR first

例

CVS対応コマンド

なし

名前

tla find-pristine — プリスティンリビジョンの検索とパスの表示

用法

tla find-pristine

説明

指定されたリビジョンのプリスティンコピーの場所を表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive    Override `my-default-archive'
-d, --dir DIR    cd to DIR first
-u, --unlocked   return only an unlocked pristine
-l, --locked     return only a locked pristine
-t, --tree-only  search this tree only, not siblings
-s, --silent     exit status only

例

CVS対応コマンド

なし

リビジョンライブラリコマンド

チェンジセット指向の GNU arch には一つの大きな欠点があります。それは、特定のリビジョンをアーカイブから高速に取り出すことができないということです。あるリビジョンを得るためにはそのベースリビジョン base-0 に対して、引き続くチェンジセットを適用した結果を計算しなければなりません。リビジョンの数が増えてベースリビジョンからの距離が通るなるにつれてこの処理には時間がかかるようになるからです。ここでのコマンドは、リビジョンの取得を高速化するためのリビジョンライブラリと呼ばれるキャッシュに関するコマンドです。リビジョンライブラリは大きな領域が必要になりそうな気がしますが、実際には Unix のハードリンクの考え方を利用して効率よくリビジョンデータ内容を表現しています。

このグループのコマンドは既存のアーカイブに対してキャッシュを計算することが主ですので、もとのアーカイブに対しての書き込みは発生しません。またプロジェクトツリーに対しても同様です。リビジョンライブラリは指定した専用のリビジョンライブラリ用のディレクトリに保存されるので、その領域の配下には書き込みがおこります。

名前

tla my-revision-library — 自分のリビジョンライブラリパスの表示と設定

用法

tla my-revision-library [options] [dir]

説明

引数がなくて -d オプションも指定されていない場合には自分のリビジョンライブラリのパスを表示します。引数がある場合 DIRを自分のリビジョンライブラリへのパスとして ~/.arch-params/=revision-library に保存します。-d (--delete) オプションを指定し引数がない場合は~/.arch-paramsに記録されているリビジョンライブラリパスを削除します。リビジョンライブラリが設定されなかった場合、プログラムは終了ステータス 1 を返し -s (--silent)オプションが指定されない限りエラーメッセージを表示します。

別名

なし

変更: `[--C-]`

スイッチ

-e, --errname      specify program name for errors
-d, --delete       unspecify your revision library
-s, --silent       suppress reassuring messages
--search           use the full search path
--add              use the full add path
--search-only      use the search-only path
--add-only         use the add-only path
--first            prepend to the path if setting (default appends)

例

CVS対応コマンド

なし

名前

tla library-config — リビジョンライブラリのパラメータ設定

用法

tla library-config [options] library-dir

説明

リビジョンライブラリに対するさまざまなパラメータを表示または設定します。現時点では greedy と sparse というブール値があります。両者は独立して設定できます。greedy を有効にすると、あるリビジョンのプリスティンコピーが作られた時には常にライブラリにもそのリビジョンを自動的に追加します。こうしておけばライブラリにたいして明示的にリビジョン追加しなくても一度 tla getなどで取得したリビジョンは次回からは高速に取得することができるようになります。欠点はライブラリの領域が知らないうちに大きくなってしまうことです。

sparse オプションは、あるリビジョンがライブラリに追加された時にそのリビジョンを作る過程で得られたリビジョンも一緒にライブラリに追加するかどうかを制御します。sparse を有効にすると途中のリビジョンは追加されず、指定したリビジョンだけがライブラリに登録されます。sparse をつけないと中間のリビジョンも自動的に追加されます。たとえば C--B--V--base-0 からはじまるバージョンの最新リビジョンが C--B--V--patch-5 であるとします。sparse オプションをつけずに tla library-add C--B--V--patch-5を実行すると C--B--V--base-0 .. C--B--V--patch-4までのすべてのリビジョンもライブラリに登録されます。sparse オプションをつけると C--B--V--patch-5 のみが追加されます。

greedy と sparse オプションの on/off の組み合わせをうまく選ぶことで、ライブラリ領域と、リビジョン取得時の時間効率を最適にすることができます。

別名

なし

変更: `[---L]`

スイッチ

--greedy          make the library greedy
--non-greedy      make the library not greedy
--sparse          make the library sparse (by default)
--non-sparse      make the library not sparse (by default)

例

CVS対応コマンド

なし

名前

tla library-find — リビジョンライブラリ中のリビジョン位置の検索と表示

用法

tla library-find [options] revision

説明

自分のリビジョンライブラリ中で REVISION を検索しそのパスを表示します。リビジョンを指定しなければ--silient オプションを指定しないかぎりエラーメッセージを表示し、ゼロではない終了ステータスで終了します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-e, --errname  specify program name for errors
-s, --silent   suppress reassuring messages

例

CVS対応コマンド

なし

名前

tla library-add — リビジョンライブラリへのリビジョンの追加

用法

tla library-add [options] revision

説明

自分のリビジョンライブラリに REVISION を追加します。すでに追加されている場合には何もせずに終了ステータスゼロでプログラムを終了します。

別名

なし

変更: `[---L]`

スイッチ

-A, --archive         Override `my-default-archive'
-s, --sparse          Don't fill in gaps in the library.
--non-sparse          Fill in gaps in the library.
-L, --library LIB     specify which library to add to
--for-links PATH      require a lib on the same device as PATH

例

CVS対応コマンド

なし

名前

tla library-remove — リビジョンライブラリからのリビジョンの削除

用法

tla library-remove [options] revision

説明

自分のリビジョンライブラリから REVISION を削除します。そのリビジョンがライブラリ中に存在しない場合にはエラーメッセージを表示してゼロ以外のステータスで終了します。

別名

なし

変更: `[---L]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla library-archives — リビジョンライブラリ中のアーカイブ一覧

用法

tla library-archives [options]

説明

リビジョンライブラリ中のすべてのアーカイブを一覧表示します。

別名

なし

変更: `[----]`

スイッチ

なし

例

CVS対応コマンド

なし

名前

tla library-categories — リビジョンライブラリ中のカテゴリの一覧

用法

tla library-categories [options] [archive]

説明

リビジョンライブラリ中の指定アーカイブにあるすべてのカテゴリを表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla library-branches — ライブラリカテゴリ中のブランチの一覧

用法

tla library-branches [options] [category]

説明

リビジョンライブラリ中の CATEGORY にあるすべてのブランチを表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'

例

CVS対応コマンド

なし

名前

tla library-versions — ライブラリブランチにあるバージョンの一覧表示

用法

tla library-versions [options] [branch]

説明

リビジョンライブラリに登録されている特定の archive/branch にあるすべてのバージョンを表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-r, --reverse  sort from newest to oldest

例

CVS対応コマンド

なし

名前

tla library-revisions — ライブラリバージョン中のリビジョンの一覧

用法

tla library-revisions [options] [version]

説明

リビジョンライブラリに登録された特定の archive/version にあるすべてのリビジョンを表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-r, --reverse  sort from newest to oldest
-f, --full     list fully qualified names
-s, --summary  print a summary of each patch
-c, --creator  print the creator of each patch
-D, --date     print the date of each patch

例

CVS対応コマンド

なし

名前

tla library-log — リビジョンライブラリからのログメッセージの表示

用法

tla library-log [options] revision

説明

ライブラリ中の REVISION のもつログメッセージを表示します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
-s, --silent   suppress reassuring messages

例

CVS対応コマンド

なし

名前

tla library-file — リビジョンライブラリ中でのファイル検索

用法

tla library-file [options] file revision

説明

リビジョンライブラリの REVISION で FILE を検索しそのパスを表示します。リビジョン、あるいはファイルが存在しなければエラーメッセージを表示してゼロではないステータスを返します。

別名

なし

変更: `[----]`

スイッチ

-A, --archive  Override `my-default-archive'
--id           interpret FILE as an inventory id
--this         interpret FILE as a file within a project tree

例

CVS対応コマンド

なし

公開用リビジョンコマンド

GNU arch はアーカイブ名とアーカイブ位置とを独立に定義します。これは論理的なアーカイブ名を変更せずにアーカイブ位置のみを変更することで別の物理的なアーカイブにアクセスできるようにするためです。これはたとえば、あるマスターアーカイブが現在ダウンしていて、そのかわりにミラーサイトにアクセスするような場合に役立ちます。アーカイブ位置を変更するためのコマンドを使って^[23]アーカイブ位置のみを変更すれば、アーカイブ名を含む、tla を内部で呼び出すような既存のスクリプトには一切修正を加えることなく作業を継続できます。

アーカイブ位置からアーカイブ名を自動的に求め登録してくれる仕組みがあると便利です。tla grab はこれを実行してくれます。

名前

tla grab — 公開用リビジョンの取得

用法

tla grab [options] location

説明

公開用リビジョンを取得します。GNU arch でリモートアーカイブにある特定のリビジョンを取得する場合には、以下の手続きを踏む必要があります。1. tla register-archive コマンドでアーカイブ名とアーカイブ位置を結び付ける。2. tla get コマンドで必要なアーカイブリビジョンを指定する。tla grab は以下のような形のファイルにアクセスし、この処理を簡略化します:

Archive-Name: tez@kamihira.com--2004s
Archive-Location: http://arch.bluegate.org/{archives}/tez@kamihira.com--2004s
Target-Revision: ViewARCH--devo--0.0.8
Target-Directory: ViewARCH

上記のような形のファイルを、 http://arch.bluegate.org/grabs/ViewARCH--devo--0.0.8 のような場所に置いておくと、以下のコマンドで ViewARCH--devo--0.0.8 の最新リビジョンを取得することができます。

$ tla grab http://arch.bluegate.org/grabs/ViewARCH--devo--0.0.8

別名

なし

変更: `[-WC-]`

書き込みが発生するプロジェクトツリーは新規に作成されたものであることが保証されています。

スイッチ

なし

例

CVS対応コマンド

なし

スクリプト支援コマンド

GNU arch のアーカイブは複雑な名前空間を持つので、A/C--B--V のような文字列からアーカイブ名、カテゴリ名、ブランチ名、バージョン名を抽出したり、そもそも指定された文字列がこの形式になっているかどうかをチェックが必要となる場面が現れます。GNU arch の tla コマンドを呼び出し結果を利用する高レベルのスクリプトを支援するためにこのアーカイブ名の解析をするためのコマンドを用意しています。このグループのコマンドはアーカイブ領域、プロジェクトツリー領域いずれにたいしても書き込みをしません。

名前

tla parse-package-name — パッケージ名称の解析

用法

tla parse-package-name [options] name

説明

パッケージ名 name を解析します。パッケージ名とは A/C--B--Vまたはその一部のような形をした文字列のことです。 (XXX)

別名

なし

変更: `[----]`

スイッチ

-A, --archive          Override `my-default-archive'
-a, --arch             print the archive name
--non-arch             print the non-archive part of the name
-c, --category         print the category name
-b, --branch           print the branch name
-p, --package          print the package name
-v, --vsn              print the version id
--package-version      print the category--branch--version
-l, --lvl              print the patch level
--patch-level          synonym for --lvl

例

CVS対応コマンド

なし

名前

tla valid-package-name — パッケージ名称の妥当性の検証

用法

tla valid-package-name [options] name

説明

パッケージ名 name の妥当性を検証します。デフォルトではベース名またはベース名とブランチ名をつなげたものです。オプション -v と -l は -b を打ち消します。逆も言えます。-l は -v を暗黙に含みます。エラー名が -e または --errname で指定された場合にはエラーを起こした名前が標準出力に表示されます。そうでなければ終了ステータスのみが表示されます。デフォルトでは妥当性チェックは厳密に行われます。たとえば -b は正しいベース名であるかどうかを確認し、ブランチ名やバージョン番号を認めません。-t を指定するとより具体的な名前を認めます。たとえば -b はブランチ名、バージョン名、パッチレベルのいずれも正しいものとして認めます。

ベース名の説明をする必要がある。

別名

なし

変更: `[----]`

スイッチ

-e, --errname      specify program name for errors
--archive          require and explicit archive
--no-archive       prohibit and explicit archive
-c, --category     require a category
-p, --package      require category, permit branch
-v, --vsn          require a version number
-l, --patch-level  require a patch level
--lvl              synonym for --patch-level
-t, --tolerant     tolerate more specific names

例

CVS対応コマンド

なし

^[19]tla undo を利用すればよいのでした

^[20]これをチェリーピックといいます。

^[21]開発ラインとはあるバージョンのことを言います。 A/C--B--V のようなものを思い浮かべてください

^[22]tla changes --diffs を利用します

^[23]tla register-archive

付録 D. Copyright

		GNU Free Documentation License
		  Version 1.2, November 2002


 Copyright (C) 2000,2001,2002  Free Software Foundation, Inc.
     59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 Everyone is permitted to copy and distribute verbatim copies
 of this license document, but changing it is not allowed.


0. PREAMBLE

The purpose of this License is to make a manual, textbook, or other
functional and useful document "free" in the sense of freedom: to
assure everyone the effective freedom to copy and redistribute it,
with or without modifying it, either commercially or noncommercially.
Secondarily, this License preserves for the author and publisher a way
to get credit for their work, while not being considered responsible
for modifications made by others.

This License is a kind of "copyleft", which means that derivative
works of the document must themselves be free in the same sense.  It
complements the GNU General Public License, which is a copyleft
license designed for free software.

We have designed this License in order to use it for manuals for free
software, because free software needs free documentation: a free
program should come with manuals providing the same freedoms that the
software does.  But this License is not limited to software manuals;
it can be used for any textual work, regardless of subject matter or
whether it is published as a printed book.  We recommend this License
principally for works whose purpose is instruction or reference.


1. APPLICABILITY AND DEFINITIONS

This License applies to any manual or other work, in any medium, that
contains a notice placed by the copyright holder saying it can be
distributed under the terms of this License.  Such a notice grants a
world-wide, royalty-free license, unlimited in duration, to use that
work under the conditions stated herein.  The "Document", below,
refers to any such manual or work.  Any member of the public is a
licensee, and is addressed as "you".  You accept the license if you
copy, modify or distribute the work in a way requiring permission
under copyright law.

A "Modified Version" of the Document means any work containing the
Document or a portion of it, either copied verbatim, or with
modifications and/or translated into another language.

A "Secondary Section" is a named appendix or a front-matter section of
the Document that deals exclusively with the relationship of the
publishers or authors of the Document to the Document's overall subject
(or to related matters) and contains nothing that could fall directly
within that overall subject.  (Thus, if the Document is in part a
textbook of mathematics, a Secondary Section may not explain any
mathematics.)  The relationship could be a matter of historical
connection with the subject or with related matters, or of legal,
commercial, philosophical, ethical or political position regarding
them.

The "Invariant Sections" are certain Secondary Sections whose titles
are designated, as being those of Invariant Sections, in the notice
that says that the Document is released under this License.  If a
section does not fit the above definition of Secondary then it is not
allowed to be designated as Invariant.  The Document may contain zero
Invariant Sections.  If the Document does not identify any Invariant
Sections then there are none.

The "Cover Texts" are certain short passages of text that are listed,
as Front-Cover Texts or Back-Cover Texts, in the notice that says that
the Document is released under this License.  A Front-Cover Text may
be at most 5 words, and a Back-Cover Text may be at most 25 words.

A "Transparent" copy of the Document means a machine-readable copy,
represented in a format whose specification is available to the
general public, that is suitable for revising the document
straightforwardly with generic text editors or (for images composed of
pixels) generic paint programs or (for drawings) some widely available
drawing editor, and that is suitable for input to text formatters or
for automatic translation to a variety of formats suitable for input
to text formatters.  A copy made in an otherwise Transparent file
format whose markup, or absence of markup, has been arranged to thwart
or discourage subsequent modification by readers is not Transparent.
An image format is not Transparent if used for any substantial amount
of text.  A copy that is not "Transparent" is called "Opaque".

Examples of suitable formats for Transparent copies include plain
ASCII without markup, Texinfo input format, LaTeX input format, SGML
or XML using a publicly available DTD, and standard-conforming simple
HTML, PostScript or PDF designed for human modification.  Examples of
transparent image formats include PNG, XCF and JPG.  Opaque formats
include proprietary formats that can be read and edited only by
proprietary word processors, SGML or XML for which the DTD and/or
processing tools are not generally available, and the
machine-generated HTML, PostScript or PDF produced by some word
processors for output purposes only.

The "Title Page" means, for a printed book, the title page itself,
plus such following pages as are needed to hold, legibly, the material
this License requires to appear in the title page.  For works in
formats which do not have any title page as such, "Title Page" means
the text near the most prominent appearance of the work's title,
preceding the beginning of the body of the text.

A section "Entitled XYZ" means a named subunit of the Document whose
title either is precisely XYZ or contains XYZ in parentheses following
text that translates XYZ in another language.  (Here XYZ stands for a
specific section name mentioned below, such as "Acknowledgements",
"Dedications", "Endorsements", or "History".)  To "Preserve the Title"
of such a section when you modify the Document means that it remains a
section "Entitled XYZ" according to this definition.

The Document may include Warranty Disclaimers next to the notice which
states that this License applies to the Document.  These Warranty
Disclaimers are considered to be included by reference in this
License, but only as regards disclaiming warranties: any other
implication that these Warranty Disclaimers may have is void and has
no effect on the meaning of this License.


2. VERBATIM COPYING

You may copy and distribute the Document in any medium, either
commercially or noncommercially, provided that this License, the
copyright notices, and the license notice saying this License applies
to the Document are reproduced in all copies, and that you add no other
conditions whatsoever to those of this License.  You may not use
technical measures to obstruct or control the reading or further
copying of the copies you make or distribute.  However, you may accept
compensation in exchange for copies.  If you distribute a large enough
number of copies you must also follow the conditions in section 3.

You may also lend copies, under the same conditions stated above, and
you may publicly display copies.


3. COPYING IN QUANTITY

If you publish printed copies (or copies in media that commonly have
printed covers) of the Document, numbering more than 100, and the
Document's license notice requires Cover Texts, you must enclose the
copies in covers that carry, clearly and legibly, all these Cover
Texts: Front-Cover Texts on the front cover, and Back-Cover Texts on
the back cover.  Both covers must also clearly and legibly identify
you as the publisher of these copies.  The front cover must present
the full title with all words of the title equally prominent and
visible.  You may add other material on the covers in addition.
Copying with changes limited to the covers, as long as they preserve
the title of the Document and satisfy these conditions, can be treated
as verbatim copying in other respects.

If the required texts for either cover are too voluminous to fit
legibly, you should put the first ones listed (as many as fit
reasonably) on the actual cover, and continue the rest onto adjacent
pages.

If you publish or distribute Opaque copies of the Document numbering
more than 100, you must either include a machine-readable Transparent
copy along with each Opaque copy, or state in or with each Opaque copy
a computer-network location from which the general network-using
public has access to download using public-standard network protocols
a complete Transparent copy of the Document, free of added material.
If you use the latter option, you must take reasonably prudent steps,
when you begin distribution of Opaque copies in quantity, to ensure
that this Transparent copy will remain thus accessible at the stated
location until at least one year after the last time you distribute an
Opaque copy (directly or through your agents or retailers) of that
edition to the public.

It is requested, but not required, that you contact the authors of the
Document well before redistributing any large number of copies, to give
them a chance to provide you with an updated version of the Document.


4. MODIFICATIONS

You may copy and distribute a Modified Version of the Document under
the conditions of sections 2 and 3 above, provided that you release
the Modified Version under precisely this License, with the Modified
Version filling the role of the Document, thus licensing distribution
and modification of the Modified Version to whoever possesses a copy
of it.  In addition, you must do these things in the Modified Version:

A. Use in the Title Page (and on the covers, if any) a title distinct
   from that of the Document, and from those of previous versions
   (which should, if there were any, be listed in the History section
   of the Document).  You may use the same title as a previous version
   if the original publisher of that version gives permission.
B. List on the Title Page, as authors, one or more persons or entities
   responsible for authorship of the modifications in the Modified
   Version, together with at least five of the principal authors of the
   Document (all of its principal authors, if it has fewer than five),
   unless they release you from this requirement.
C. State on the Title page the name of the publisher of the
   Modified Version, as the publisher.
D. Preserve all the copyright notices of the Document.
E. Add an appropriate copyright notice for your modifications
   adjacent to the other copyright notices.
F. Include, immediately after the copyright notices, a license notice
   giving the public permission to use the Modified Version under the
   terms of this License, in the form shown in the Addendum below.
G. Preserve in that license notice the full lists of Invariant Sections
   and required Cover Texts given in the Document's license notice.
H. Include an unaltered copy of this License.
I. Preserve the section Entitled "History", Preserve its Title, and add
   to it an item stating at least the title, year, new authors, and
   publisher of the Modified Version as given on the Title Page.  If
   there is no section Entitled "History" in the Document, create one
   stating the title, year, authors, and publisher of the Document as
   given on its Title Page, then add an item describing the Modified
   Version as stated in the previous sentence.
J. Preserve the network location, if any, given in the Document for
   public access to a Transparent copy of the Document, and likewise
   the network locations given in the Document for previous versions
   it was based on.  These may be placed in the "History" section.
   You may omit a network location for a work that was published at
   least four years before the Document itself, or if the original
   publisher of the version it refers to gives permission.
K. For any section Entitled "Acknowledgements" or "Dedications",
   Preserve the Title of the section, and preserve in the section all
   the substance and tone of each of the contributor acknowledgements
   and/or dedications given therein.
L. Preserve all the Invariant Sections of the Document,
   unaltered in their text and in their titles.  Section numbers
   or the equivalent are not considered part of the section titles.
M. Delete any section Entitled "Endorsements".  Such a section
   may not be included in the Modified Version.
N. Do not retitle any existing section to be Entitled "Endorsements"
   or to conflict in title with any Invariant Section.
O. Preserve any Warranty Disclaimers.

If the Modified Version includes new front-matter sections or
appendices that qualify as Secondary Sections and contain no material
copied from the Document, you may at your option designate some or all
of these sections as invariant.  To do this, add their titles to the
list of Invariant Sections in the Modified Version's license notice.
These titles must be distinct from any other section titles.

You may add a section Entitled "Endorsements", provided it contains
nothing but endorsements of your Modified Version by various
parties--for example, statements of peer review or that the text has
been approved by an organization as the authoritative definition of a
standard.

You may add a passage of up to five words as a Front-Cover Text, and a
passage of up to 25 words as a Back-Cover Text, to the end of the list
of Cover Texts in the Modified Version.  Only one passage of
Front-Cover Text and one of Back-Cover Text may be added by (or
through arrangements made by) any one entity.  If the Document already
includes a cover text for the same cover, previously added by you or
by arrangement made by the same entity you are acting on behalf of,
you may not add another; but you may replace the old one, on explicit
permission from the previous publisher that added the old one.

The author(s) and publisher(s) of the Document do not by this License
give permission to use their names for publicity for or to assert or
imply endorsement of any Modified Version.


5. COMBINING DOCUMENTS

You may combine the Document with other documents released under this
License, under the terms defined in section 4 above for modified
versions, provided that you include in the combination all of the
Invariant Sections of all of the original documents, unmodified, and
list them all as Invariant Sections of your combined work in its
license notice, and that you preserve all their Warranty Disclaimers.

The combined work need only contain one copy of this License, and
multiple identical Invariant Sections may be replaced with a single
copy.  If there are multiple Invariant Sections with the same name but
different contents, make the title of each such section unique by
adding at the end of it, in parentheses, the name of the original
author or publisher of that section if known, or else a unique number.
Make the same adjustment to the section titles in the list of
Invariant Sections in the license notice of the combined work.

In the combination, you must combine any sections Entitled "History"
in the various original documents, forming one section Entitled
"History"; likewise combine any sections Entitled "Acknowledgements",
and any sections Entitled "Dedications".  You must delete all sections
Entitled "Endorsements".


6. COLLECTIONS OF DOCUMENTS

You may make a collection consisting of the Document and other documents
released under this License, and replace the individual copies of this
License in the various documents with a single copy that is included in
the collection, provided that you follow the rules of this License for
verbatim copying of each of the documents in all other respects.

You may extract a single document from such a collection, and distribute
it individually under this License, provided you insert a copy of this
License into the extracted document, and follow this License in all
other respects regarding verbatim copying of that document.


7. AGGREGATION WITH INDEPENDENT WORKS

A compilation of the Document or its derivatives with other separate
and independent documents or works, in or on a volume of a storage or
distribution medium, is called an "aggregate" if the copyright
resulting from the compilation is not used to limit the legal rights
of the compilation's users beyond what the individual works permit.
When the Document is included in an aggregate, this License does not
apply to the other works in the aggregate which are not themselves
derivative works of the Document.

If the Cover Text requirement of section 3 is applicable to these
copies of the Document, then if the Document is less than one half of
the entire aggregate, the Document's Cover Texts may be placed on
covers that bracket the Document within the aggregate, or the
electronic equivalent of covers if the Document is in electronic form.
Otherwise they must appear on printed covers that bracket the whole
aggregate.


8. TRANSLATION

Translation is considered a kind of modification, so you may
distribute translations of the Document under the terms of section 4.
Replacing Invariant Sections with translations requires special
permission from their copyright holders, but you may include
translations of some or all Invariant Sections in addition to the
original versions of these Invariant Sections.  You may include a
translation of this License, and all the license notices in the
Document, and any Warranty Disclaimers, provided that you also include
the original English version of this License and the original versions
of those notices and disclaimers.  In case of a disagreement between
the translation and the original version of this License or a notice
or disclaimer, the original version will prevail.

If a section in the Document is Entitled "Acknowledgements",
"Dedications", or "History", the requirement (section 4) to Preserve
its Title (section 1) will typically require changing the actual
title.


9. TERMINATION

You may not copy, modify, sublicense, or distribute the Document except
as expressly provided for under this License.  Any other attempt to
copy, modify, sublicense or distribute the Document is void, and will
automatically terminate your rights under this License.  However,
parties who have received copies, or rights, from you under this
License will not have their licenses terminated so long as such
parties remain in full compliance.


10. FUTURE REVISIONS OF THIS LICENSE

The Free Software Foundation may publish new, revised versions
of the GNU Free Documentation License from time to time.  Such new
versions will be similar in spirit to the present version, but may
differ in detail to address new problems or concerns.  See
http://www.gnu.org/copyleft/.

Each version of the License is given a distinguishing version number.
If the Document specifies that a particular numbered version of this
License "or any later version" applies to it, you have the option of
following the terms and conditions either of that specified version or
of any later version that has been published (not as a draft) by the
Free Software Foundation.  If the Document does not specify a version
number of this License, you may choose any version ever published (not
as a draft) by the Free Software Foundation.


ADDENDUM: How to use this License for your documents

To use this License in a document you have written, include a copy of
the License in the document and put the following copyright and
license notices just after the title page:

    Copyright (c)  YEAR  YOUR NAME.
    Permission is granted to copy, distribute and/or modify this document
    under the terms of the GNU Free Documentation License, Version 1.2
    or any later version published by the Free Software Foundation;
    with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts.
    A copy of the license is included in the section entitled "GNU
    Free Documentation License".

If you have Invariant Sections, Front-Cover Texts and Back-Cover Texts,
replace the "with...Texts." line with this:

    with the Invariant Sections being LIST THEIR TITLES, with the
    Front-Cover Texts being LIST, and with the Back-Cover Texts being LIST.

If you have Invariant Sections without Cover Texts, or some other
combination of the three, merge those two alternatives to suit the
situation.

If your document contains nontrivial examples of program code, we
recommend releasing these examples in parallel under your choice of
free software license, such as the GNU General Public License,
to permit their use in free software.

GNU arch Book

Archive: tez@kamihira.com--2004-private

Version: Book--GNU-arch--0.0.1

Revision: patch-52

序文

この本の読み方

この本での約束ごと

印刷上の規約

アイコン

注意

ティップ

警告

この本の構成

この本はGFDLだ

謝辞

第1章 導入

バックアップ

テキストファイルとバイナリファイル

差分と複数のファイル

協力者たち

分岐、そしてマージ

ブルーな日々

GNU arch

第2章 インストール

インストール

最初にやらなくてはならないこと

UserIDの設定

アーカイブの作成

デフォルトアーカイブの設定

三つの困難

この章のまとめ

第3章 バージョンの作成

前提となる環境

バージョンとは何か

初期データのインポート

概論

利用するサンプルプログラム

初期インポート作業(1) - tla init-tree

初期インポート作業(2) - tla id-tagging-method

初期インポート作業(3) - インポートファイルの確認

初期インポート作業(4) - インポート

リビジョンとは何か

プロジェクトツリーとは何か

日々の利用

概論

tla changes(1)

undo と redo

修正のコミット

プリスティン・コピー

よくあるトラブル

プロジェクトツリー中に恐ろしい名前のファイルができた

コミットに失敗する

この章のまとめ

第4章 インベントリ

=tagging-method

第一のチェック - ファイルタイプチェック

第二のチェック - インベントリチェック

警告

チェックの詳細

tla inventory

tla tree-lint

既存プロジェクトの移行

explicit による方法

tagline による方法

この章のまとめ

第5章 ブランチとマージ

ブランチ(分岐)

注意

注意

アーカイブの公開

マージの技法

tla replay

tla update

tla star-merge

パッチログの限界

マージの失敗が意味すること

第6章 最適化

リビジョンキャッシュ

アーカイブ・ミラー

リビジョンライブラリ

第1章導入

第2章インストール

第3章バージョンの作成

第4章インベントリ

第5章ブランチとマージ

第6章最適化

第7章新しい概念

第8章サインつきアーカイブ

第9章フックとレシピ集

いまいるプロジェクトツリーの中のソースファイルを grep したい

第10章マルチツリープロジェクト

変更: `[--C-]`

変更: `[-W--]`