汎用聖書形式タグ付け仕様書 (電網訳)

<聖書<電網聖書

汎用聖書形式タグ付け仕様書 (はんようせいしょけいしきタグづけしようしょ)[1]

原題:General Bible Format Tagging Specification[2]

目的

編集

この仕様書は,さまざまな聖書検索プログラムで使用する聖書テキストを用意するための手引きとなるよう意図されている。それらのファイルは,直接解析して使用することも可能だが,聖書検索プログラムが索引付けや別の形式への変換という形で処理を施すこともできる。他の形式への変換は比較的簡単だ。この形式は,DOS,Windows,その他のプラットフォームで動作している聖書検索プログラムに,詳細な書式化の多くをゆだねるよう設計されている。

警告

編集

この形式はまだ開発中なので,特に脚注や相互参照の扱いに関して,幾つかの事柄が変わるかもしれない。さらに,この仕様書では少々あいまいで,GBFリーダの実装の時点で明確になる点も幾つかある。この形式で配布された聖書を利用するプログラムを書く前に,この文書の原文を確認して欲しい。この文書は2001年11月19日に最終更新された。この文書に対する直近の変更は,「WTf」タグの追加,および幾つかのタグに「非使用」や「廃止」の注意書きを付したことである。

汎用形式

編集

汎用聖書形式(GBF)ファイルは,254文字以内に限定された行から成るプレインASCIIテキストファイルだ。各行はDOS標準のCR-LFの組み合わせの文字で終わる。GBFファイルは,タグ,単語,空白,句読点といったトークンの連続から成る。それらのトークンが行の変わり目をまたがることはない。読み取る際,行の終端は単一の空白と同じだ。例外は,直後に「CM」トークンを伴うときで,その場合それらは無視される。適切な位置に軽い改行を挿入するのは,表示したりテキストを別形式に変換したりするプログラムの責任だ。127より大きなASCII要素については,米Windows ANSI文字セットとみなされる。DOSやUnixを対象とするGBFリーダは,この範囲内の文字を,それらのプラットフォーム上の最も類似した文字に変換すべきだ。

タグ

編集

GBFファイルの中のタグには数種類あるが,それは"<"文字に続く最初の文字によって示される。これらのタグの中には,ファイル先頭タグ,テキスト型タグ,ファイル末尾タグ,フォント属性タグ,段落属性タグ,情報タグ,同期標識,特殊文字などがある。すべてのタグは右大不等号(<)とタグを識別する2つの文字で始まり,左大不等号(>)で終わる。タグ識別子は変動しやすいものであり,将来は,追加文字,数字,および他の文字を含むよう拡張されるかも知れない。幾つかのタグは引数を取る(同期標識のように)。この引数はタグの終わり「>」の直前に挿入される。このバージョンのGBF仕様書を対象とするGBFリーダは,(仕様書に含まれていない)認識できないタグを無視するべきだ。(それらは恐らく,より新しいバージョンの仕様書で追加されたものだからだ。)開始と停止の異形を備えたタグにおいて,タグ識別子の2文字目は,開始タグでは大文字,停止タグでは小文字だ。

テキスト型タグ

編集

互いに排他的なテキスト型タグ群は,続くテキストの論理的な内容を明示し,文字や段落の設定の初期設定を暗示する。これらの各テキスト種別に割り当てられる実際のフォントや段落の属性は,表示プログラムによって,なるべくなら利用者の何らかの入力をもとに決定される。

ファイル先頭タグは,ファイルの冒頭から始まり,以下の順序で出現する。

タグ 目的
ファイルのヘッダの開始 <H0vv> SBFファイルのバージョン情報。(最初のバージョンは「00」。)ファイル中に表われる場合,これは最初のトークンであるべきだ。これは将来Unicodeへの移行が生じるかも知れない箇所だ。このタグより前のどんなテキストも無視される。
翻訳の長い表題 <H1> 冒頭部分の印刷,またウィンドウの長いタイトルや見出しのための,翻訳の長い表題を指定する。このタグは聖書の本文より前に現われるべきだ。(例,「The Holy Bible, God's Living Word Translation」や「American Standard Version」。)
翻訳の略称 <H2> 翻訳の短い表題や略称を指定する。(例,「GLW」,「ASV」,「NASB 1995」,「NJB」,「Amplified」など。)
著作権表示(短) <H3> 著作権が取得されているなら短い(最小限の)著作権表示。または「KJV text is in the Public Domain.」といった事柄。
著作権表示(長) <H4> 著作権・許可表示(全文)。次のフィールド(恐らく<TI>)が開始すると,著作権表示は終了する。

ファイル本体タグは,テキストの内容の型を示すのに必要なものとして用いられる。

タグ 目的
外典 <BA> 外典・第二正典の諸書のテキスト
注釈 <BC> 注釈(通常は聖書テキストの中ではなく,同期標識と共に別ファイルで使用される)。
翻訳の紹介 <BI> 読者への覚え書き,翻訳履歴など。
新約聖書テキスト <BN> 新約27書のテキスト
旧約聖書テキスト <BO> 旧約39書のテキスト
各書の序文 <BP> 聖書や外典の各書の,古代または近年の序文

ファイル末尾タグは以下の順序で現われるべきだ:

タグ 目的
照合値 <ZW> 廃止 (SHASUMまたはSAPPSUMからの外部照合値に置き換わった。これまでの定義は以下の通り: 照合値(ファイルの冒頭からこの行の直前までのすべての行のSHA-1ハッシュ)。32桁の16進数を伴う。SBFリーダは,この正当性照合に失敗するSBFファイルをすべて拒否すべきだ。ハッシュ値は任意でDSSデジタル署名を伴うことができる。)
Digital Signature <ZX> 廃止 (外部のPGPデジタル署名に置き換わった。これまでの定義は以下の通り: <H0vv>から<ZW>の直前までのファイルのDSS署名)
登録ユーザID <ZY> 廃止 (使用しない。これまでの定義は以下の通り: 登録ユーザのユーザID,名前,組織,および照合値は,この部分にエンコードして記録される。)
ファイルの終端 <ZZ> ここで読み取りを停止する。
開始タグ 停止タグ 目的
詩編の各巻の表題 <TB> <Tb> 詩編の5つの巻の冒頭に記す
コメント <TC> <Tc> 表示・変換利用に際して,この部分のテキストを無視する。
ヘブライ語の表題 <TH> <Th> 詩編のヘブライ語の表題。ヘブライ語の表題は1節の同期標識の直後に現われるべきだ。
区分見出し <TS> <Ts> 翻訳者や発行者の区分見出し。
書名 <TT> <Tt> 画面に表示するための現在の書物の正式名。例,「The Good News According to John」。

フォント属性

編集

テキスト属性タグの各対は,斜体のようなテキスト属性を示すのに必要なものとして,テキスト中に挿入される。これらは,プラットフォームの制限によって,すべての聖書ビューアできちんと表現されることもあれば,されないこともある。これらのテキスト属性はすべて,開始タグが章の同期標識の後で明示的に繰り返されなければ,各章の冒頭で無効になるものとみなされる。

属性 開始タグ 停止タグ
太字(非使用) <FB> <Fb>
小さい大文字(非使用) <FC> <Fc>
斜体 <FI> <Fi>
フォント名(非使用) <FNname> <Fn>
旧約聖書の引用句(非使用) <FO> <Fo>
赤色(イエスの言葉) <FR> <Fr>
上付き文字(非使用) <FS> <Fs>
下線(非使用) <FU> <Fu>
下付き文字(非使用) <FV> <Fv>

段落属性

編集

これらのタグは,行揃えや字下げなどといった段落の属性を表わす。これらの属性はすべて,該当する開始タグが章の同期標識の後で明示的に繰り返されなければ,各章の冒頭で初期状態(字下げのない散文,左揃え,左から右方向)になるとみなされる。行揃えタグは方向タグと同様,互いに排他的である。

属性 開始タグ 停止タグ コメント
左から右方向(初期状態)(非使用) <DL> 欧米言語
右から左方向(非使用) <DR> ヘブライ語,アラビア語など
上から下方向(非使用) <DT> 北京語など
中央揃え(非使用) <JC> 表題に用いる。
均等揃え(非使用) <JF> 左揃えに置き換えてもよい。
左揃え <JL> 行揃えの初期方式。
右揃え <JR> 「セラ」用
字下げされた引用文(非使用) <PI> <Pi> 字下げされた長い引用文。
<PP> <Pp> (詩編のような)詩を表わす。

情報タグ

編集

これらのタグは,マウスの右クリックによって別ウィンドウやページの下部に表示されるための,テキストに関するさまざまな追加資料を示す。開始タグと停止タグは,脚注や参照が当てはまる単語の範囲をさし示す。以下に「seq」で表わされている順序標識は,参照部分が重複する際に開始タグと停止タグを対応させるために用いられるもので,該当するテキストの範囲内においてユニークであることが保証されている英数字の短い文字列だ。

開始タグ 停止タグ 目的
埋め込み脚注を伴うテキスト。 <RB> <RF> <RB>と<RF>の間のテキストは,<RF>と<Rf>の間に,追加の説明,コメント,翻訳者の注釈を有している。<RB>と<RF>の間のテキストは,脚注をポップアップするためのハイパーリンクを引いたり,印刷されたテキストではより伝統的な上付き標識で目立たせることができる。
脚注の主文 <RF> <Rf> <RF>タグと<Rf>タグの間は埋め込み脚注の主文だ。<RF>は直前にを伴うこともあれば,伴わないこともある。
平行箇所(非使用) <RPseq Book ch:vs> <Rpseq> Bookは番号か,空白を含まない略称。
相互参照(非使用) <RXseq Book ch:vs> <Rxseq> Bookは番号か,空白を含まない略称。

単語情報タグ

編集
タグ 目的
ストロング・ナンバー(ギリシャ語) <WGnnn> ギリシャ語辞典の見出し語の序数。
ストロング・ナンバー(ヘブライ語) <WHnnn> 直前の単語に対応するヘブライ語辞典の見出し語の序数。
行間訳 <WIword(s)> 直前の単語に対応した語句。
原語の単語情報 <WTxxxx> xxxxは,直前の単語の時制・性・数などに対応する特有の意味を持つ,一つかそれ以上の文字:

A = アオリスト
P = 複数
S = 単数
[拡張中]

呼びかけ形式 <WTf> このタグの直前の固有名詞は,じかに呼びかけられている(二人称)のであって,言及されている(三人称)のではない。

同期標識

編集

節の同期標識は現在の書・章・節を示す。それぞれの種類の同期標識は,それが示す範囲(書・章・節)の冒頭に必要とされる。同期標識は範囲内で自由に繰り返されるかも知れない。同期標識で具体的な番号が明示されない場合,その番号は同種の直前の同期標識の番号より一つ大きいものとみなされる。

種類 タグ 例・コメント
<SBxxx> ヨハネ書の場合は<SBJohn>または<SB67>。
<SCxxx> 3章の場合は<SC3>,または(前の章が2章であれば)<SC>
<SVxxx> (15節に続く)16節の場合は,<SV16>または<SV>。
日付(非使用) <SDmmdd> 4月30日の場合は<SD0430>。通常は聖書本文中で用いられることはないが,日ごとの朗読用に編集された注釈書の中で使われるかも知れない。mmddが省略された場合,その次の日とみなされる。

各書の標識は以下の数値・英語名・略称のいずれかだ。ステップはこの形式では使われないが,変換の際の参考のために列挙されている。

旧約聖書 書名 英語名 略語 ステップ 番号
創世記 Genesis Ge, Gn 1 1
出エジプト記 Exodus Ex 2 2
レビ記 Leviticus Lev, Lv 3 3
民数記 Numbers Nu 4 4
申命記 Deuteronomy De, Dt 5 5
ヨシュア記 Joshua Jos 6 6
士師記 Judges Judg, Jdg 7 7
ルツ記 Ruth Ru 8 8
サムエル記第一 1 Samuel 1 Sa, 1Sa 9 9
サムエル記第二 2 Samuel 2 Sa, 2Sa 10 10
列王記第一 1 Kings 1 Ki, 1Ki 11 11
列王記第二 2 Kings 2 Ki, 2Ki 12 12
歴代誌第一 1 Chronicles 1 Ch, 1Ch 13 13
歴代誌第二 2 Chronicles 2 Ch, 2Ch 14 14
エズラ記 Ezra Ezr 15 15
ネヘミヤ記 Nehemiah Ne 16 16
エステル記 Esther Es 17, 95, 100 17
ヨブ記 Job Job 18 18
詩編 Psalms Ps 19, 91, 92 19
箴言 Proverbs Pr 20 20
伝道の書 Ecclesiastes Ec 21 21
ソロモンの歌 Song of Solomon Song, Sol, SS 22 22
イザヤ書 Isaiah Isa 23 23
エレミヤ書 Jeremiah Je 24 24
哀歌 Lamentations La 25 25
エゼキエル書 Ezekiel Eze 26 26
ダニエル書 Daniel Da 27, 89 27
ホセア書 Hosea Ho 28 28
ヨエル書 Joel Joe 29 29
アモス書 Amos Am 30 30
オバデヤ書 Obadiah Ob 31 31
ヨナ書 Jonah Jon 32 32
ミカ書 Micah Mi 33 33
ナホム書 Nahum Na 34 34
ハバクク書 Habakkuk Hab 35 35
ゼパニヤ書 Zephaniah Zep 36 36
ハガイ書 Haggai Hag 37 37
ゼカリヤ書 Zechariah Zec 38 38
マラキ書 Malachi Mal 39 39
外典 書名 英語名 略語 ステップ 番号
トビト書 Tobit Tob 69, 93, 98 40
ユディト書 Judith Judi, Jdt 70 41
エステル記(ギリシャ語) Esther (Greek) GrkEs 71 (追加分のみ);
88 (完全版)
42
知恵の書 Wisdom Wis 72 43
シラ書 Sirach Sir 73, 94, 99 44
バルク書 Baruch Bar 74, 90 45
エレミヤの手紙 Letter of Jeremiah Let 75 46
アザリヤの祈りと三人のユダヤ人の歌 Prayer of Azariah and the Song of the Three Jews Azar 76 47
スザンナ Susanna Sus 77 48
ベルと龍 Bel and the Dragon Bel 78 49
マカベア記第一 1 Maccabees 1Mac 79, 96 50
マカベア記第二 2 Maccabees 2Mac 80, 97 51
エズラ記第一 1 Esdras 1Esd 81 52
マナセの祈り Prayer of Manasseh Man 82 53
詩編151編 Psalm 151 P1 86 54
マカベア記第三 3 Maccabees 3Mac 84 55
エズラ記第二 2 Esdras 2Esd 83, 87 56
マカベア記第四 4 Maccabees 4Mac 85 57
新約聖書 書名 英語名 略語 ステップ 番号
マタイによる福音書 Matthew Mat, Mt 40 64
マルコによる福音書 Mark Mar, Mk 41 65
ルカによる福音書 Luke Lu, Lk 42 66
ヨハネによる福音書 John Joh 43 67
使徒行伝 Acts Ac 44 68
ローマ人への手紙 Romans Ro, Rm 45 69
コリント人への第一の手紙 1 Corinthians 1 Co, 1Co 46 70
コリント人への第二の手紙 2 Corinthians 2 Co, 2Co 47 71
ガラテア人への手紙 Galatians Ga 48 72
エフェソス人への手紙 Ephesians Ep 49 73
フィリピ人への手紙 Philippians Phili, Php 50 74
コロサイ人への手紙 Colossians Col 51 75
テサロニケ人への第一の手紙 1 Thessalonians 1 Th, 1Th 52 76
テサロニケ人への第二の手紙 2 Thessalonians 2 Th, 2Th 53 77
テモテへの第一の手紙 1 Timothy 1 Ti, 1Ti 54 78
テモテへの第二の手紙 2 Timothy 2 Ti, 2Ti 55 79
テトスへの手紙 Titus Tit 56 80
フィレモンへの手紙 Philemon Phile, Phm 57 81
ヘブライ人への手紙 Hebrews He 58 82
ヤコブの手紙 James Ja 59 83
ペテロの第一の手紙 1 Peter 1 Pe, 1Pe 60 84
ペテロの第二の手紙 2 Peter 2 Pe, 2Pe 61 85
ヨハネの第一の手紙 1 John 1 Jo, 1Jo 62 86
ヨハネの第二の手紙 2 John 2 Jo, 2Jo 63 87
ヨハネの第三の手紙 3 John 3 Jo, 3Jo 64 (14節);
67 (15節)
88
ユダの手紙 Jude Jude 65 89
ヨハネの黙示録 Revelation Re 66;
68 (12章が18節)
90

特殊文字タグ

編集

これらのタグはテキスト中の単一の文字を示す。

意味 タグ コメント
ASCII文字(非使用) <CAxx> xxは16進値
>(非使用) <CG> 左大不等号。
<(非使用) <CT> 右大不等号。
段落の終端 <CM> 段落や詩の行の終端。散文では空白行や字下げを生じさせることができる。
行の終端 <CL> 段落の終端以外の行の終端。詩的対句の最初の行で使われる。
Unicode文字(非使用) <CUxxxx> xxxxは16進値。

外部注釈・強調表示ファイル

編集

外部注釈・強調表示ファイルは,個々の聖書研究者が,聖書検索プログラムを使って聖書を学びながら,注解やメモを記すためのものだ。注釈・強調表示ファイルが聖書テキストと同時に開かれる場合,注釈はポップアップ機能や別ウィンドウ,あるいは脚注としてのページ下部への出力によって読者に提供される。強調表示設定は聖書テキストの表示される背景に適用される。注釈・強調ファイルはプレインASCIIテキストだ。その中では,フォントや段落特性のための聖書テキストと同じタグに加え,以下のタグが使われる:

意味 タグ コメント
注釈ファイルの開始 <HN> このタグは最初のトークンであるべきだ。
注釈(非使用) <NNref-ref> このタグに続くテキストは,指し示されている参照範囲に含まれる聖書テキストに関連した注釈だ。参照範囲はBook ch:vs wdの形式で表わす。Bookは(空白を含まない)略称または番号,chとvsは数字。wdの数字は節中の単語の番号。wdが省略されると,節全体とみなされる。vsが省略されると,章全体とみなされる。chが省略されると,書全体とみなされる。二番目の参照範囲が省略されると,参照範囲は一番目の範囲だけを包含するものとみなされる。最初の単語と最後の単語は連続する部分とみなされる
色(非使用) <NC rrr ggg bbb ref-ref> 強調表示背景色は,さし示されている参照範囲に適用される赤色(rrr)・緑色(ggg)・青色(bbb)に対応する0から255までの三つの数字で表わされる。参照範囲は注釈タグの場合と同様に解釈される。例えば,ヨハネ 3:16の全体を緑色で強調表示したいなら,タグは<NC 0 255 0 John 3:16>となる。ヨハネ 1:1の「In the beginning」を緑がかった青色で強調したいなら,タグは<NC 0 64 255 John 1:1 1-John 1:1 3>となる。
ファイルの終端 <ZZ> ファイルの最後のトークン。このトークンの後のものはすべて無視される。

日本語対応のための拡張案

編集

日本語のエンコード形式にはUnicode(UTF-8)を採用する。

情報タグに以下のタグを追加する。

開始タグ 停止タグ 目的
ルビ <RUkana> <Ru> kanaは,<RU>タグと<Ru>タグに囲まれた部分に対応する振り仮名を表わす。表示プログラムにより,該当範囲の上部に小さい文字で表示されたり,直後のカッコ内に表示されることもあれば,完全に無視されることもある。

また,日本語は分かち書きに向かないので,「254文字以内に限定された行から成るプレインASCIIテキストファイル」という条件をどのように満たすかが問題。日本語と日本語の間の空白文字は無視することにすればよいか。(現時点ではこの条件を破っています。)


脚注

編集
  1. 汎用聖書形式タグ付け仕様書
  2. General Bible Format Tagging Specification

関連項目

編集