ヘルプ:プロジェクト・グーテンベルク

ヘルプ:プロジェクト・グーテンベルク

このページではプロジェクト・グーテンベルクを取り上げます。プロジェクト・グーテンベルクはWikisourceと同様のフリー原文プロジェクトです。このページは、この2つのプロジェクトが相互補完をする方法を明確化することと、協力する方法を提案することを目的としています。

このページの方針と提案は、議論ページ英語版)における広範囲にわたる議論をもとに、作成してください。

テンプレート 編集

作品の取り込み 編集

プロジェクト・グーテンベルクからコピーした作品英語版)を見ると、たくさんの作品がプロジェクト・グーテンベルクからWikisourceのmain名前空間にコピー・アンド・ペーストされているのが分かります。これでも構いませんが、底本による裏付けができません。より望ましい選択肢として、プロジェクト・グーテンベルクの作品を、Wikisource上への翻刻用の基礎的テキストとして利用する方法が考えられます。この方法は時間がかかりますが、それでも通常の作業よりは早く終わります。(というのも、ほとんどのタイプミスやスキャンミスは修正されているためです)

一般的な手順は以下の通りです:

  1. 通常通りIndexページを作成し、適切なページリストなども付けます。
  2. HTML版作品をプロジェクト・グーテンベルクからダウンロードします。
  3. HTML版をテキストエディターで開き、段落タグ (<p>…</p>) を取り除きます。他のタグ、特に、<i><u>などはそのままにしておいてください。これらは、Wikiテキスト上でも修正なしで正常に作動します。
  4. ページごとにHTMLからコピーと貼り付けをします。

Wikisource:TemplateScript英語版)のClean up OCRスクリプトはこの種の作業に有用です。

関連項目 編集