記事の形式

1. 原本との非同一性

Ancient fj NetNews archive は、 NetNewsとして流通していた記事をそのまま保存したものではありません。 GalaxyやASKSでは、サービス内容にあわせ、記事に多少変換を施して提供していました。 このアーカイブでは、それを元になるべく原本に近い形に記事を復元再構成しました。 しかし、以下のような理由により、実際に流通したものと異なっている場合があります:

Galaxy netnews archive から取得した記事の場合:
tabの4 spaceへの展開、複数行に渡るフィールドの変換、文字コードの変換上の制限など。
ASKS netnews archive から取得した記事の場合:
1行目の欠落、行先頭の空白の特殊扱い、不正なLines:フィールド、MIME encodeとSubject:フィールドの不整合、複数行に渡るフィールドの削減、文字コードの変換上の制限など。

色々な情報を摺り合わせて可能な限り再構成しようと試みましたが、 一部文字化けのようなものが残ったり、復元が不可能だった部分もあります。

2. ヘッダー部に追加したフィールド

記事の再構成に関係する情報をヘッダーに追加してあります。 追加したフィールドは以下の通りです。

X-originally-archived-at:
記事をどこから取得したかをURLで表します。 ここに記述されているURLは既に廃れたもので、現在は参照できません。
X-reformat-date:
記事の再構成を行なった日付で、バージョンの意味を併せ持ちます。 実用的なアーカイブは18 Nov, 2003以降のもので、 それ以前のものは再構成に大きく失敗しています。
X-reformat-comment:
原本と相違がある旨の注意書きで、違いの要約をしてあります。
X-reformat-error:
何らかの理由で再構成がうまくいかなかった記事についてのみ追加したフィールドで、 失敗の内容を示します。 現在のところ、以下のような失敗を確認しています。
X-reformat-error: Irregular or illegal code in the original archived article. (後略)
文字コードのiso-2022-jpへの変換に失敗したものにこのフィールドが付いています。
X-reformat-error: Illegal Date field.
Date: フィールドの形式が規格外のものにこのフィールドがついています。
X-virus-detected:
コンピュータウイルスを含む記事。 現在のところancient fjの記事にはコンピュータウイルスは発見されていない。

これ以外の問題を発見した方は、ぜひご連絡ください。


編集者:渡邊克宏 <katsu@watanabe.name>

最新アーカイブ編集日時: Mon, 18 Oct 2004 15:18:22 +0900