Ancient fj NetNews archive

NetNews の世界の fj ニュースグループ群の古い記事を公開します。 GalaxyやASKSといったWeb上のサービスで公開されていた記事を保存していたものです。 JUNET時代の1980年代末から1990年代末ぐらいまでの古いものを集めました。

主として技術関係のニュースグループしか保存できていません。 また、当時の実際の流通分に比べると、このアーカイブが捕捉している記事の量はそう多くはありません。 現在、このアーカイブを含んだより大きなアーカイブ Unified fj NetNews Archive を公開していますので、その利用も考えてみてください。

付随するニュースサーバと検索システムは現在停止しています。

1. 閲覧と検索

1.1 アーカイブの取得

tar + gzip でまとめたアーカイブは、Ring Serverのソフトウェアライブラリ http://www.ring.gr.jp/archives/misc/ancientfj/ から取得できます。

最新アーカイブは、Ring Server上でのファイルのタイムスタンプ(last modifiedという欄)が Mon, 18 Oct 2004 15:18:22 +0900 以降の日付のはずです。これ以前のものは、古いアーカイブのファイルです。

1.2 全文検索

全文検索システムは2011年7月24日をもって停止しました。 これは、ancientfjを完全に含んだ、より大きなアーカイブ Unified fj NetNews archive の整備が進んで安定してきたことによります。 現在はそちらの fj全体の全文検索システムを利用してください。

1.3 個々の記事の参照方法

Message-Id がわかっていれば、個々の記事をWebで参照することができます。

1.3.1 対話的な参照方法

Message-ID から記事を探し出して Web で閲覧する サービスを提供しています。

1.3.2 リンクのはりかた

個々の記事へリンクを張るために、そのURLを知りたいこともあるでしょう。その場合、

http://katsu.watanabe.name/ancientfj/article.php?mid=

に続けて Message-ID を指定すると、当該の記事を閲覧できます。 ただしこの際 Message-ID の部分には、 いわゆる URL encoding(RFC1738,2396 に基づく escape)を施す必要があります。 なぜなら、Message-ID に含まれるさまざまな特殊文字の中には、 そのままでは URL には使えない文字 (@,$,&,...) があるからです。 なお、Message-ID の両端の<>は省略してもかまいません。

例として、

Message-ID: <KATSU.92Jan21190539@sran14.sra.co.jp>

の記事は、以下のURLで参照できます:

http://katsu.watanabe.name/ancientfj/article.php?mid=KATSU.92Jan21190539%40sran14.sra.co.jp

上の Message-ID には特殊文字の @ が含まれていますが、 URL ではこれを escape して %40 としてあることに注意してください。

1.4 公開ニュースサーバの停止

公開ニュースサーバは2008年のはじめごろまでで停止しました。 停止の理由は以下の通りです。

希望する方が多ければ、再度サービスを稼動させることは可能です。

2. 記事の形式

このアーカイブは、NetNewsとして流通していた記事の原本を完全には再現できていません。 また、ヘッダーにいくつか独自のフィールドを追加してあります。

3. 権利義務と配布条件

4. バージョン

各記事のヘッダーに追加した X-reformat-date: フィールドの日時は、 アーカイブの版の区別をつけるのに使っています。

X-reformat-date: Mon, 18 Oct 2004 15:18:22 +0900
fj.os.miscに記事を追加。 ヘッダが途中で切れていた記事を修復。 Message-Id:等のフィールドの正規化。
X-reformat-date: Tue, 18 Nov 2003 21:47:11 +0900
人様にお見せする最初の版。

5. ニュースグループの説明

アーカイブに含まれているニュースグループとその説明です。

6. 参考文献と関連する資源

6.1 発端

Galaxyのサービスが公開されたという記事:

From: hironobu@trc.rwcp.or.jp (Hironobu Takahashi)
Newsgroups: fj.comp.text,fj.comp.ai,fj.ai,fj.news.group
Subject: Text retrieval system for internet news (FJ Category)
Date: 22 Sep 1999 05:47:03 GMT
Message-ID: <7s9qgn$qh3@news.trc.rwcp.or.jp>

を、下記のURLが示すページで閲覧することができます。

6.2 salvageできた記念碑的な記事

JUNET時代のfjの記念碑的な記事をいくつかsalvageできています。

6.3 補完する他のアーカイブ

Coverage comparison between various archives

時系列上でみてここで公開したアーカイブに引き続くものとして、 JAISTのネットニュースアーカイブ がありました。 これは1990年代の初頭から2001年ぐらいまでの記事が蓄積されていました。 それ以降についてはQueenのアーカイブが2002年末までサービスをしていました。 その後のものについては、googleが蓄積しているニュース記事が利用できるでしょう。

上記のJAISTのアーカイブの手持ち分をancient fjと併合し、 新たに Unified fj NetNews archive として2011年5月に整備しました。

6.4 捕捉率

このアーカイブが捕捉している記事の量はそう多くはありません。 まず、GalaxyやASKSに残っていた記事は流通分を網羅しておらず、かなり抜けがありました。 さらに、それらを保存する際に相当量の取りこぼしが生じていました。 投稿されて一般に流通していた記事全体を基準にすると、 捕捉できてこのアーカイブに含められたのは半分程度と想像しています。

Coverage comparison with osaka-u

ここに示した図は、 ここで公開しているアーカイブ(図のancientfj)の一日平均の記事数を、 大阪大学に到達した記事(図のosaka-u)の一日平均の記事数と比較したものです。 ある程度流通量があって典型的と思えるニュースグループと思えるfj.unixに関しての比較です。 大阪大学での記事数は、fj.comp.listsに定期的に投稿されていた

Subject: Subject: News traffic in these days by byte

というSubject:の記事から統計を取りました。 これは、 齊藤明紀先生が icspub.ics.is.osaka-u.ac.jp に到達した記事について、 2週間に1度記事数やバイト数の統計をとっていたものです。 ancientfjの方は1ヶ月ごとに平均値を算出しました。

7. 個人情報の扱い

このアーカイブやNetNewsサーバに含まれる記事の中には、 個人に関する情報(いわゆる個人情報)が含まれていることがあります。 これらは、 2003年公布の個人情報保護法が定める個人データには該当しませんし、 当サイトは個人情報保護法における個人情報取扱事業者には該当しません。 しかし、個人情報保護法の精神と、その制定にまつわる社会の要請を鑑み、 当サイト運営者は自主的な判断で個人情報の保護にあたります。

個人情報の保護指針や開示等の手続きについての詳細は、 katsu.watanabe.nameでの個人情報の扱いについて のページを参照してください。

8. 謝辞

fjで有用な議論をしてくださった投稿者の方々に感謝いたします。 fjの黎明時からの古い記事を保管していて広く公開して下さった 新情報処理開発機構(RWCP)情報ベース機能つくば研究室に感謝いたします。 RWCPの存在当時、高橋裕信さんには何度か質問にお答えいただきました。

このアーカイブの配布元として、 Ring Server Projectの ソフトウェアライブラリのお世話になっています。


編集者:渡邊克宏 <katsu@watanabe.name>

最新アーカイブ編集日時: Mon, 18 Oct 2004 15:18:22 +0900