Path: coconuts.jaist!wnoc-tyo-news!news.imnet.ad.jp!ripspost.aist.go.jp!news.tisn.ad.jp!is.s.u-tokyo!mech.t.u-tokyo.ac.jp!t-server!news.nc.u-tokyo.ac.jp!komaba!makino
From: makino@chianti.c.u-tokyo.ac.jp (Jun Makino)
Newsgroups: fj.comp.arch
Subject: Re: Effect of out-of-order execution (Re:How many ports do registers have?
Date: 03 Sep 1995 14:47:14 GMT
Organization: Dept. of Earth Science & Astronomy, College of Arts & Sciences,
	Univ. of Tokyo
Lines: 102
Distribution: fj
Message-ID: <MAKINO.95Sep3234714@tache.c.u-tokyo.ac.jp>
References: <ITOU.95Aug3124210@volga.mfd.cs.fujitsu.co.jp>
	<ITOU.95Aug4122321@volga.mfd.cs.fujitsu.co.jp>
	<KMATSUBA.95Aug4211942@marinara.mit.edu>
	<ITOU.95Aug7142405@volga.mfd.cs.fujitsu.co.jp>
	<KMATSUBA.95Aug8005949@vongole.mit.edu> <SAKURAI.95Aug8203754@edserv
	<MAKINO.95Aug30134510@chianti.c.u-tokyo.ac.jp>
	<YAMAZAKI.95Aug31095938@ga16.ed4.com1.fc.nec.co.jp>
NNTP-Posting-Host: tache.c.u-tokyo.ac.jp
In-reply-to: yamazaki@ga16.ed4.com1.fc.nec.co.jp's message of Thu, 31 Aug 1995 00:59:38 GMT


>>>>> On Thu, 31 Aug 1995 00:59:38 GMT,
yamazaki@ga16.ed4.com1.fc.nec.co.jp said:

> 山崎＠ＮＥＣです
> In article <MAKINO.95Aug30134510@chianti.c.u-tokyo.ac.jp> makino@chianti.c.u-tokyo.ac.jp (Jun Makino) writes:
>>>>>>> On Mon, 28 Aug 1995 06:38:31 GMT,
>> yamazaki@ga16.ed4.com1.fc.nec.co.jp said:
>> 
>>> もうすぐ、新しい世代のスーパーコンピュータ（CRAY T90,NEC SX-4等）の
>>> LINPACK 100x100の性能が公表されるでしょうから、それを見て、各社が何を
>>> 考えて設計したのか、もう一度考え直してみる事をお勧めします。
>> 
>> なんか話がかみあっていないような、、、各社がそのへんの努力をして
>> いないといっているわけではないのですが。どうも山崎さんがなにをおっ
>> しゃりたいのかよくわからないので、もう少しわかりやすく書いていた
>> だけると助かります。

> 「それほど N1/2にこだわる必要はなくなっている」とのご意見が現実にそぐ
> わない、と申し上げているのです。各社の努力はその傍証です。

いや、だから、N1/2にこだわるのは商売のためには重要なのでしょうね
と書いたつもりだったのですが、、、

ちなみに Linpack 100X100 は以下のようでした：
                 100X100    Peak  Ratio
T-90 1proc     : 522Mflops  1800    0.29
C-90 1proc     : 387        952     0.41
Cray-3 1proc   : 327        948     0.34
YMP  1proc     : 161        333     0.48

SX-3/14R       : 368        6400    0.058
VPP-500 1proc  : 206        1600    0.129
S-3800  1proc  : 408        8000    0.051

IBM RS6k/990   : 140        286     0.49
DEC 8200 1proc : 140        600     0.23

ふむ、日本のメーカが何を考えて設計したかはたしかに明らかですね。

>>>> どうせ MPP なんかは N1/2がどうしようもなく大きいわけだし。
>> 
>>> だからごく一部のアプリケーションを除いて性能が出ない。
>> 
>> 大規模並列である以上アプリケーションに並列性がなければ性能が出な
>> いのは当然ですが、当然のことをわざわざお書きになるのは何か主張し
>> たいことがあるのかと思います。それは何でしょうか？もう少しわかり
>> やすく書いていただけると助かります。

> 「どうせ」という表現から「N1/2が大きい事は克服せずとも妥協可能である」
> と考えてらっしゃるのではないかと推測致しました。しかし、現実にはMPPの
> 性能に対して失望感が広がっています。

依然としてなにをおっしゃりたいのか良くわからないのですが、、、

> また、MPPの問題は「大規模並列である以上アプリケーションに並列性がなけ
> れば性能が出ないのは当然」というレベルだけでなく、同じ性能、同じ数の演
> 算器を並べた場合、スカラプロセッサによる並列処理より単独のベクタプロセッ
> サの方が性能がでる、という点にもあるのです。

えっと、これって、単に共有メモリか分散メモリかっていう話じゃなく
て一般論としてこうだという主張でしょうか？それとも単に今商品とし
てでているものはたまたまそうなっているという話でしょうか？

現在の代表的なMPP といえば Intel Paragon か CM-5 といったところだ
と思いますが、 Paragon の場合 MPP だからという以前に i860 という
石がピークと実効性能の開きが大きいのが問題でしょうし、 CM-5はまあ
まがりなりにもベクタプロセッサですから。

>>> ついでに、レイテンシで妥協すると高いスループットのメモリシステムが低コ
>>> ストで作れる、というのも怪しいですね。出来れば、こんな風に作れば良いの
>>> だ、という例を教えて頂けませんか？
>> 
>> 具体例としては、Star 100/Cyber 205 のメモリシステムみたいなのはど
>> うでしょう？どんなものかはご存知ですよね？

> これはまた古い話を、、、

> ここで先の話題に少し戻りますが、Cyber 205がマーケットおいてCray-1に敗
> 北したことから学ぶ事はありませんか？

これについてですが、この「教訓」というのは、 RISC CPU のスカラ演
算速度といわゆるベクタプロセッサのスカラ演算速度が同じかあるいは
前者の方が速くなった今でも、本当に意味を持つものなのでしょうか？ 
Cray-1 の時代には、スカラジョブを流すのでもたとえば VAX に比べて 
Cray のほうが実質的にコストパフォーマンスがいいということがあり得
たのですが、現在はもうそんなことはあり得ないわけでしょう。当時と
はスーパーコンピュータに対して求められるものは違ってきているので
はないかと思うのですが。

まあ、Cyber が Cray に「敗北」したのは、発表が5年も違ってピーク性
能で最大2.5倍しか違わなければ当然という気もしますが。時期からすれ
ば Cray-1 よりも XMP と競合したのではないかと思います。

>> 山崎さんにはできればメモリシステムのコストがレイテンシに依存しな
>> いとお考えになる根拠を具体的に示していただけたらと思います。

> ここまで強い主張をおこなったつもりはありません。

あ、そうだったのですか。それならば結構です。

牧野＠東大駒場