Path: coconuts.jaist!wnoc-tyo-news!news.imnet.ad.jp!ripspost.aist.go.jp!news.tisn.ad.jp!is.s.u-tokyo!mech.t.u-tokyo.ac.jp!t-server!news.nc.u-tokyo.ac.jp!komaba!makino From: makino@chianti.c.u-tokyo.ac.jp (Jun Makino) Newsgroups: fj.comp.arch Subject: Re: Effect of out-of-order execution (Re:How many ports do registers have? Date: 03 Sep 1995 14:47:14 GMT Organization: Dept. of Earth Science & Astronomy, College of Arts & Sciences, Univ. of Tokyo Lines: 102 Distribution: fj Message-ID: References: NNTP-Posting-Host: tache.c.u-tokyo.ac.jp In-reply-to: yamazaki@ga16.ed4.com1.fc.nec.co.jp's message of Thu, 31 Aug 1995 00:59:38 GMT >>>>> On Thu, 31 Aug 1995 00:59:38 GMT, yamazaki@ga16.ed4.com1.fc.nec.co.jp said: > 山崎@NECです > In article makino@chianti.c.u-tokyo.ac.jp (Jun Makino) writes: >>>>>>> On Mon, 28 Aug 1995 06:38:31 GMT, >> yamazaki@ga16.ed4.com1.fc.nec.co.jp said: >> >>> もうすぐ、新しい世代のスーパーコンピュータ(CRAY T90,NEC SX-4等)の >>> LINPACK 100x100の性能が公表されるでしょうから、それを見て、各社が何を >>> 考えて設計したのか、もう一度考え直してみる事をお勧めします。 >> >> なんか話がかみあっていないような、、、各社がそのへんの努力をして >> いないといっているわけではないのですが。どうも山崎さんがなにをおっ >> しゃりたいのかよくわからないので、もう少しわかりやすく書いていた >> だけると助かります。 > 「それほど N1/2にこだわる必要はなくなっている」とのご意見が現実にそぐ > わない、と申し上げているのです。各社の努力はその傍証です。 いや、だから、N1/2にこだわるのは商売のためには重要なのでしょうね と書いたつもりだったのですが、、、 ちなみに Linpack 100X100 は以下のようでした: 100X100 Peak Ratio T-90 1proc : 522Mflops 1800 0.29 C-90 1proc : 387 952 0.41 Cray-3 1proc : 327 948 0.34 YMP 1proc : 161 333 0.48 SX-3/14R : 368 6400 0.058 VPP-500 1proc : 206 1600 0.129 S-3800 1proc : 408 8000 0.051 IBM RS6k/990 : 140 286 0.49 DEC 8200 1proc : 140 600 0.23 ふむ、日本のメーカが何を考えて設計したかはたしかに明らかですね。 >>>> どうせ MPP なんかは N1/2がどうしようもなく大きいわけだし。 >> >>> だからごく一部のアプリケーションを除いて性能が出ない。 >> >> 大規模並列である以上アプリケーションに並列性がなければ性能が出な >> いのは当然ですが、当然のことをわざわざお書きになるのは何か主張し >> たいことがあるのかと思います。それは何でしょうか?もう少しわかり >> やすく書いていただけると助かります。 > 「どうせ」という表現から「N1/2が大きい事は克服せずとも妥協可能である」 > と考えてらっしゃるのではないかと推測致しました。しかし、現実にはMPPの > 性能に対して失望感が広がっています。 依然としてなにをおっしゃりたいのか良くわからないのですが、、、 > また、MPPの問題は「大規模並列である以上アプリケーションに並列性がなけ > れば性能が出ないのは当然」というレベルだけでなく、同じ性能、同じ数の演 > 算器を並べた場合、スカラプロセッサによる並列処理より単独のベクタプロセッ > サの方が性能がでる、という点にもあるのです。 えっと、これって、単に共有メモリか分散メモリかっていう話じゃなく て一般論としてこうだという主張でしょうか?それとも単に今商品とし てでているものはたまたまそうなっているという話でしょうか? 現在の代表的なMPP といえば Intel Paragon か CM-5 といったところだ と思いますが、 Paragon の場合 MPP だからという以前に i860 という 石がピークと実効性能の開きが大きいのが問題でしょうし、 CM-5はまあ まがりなりにもベクタプロセッサですから。 >>> ついでに、レイテンシで妥協すると高いスループットのメモリシステムが低コ >>> ストで作れる、というのも怪しいですね。出来れば、こんな風に作れば良いの >>> だ、という例を教えて頂けませんか? >> >> 具体例としては、Star 100/Cyber 205 のメモリシステムみたいなのはど >> うでしょう?どんなものかはご存知ですよね? > これはまた古い話を、、、 > ここで先の話題に少し戻りますが、Cyber 205がマーケットおいてCray-1に敗 > 北したことから学ぶ事はありませんか? これについてですが、この「教訓」というのは、 RISC CPU のスカラ演 算速度といわゆるベクタプロセッサのスカラ演算速度が同じかあるいは 前者の方が速くなった今でも、本当に意味を持つものなのでしょうか? Cray-1 の時代には、スカラジョブを流すのでもたとえば VAX に比べて Cray のほうが実質的にコストパフォーマンスがいいということがあり得 たのですが、現在はもうそんなことはあり得ないわけでしょう。当時と はスーパーコンピュータに対して求められるものは違ってきているので はないかと思うのですが。 まあ、Cyber が Cray に「敗北」したのは、発表が5年も違ってピーク性 能で最大2.5倍しか違わなければ当然という気もしますが。時期からすれ ば Cray-1 よりも XMP と競合したのではないかと思います。 >> 山崎さんにはできればメモリシステムのコストがレイテンシに依存しな >> いとお考えになる根拠を具体的に示していただけたらと思います。 > ここまで強い主張をおこなったつもりはありません。 あ、そうだったのですか。それならば結構です。 牧野@東大駒場