技術書をちゃんと読んでくださいね。 Nemirovsky, Mario, and Dean Tullsen. Multithreading architecture. Springer Nature, 2022. p.33 "Intel's Pentium 4 Xeon server processors introduced simultaneous multithreading under the proprietary name Hyper-Threading" Richard Jones他「ガベージコレクション」 翔泳社, 2016. p.282 「この技術は同時マルチスレッディング(SMT)、あるいはハイパースレッディング(hyperthreading)と呼ばれ」
XeonではHTが残ると予想しているのは、サーバーはコア数が多く交通整理でデータ配送に時間がかかりがちなため、SMTの効果が出る待ち時間が生じやすいだろうという推測によります。実際、サーバー専用のIBM POWERシリーズは1コア8スレッドや4スレッドのSMTまでサポートしています。AMDはサーバー向けのEPYCとダイを共用しており、それが続く限りSMTをなくすことは考えにくいです。なお「Hyper-Threadingはsimultaneous multithreading (SMT)ではない」などの珍妙な主張がコメント欄に見られますが、世界の技術書では普通にHTはSMTのIntel商標だと解説しています(歴史的にSMTを最初に実装したのはIBMやDECなど)。
Nemirovsky, Mario, and Dean Tullsen. Multithreading architecture. Springer Nature, 2022.
- p.33 "Intel's Pentium 4 Xeon server processors introduced simultaneous multithreading under the proprietary name Hyper-Threading"
Richard Jones他「ガベージコレクション」 翔泳社, 2016.
- p.282 「この技術は同時マルチスレッディング(SMT)、あるいはハイパースレッディング(hyperthreading)と呼ばれ」
どうやろな。そういうバリエーションもありえるけど、そんなSKU作る余力があるだろうか。クラウドデータセンター向けでは2CPU単位で割り当てないといけなくなって、性能は2CPUほどはないってのは、SMTのないARM系サーバーCPUと比較して明確に電力性能が劣るから苦戦してる。CPU上のレジスタ数が半分になったら、消費電力量はだいぶ減る。サーバー側は3rdキャッシュまであるのが基本だから、なおさらSMT効果が無いタスクが多い。SMTが有効なのはエッジ機器などタスクの大きさが固定的なものとデスクトップCPUみたいなキャッシュ階層の薄いユーザー操作トリガの特定タスクに限られるよ。POWERシリーズは汎用機最適だからサーバー製品としては微妙な立ち位置。
@@zaxx7884 Milan-Xのデモ・検証でもありましたけどキャッシュ増設で時間当たり処理量が1.5倍くらい伸びる処理ってそこそこあるのでデータ待ちが発生する処理が結構あるのは事実ですね。Intelの場合はARMというかNeoverse系対抗はEコアXeonの系列が担っていくことになりますし、次世代Clearwater ForestはNeoverse系でも対抗が難しいんじゃないかというかなりの電力効率になることはほぼ確実だろうという状況ですね。
メニーコア化が進む中HTのメリットが薄くなってきたのはわかりますけど、AMDはHT(SMT)で行くみたいだし、この技術的取捨選択がどう出るかは楽しみですね
AMDのSMTはintelのHTよりかなり少ないトランジスタ数で実装されているので、その分コストが少なく性能は同程度上がる技術となっているのです
なので維持して正解なわけですね
直感的にはHT廃止は一般ユーザーにとってはデメリットはない気がする
どうせゲームにしか使わないしマルチスレッド性能は実装コアで十分
元々i5でいいとか言ってたし
@@色違いモノ PコアとEコアの両方がある構成だとまあそうなるわな
同じ事をしても対抗できない場合、相手と違う事をしないと効果はありません
HT技術はAMDの方が後追いなのを考えると、インテルの方が挑戦的だといえますね。
ただインテルが設備投資すると仕事が増えるのでほどほどにして欲しいです。
EコアのSkymontが高性能になった事と密接に関係するんでしょうね。
Raptorくらいまでは、Pコア1C2TとEコア2C2Tの性能が大きく違わなかったでしょうから、JOBをどちらに振っても大きな損失は無かったでしょう。
でもLunarやArrowからは、Eコアの性能が大きく向上するので、Pコア1C2TにJOBを振ってしまうと損する可能性が無視できないんだろうと思います。
Eコアの性能が上がったおかげで、PコアからHTを除去してもマルチ性能を十分に補ってくれるという見積もりもあるんでしょうね、きっと。
だからこそ、ハイブリッド構成を採らないXeon系は、HT対応を継続してもJOBスケジューリングの心配が要らないので、HTが残る可能性があると。
1コア2スレッドとか2コア4スレッド位がメインだった頃はともかく、物理コアがめちゃくちゃ増えてる現代ではHTの恩恵が小さいというのは理解できるし、今の多コアCPUをフルでブン回す用途なんて限られるから多くのユーザーには余り関係ないのかもしれんが、4K動画編集をまぁまぁする自分としてはとにかくマルチ性能が重要なんだよな……Ultra9最上位は8p16eって話だけど、できればEコアを1割で良いから増やして欲しかった……
HTの面積分を回路増設に充てて性能アップを目指そうとしているのかな
Zen5がプロセス微細化の分を回路増設で埋めて性能を向上させたように
HTって基本的に実コアの数より多いスレッドが動作している場合にしか恩恵がないのでPC用途では実コアの数が増えるにつれて性能向上する場面が減っている。一方で実行されるスレッド数が多いサーバ用途だとHTの恩恵が大きいからHT使われる。intelのPC用CPUからHTを削除するのは妥当じゃないかなぁ。
アクセラレーテッド コンピューティング
言われるまでもなく専用のほうが一桁二桁早くなるのは大昔からみんな知ってた
万能無敵を目指す、から専用ロジックへの回帰は感慨深い
そもそもパソコンとサーバーでCPU共用流用するのが無理なんで
ARM系のCPUでHTが採用されていないように、省電力化や脆弱性対策を考えれば捨てるのが正解。IntelはN100が売れているし、省電力用途ではまだまだ根強い人気があるからそちらに舵を切るのは間違いではない。
個人的にはLunar Lakeで内蔵Arc GPU性能がMeteor Lakeの1.5倍に上がるのが楽しみ。(Meteor Lakeの時点でRadeon 780Mよりも高性能だがあまり認知されていないw)
Ryzen AI9 HX300シリーズに搭載されてるRadeon 890Mでまた抜き返されてる気がします
なるほど今まで休憩無しのブラック勤務だったのが改善されるわけか。
空いた面積をそのまま切り詰めてダイ面積を小さくして製造コストを下げたり、逆にIPC向上の為の回路を追加してシングル性能を伸ばしたりということが可能なんでしょうか?
結構面白いというか、intel独自の進化として期待できそうなので、個人的にはこのままHT廃止の方向を維持して欲しいと思います。
絶対にというものに対してはHTT廃止で性能低下するかもしれないけども、多くの場面においてシングルスレッド性能重視のアプリケーションが多いから、もしかしなくてもARM系のApple M系みたいに「割り切って効率を求める」方向へ舵を切ったのかもしれない。ただx86系でどこまでやるか次第では中途半端になってしまうことに危惧してる。
intelのHTはあまり実装が良くない
AMDのSMTとほぼ同様の機能で性能向上幅もほとんど変わらないのに、必要なトランジスタの数がかなり多い
なのでintelのHTはAMDのSMTよりかなり電力的にも半導体の面積的にも効率が悪い
まあAMDのSMTは後発なので改善されていて当然なんだけど、intelはBig-Biggerを本格的に採用した分HTの恩恵が小さくなり、AMDと戦えるようにHTの改善をするより廃止という判断になったと思われる
それはZenアーキテクチャでしょうか、それともそれ以前の世代でしょうか?特にSMT回路を外したZenアーキテクチャは市販されたことがなく、ましてZenのSMTに絞った検証も浅学の身で聞いたことがないので、ぜひそういった論文や技術書、検証記事があればご教示ください。
最初に開発したDEC alphaのCPU開発チームがほぼ丸ごとAMDに行ってるので技術的にはAMDの方が本家筋になるとかいう話だったような。
@@mulu-ur7lu これマジ!?
@@toumatoma9751 wiki にのってるしRETAINにものってる(´・ω・`)
サーバ運用者から見ると、CPU使用率が分かりにくくなりリソースに空きがあるのか枯渇してるのか判断しずらくなるので、XeonもHT排除してその分コア増やしてもらえるといい
@@さっちん-w6d その為の右手ならぬ
E core xeon…
ベンダーによってはそれが理由でHT無効化をデフォルトにしてるところがありますしねえ
セキュリティとモバイル重視ということですね。
今は多コアだから回路そのものからHTが削除されれば消費電力やコストも下がるし良いと思うけどな。
キャッシュのレイテンシーも下がりそうだし。
あとセキュリティ対策が簡単になるということはセキュリティ対策での速度低下も抑えられるということ。
スペクトルとかの対策では結構速度落ちたからな…
デスクトップではできるなら絶対やった方が良い
スレッドの振り分けが複雑化して手に負えなくなったか、モバイルがHT無しになったからデスクトップのためだけにソフトウェアを整備する費用対効果が低くてやめたかのどっちかな気がする
今のデスクトップ市場はゲームに偏っていて、ゲームでは1スレッドに1コアを独占させる利益が考えうる(実際この動画th-cam.com/video/J5W5ULzxZGI/w-d-xo.html ではFPSが無視できないレベルで上がっている)ので、動画編集人口よりゲーマー人口のほうが多いためにこの選択かな……という気もしています
ただ今のFPSの設計がレガシーである意味マルチコア転換期でコア使うようになったゲーム増えてるんで……
裏目にでないといいですけど……
11世代以前のCoreシリーズで組んだ自作PCでESXiの検証やってたけど、今後はもし壊れたらRyzenに切り替えるor頑張ってXeon買うしかなさそう・・・
長所をアピールして機能増やすやり方から短所叩いて機能削るやり方に舵を切ったのかと思えます。
久しぶりです。
HTの有無での性能への影響は近いうちにわかるでしょうから今は言いません。あえて言うならば未だシングルに頼るゲームではそこそこ伸びると思います。
Intel はEとPがコンシューマとサーバー向けで分けているように今後はHTもそうなるでしょう。現にDMRではLion cove+を搭載するかはおいといて暫くはHTを搭載しまうする予定です。
9月、10月にLNLとARLが発売されますがまた解説してくれると楽しみです😊
ご無沙汰しております。Zen5がスルーされてZen4-Xが売れてるようで、デスクトップもゲーム用メインになっていて、ゲームFPSとMT性能を天秤にかけると前者に軍配が上がりそうという感がありますね……ゲームのHT無効検証動画を見てみたら想像以上にがっつりFPSが上がっている例( th-cam.com/video/J5W5ULzxZGI/w-d-xo.html )があってびっくりしました。LNLはタブレットが出たら、ARLは価格が落ち着いたらデスクトップ用に買う予定です。
@@h428schannel
ありがとうございます😭
解説動画の方ですがわざわざ購入されなくてもWintab.netの方で貸し出し機とか提供されるものではないんでしたっけ?なんか私の要望で実機を購入させてるような感じがしてあれなので…前回のようなメタアナリシスを想像してましたw
更新再開やったぜー!
バグ入りプログラム入れなきゃ、とりあえずOK🎉
自分は通常、BIOSスイッチがあれば、HTを切って使っています。
ゲームでも業務でも。
と言ってもなぁ… xeon用途ではHTは続投だし… 逆にEコア xeonがハイパースレッドをやってくる可能性だって否定出来ないからなぁ…
Xeonはマルチ用途向けで一般向けとは向き不向きが大きく異なるから、時期的にズラした戦略になる可能性は有り得るね
コンシューマー向けも、色々HT周りを刷新して帰って来るの待ってるからな!
ゲームしかしないから正直ありがたい
ハード面でのボトルネック対策の方が重要なので、仮想処理自体が速くなるとは思えない
データの入出力処理を倍にできる分は早くなるのでしょうが、予測処理をしている以上処理が複雑になればなるほど消費電力が増えて電力当たりの処理能力は上がらないという事になるのは最初からわかっていたはず。
だいたい、データのリードタイムが遅いため、メモリーとCPU間の処理速度の差が云々・・・キャッシュデータのスピードが云々・・・画像処理速度が・・・キー入力待ち時間が・・・
最終的には余計な処理をしないCPUのスピードで押し切る方が速くなるはずです。
ガリウム系の素材の使用が待ち望まれています。
ベンチマークの結果より実用性を重視して欲しいです。
NetBurstころのコンセプトがそれだと思いますが、結局信号は光の速さでしか伝わらない=どんな素材を使おうがクロックに上限がある、というところで「スピードで押し切る」にしても模索の方向が変わったという歴史があるかと思います。
@@h428schannel 複数のCPUで並列処理というのが、何らかの新しい方法が必要な時期だと思います。
量子コンピュータはどこに行ったのだろう?試作品はできているはずなのに、市販化できてない。
Xeon6ではEコアモデルのみHTなしでPコアモデルは変わらず。
HTが必要だった理由を考えればもうねぇ
今となってはHTある方が遅くなります
HTは役割を終えた。仮想コアより物理コアを多く積んでほしい。
pythonでCPU使う計算をガンガン回しているけど、計算プロセス数が物理コア数を越えると性能が一気に劣化する。
HTを消して空いたところに物理コア、Eコアでもいいから積んでほしいもんだ。
確かに要らないかもですね。AVX使用中にそれに依存しないコードを挟むことはほとんどないですから。
HTはパイプラインの穴埋めに過ぎないから、プログラムのスレッド数を用意できるCPUスレッド数以下にして、全部のスレッドを個別のCPUスレッドに固定的に割り当てて、全部のCPUスレッドを電力消費量抑制何それ美味しい?とて定格クロック100%で常時ぶん回すようなガチもガチの組み込みソフトだと、HT無しの方がマルチスレッド性能が良いんだよね。そういう文脈では歓迎出来る。
けど、webサービスや普通のPCアプリはそういうものじゃないから、有り難みは薄いだろうな…
それに近い挙動のゲームが少なからずあり、今のデスクトップ市場ってゲームに偏っているのでそれを考慮してHT廃止というのもあり得そうなんですよねえ。
@@h428schannel コア数足りないけどHT切りたいからもっとコア数多い上位CPUに換装してくれ、とは言い難いので、HTでスレッド数水増し不可だから上位CPUに換装してくれ、と言えるのは組み込み的には嬉しいかも。でも、ゲーム業界だとプレイ環境はユーザ次第だから、嬉しさの方向性は違うのかな?
セキュリティやろなと思ったら、サーバー用途に残るなら省電力なのか?
サーバー用途であればHTありのほうが省電力として機能することが多い、という感じですね。使うアプリとの相性の問題です
もうシングルコアに戻しちまえよ!
単純にHTを使うよりEコアでスレッド消費した方がメリットが大きいからかもしれない
行き詰まったらまた3世代ぐらい先に復活するんやないか?
爆熱対策で、こうしないといけなくなった?
RPLに対するARLの同性能電力はHTありの場合でも50%~65%程度と見込んでおり、それ以上さらに削りたいから、というあたりだと見込んでいます。チラ見せ版はこちらに。
th-cam.com/video/1dQNxTRazes/w-d-xo.html
電力効率的にも微妙で、動作も速くなく、セキュリティもほぼ現実的じゃないレベルのことだから、一般人には関係なさそうに思いました。
まぁ、TH用の回路がなくなるから、その分の面積にトランジスタ詰めたり、小さくさせるというメリットはあるかと思います。
名を捨てて実を取りにきている感じで市場の反応が楽しみ。MacBookを仮想敵とするMicrosoftのARM偏重に一石を投じて欲しいです
MMXからHTまでの実装の歴史とコード書いたやつでないとこの動画わからんだろ(´・ω・`)
ゲームでも8コア使ってるのあんまり無いなぁ。
サイバーパンクぐらいしか思いつかん。
HTは必要じゃないかなぁ…。
これ「AMDのHTにいつまで経っても勝てない」という事実上のIntelの負け宣言では?
HT廃止してもRyzenには勝てませんよ。
以前にPコアとEコアのIPCを厳密検証した結果から言うと、
1) Pコア8つからHTを抜くと、Pコア2つ分性能が下がり、Pコア1つ分のスペースが空く
2) Pコア1つ分のスペースにはEコア4つを入れることができ、Eコア4つはPコア2つ分のマルチ性能を出せる
という形で、HTを抜いてEコアを入れるとデメリット無しにHT廃止の恩恵だけ受けられる関係になっていて、そこが決断を後押ししたのかなと思います
あくまで方向性の違いかと
これオーバークロック有りの性能かな…
基本的に俺はオーバークロックしない、処理に不安があるなる重くなりがちなUI軽くするだろう
5:30 〜 5:45 ヒッ
何か音声が混ざってる
4:30 俺なら処理が必要な時に処理能力が高いコアに処理させる、省電力にする必要ある時にはクロックの低いコアに処理させる
など条件分岐させるけどもな、例えば立ち上げてからアイドル時はそう、重たい処理は行なっていない
エンコーディングだとか規則正しい処理で一定時間処理する様な時、
更新だとか処理が手早く終わらなきゃならない様な処理
複雑にしているのではなく、使い方知らないか作った人の意図が理解出来ないコーディングで潰されたスレッドディレクタだと思う
まぁ処理はシンプルが1番って意味なら俺たちは元祖に戻って来たんだろうな
5:24 〜 5:27 何かの音
はためく音が入ってるね、また変な証明書が混ざったか
セキュリティやろなー
具体的にどうなって脆弱性につながるの?
複数ユーザーのデータがマルチスレッドで処理されるようなサーバー用ならわかるけれど一般用途でそこまでセキュリティを高める理由がわからんな。
こんにちは。
根本的に間違えている事
HTTは『疑似マルチスレッディング』でSMTは『同時マルチスレッディング』です
この2つの決定的な違いは『最初から演算器が分割されているかどうか?』よ
HTTはOS上では分割されているが実際には分割されてないんですよ
従ってHTTは『1スレッド目と命令に依存関係が無い場合且つ演算器に空きがある場合にのみ実行可能』なんですよ
SMTは依存関係がなければ必ず演算器の空きはあるから実行できるのにね
この結果、SMTの実行効率は最大2倍、平均1.41倍なのに対し
HTTは最高でも1.41倍、平均だと1.21倍しか向上しないんですよ
で、一番の問題はそこじゃない
x86系CPUはP6&K5以降x86命令を1〜3個のRISC命令に変換して実行している事と
プロセッサは1スレッドにつき同時に1命令(x86命令換算)しか実行できない事よ
従ってHTTを切ったという事はArrow Lakeで同時に使われるALU数は最大3個。これに対しZen5のALU数は6個
つまりArrow Lakeの1コア辺りの演算能力はZen5の1スレッドと同レベルという事になり
結果、Bulldozer vs Sandy Bridgeの再来ですわ
(実際にはBulldozerが2個なのに対しSandy Bridgeは3個なので前回より状況が悪化してる)
ここから導かれる事はArrow Lakeの最上位品は同じ24スレッドである9900X@$499より安価で売らなくてはならないという事よ
Arrow Lakeの原価は最低でも$300以上で単品販売する事を考えれば$600以上で売らなきゃ赤字なのに何でArrow Lakeなんか売るんですかね?
ちなみに会社の業績を好転させ未来がある様に見せるためにはArrow Lakeを最低でも$1,800以上で売らないと辻褄が合わない
・・・Intelに未来はあるんですかね?と
@@ケンイチのサブチャンネル いや、どちらも同一存在ですよ HTTはintelの商標なだけで
技術書をちゃんと読んでくださいね。
Nemirovsky, Mario, and Dean Tullsen. Multithreading architecture. Springer Nature, 2022.
p.33 "Intel's Pentium 4 Xeon server processors introduced simultaneous multithreading under the proprietary name Hyper-Threading"
Richard Jones他「ガベージコレクション」 翔泳社, 2016.
p.282 「この技術は同時マルチスレッディング(SMT)、あるいはハイパースレッディング(hyperthreading)と呼ばれ」
ちなみにIntelレベルではデスクトップ向けの収益は取るに足らない事も知りませんでしたか?ノートは今でも多く売れています。現在の状況はSPRの遅れの影響が明白に出ていることによるものです😂
昨今の多コア環境であればHTは持ちぐされなんだろうなぁ。
PCとしてはキャッシュがちっちゃくてしかも遅かった時代の遺物
サーバーになると話違うけどもパソコンはねぇ
で、インテルの客層はコンシュマー
実際、PCでもHTが速いと実感した事は無い
アムダールの法則
今使ってるCPUがHT非対応(Corei7-9700)だから、別にいい。
事実がどうだろうと、全部PコアのAMDが最強って誰でも想像するからな。
長方形は反り返るし、ハイパースレッディングはマイナスでしかなかった。
HTも、最近渦中のTBTも、これ以上マシンライフと消費電力を犠牲にしてまで性能を望みたくはありません。
私達個人ユーザーが求めているのは「信頼性」と「費用対効果」なので、Intelの大艦巨砲主義には長年疑問を抱いていました。
それはそうと、サーバーとの対比にデスクトップ&ラップトップなどを「パソコン」と表現するのは誤りではないでしょうか?
デスクトップもノートもワークステーションもサーバーも、カテゴリー、アーキテクチャー的には全て「パソコン」です
(具体的にはIBMのPC/AT互換機というx86を積んだパソコン)。
そのため一般的にサーバーにぶら下がるパーソナルデバイスは、スマホ、タブレット含め全てサーバーとの対比で「クライアント」と呼ぶのが適切です。間違っていませんか?
今回はIntel製品を念頭に、データフェッチまでの待ち時間が重要であることから、コア間をつなぐバストポロジがリングバスで済むものをパソコン向けと呼び、メッシュやスター、多重リングになっているXeonをサーバー向けと呼んでいます。
これだけ コアがふえりゃ 不要だろうね~~~
Eコアだけの CPU ほしいいぜ
コア増えたからスレットいらねーわな。 二コアなら微妙だろうが、4コアからは不要だろ。
ベンチ取ると当然差はでかいが、こんなフルにキレイに使う事なんてありえないからな。
実際にHyperThread実装されたNorthwoodやPrescottの頃はかなり無茶なクロック伸張のために
パイプライン増やしまくって実行ユニット遊んでたタイミングも多かったからな
それなら不足していたコア数増やす方に実装するのもアリだった