NetBurstマイクロアーキテクチャ

Netburst
生産時期 2000年11月から
生産者 インテル
プロセスルール 180nm から 65nm
アーキテクチャ x86
マイクロアーキテクチャ Netburst
命令セット IA-32, Intel 64
コア数 1から2
(スレッド数:1から4)
ソケット Socket 423
Socket 478
Socket 603
Socket 604
LGA771
LGA775
コードネーム Willamette
Foster
Northwood
Prestonia
Gallatin
Prescott
Smithfield
Nocona
Irwindale
Cranford
Potomac
Paxville
CedarMill
Presler
Dempsey
Tulsa
前世代プロセッサ P6
L1キャッシュ コアあたり最大16KB
L2キャッシュ コアあたり最大2MB
L3キャッシュ 最大16MB
ブランド名 Pentium Extreme
Pentium D
Pentium 4
Pentium 4-M
Celeron D
Celeron
Celeron M
Xeon
テンプレートを表示

NetBurstマイクロアーキテクチャ(ネットバースト・マイクロアーキテクチャ)とは、インテルによって開発されたマイクロプロセッサマイクロアーキテクチャである。2000年11月20日に正式発表され、Pentium 4プロセッサとして製品化された[1]

命令解釈を行うフロントエンドと命令処理を行うバックエンドとを完全に分離することで、CPUの機能拡張への対応や高クロック化が容易になるよう設計された。しかしプロセスの微細化に伴い、高消費電力と高発熱という問題が深刻化、これらの問題を改善したCoreマイクロアーキテクチャが後に登場し、置き換えられた。

概要

2000年、インテルは1995年Pentium Pro以来続いてきたP6マイクロアーキテクチャを大幅に変更したNetBurstマイクロアーキテクチャを採用した。従来から用いられてきたP5やP6という没個性的な呼称を踏襲せずNetBurst(ネットバースト)と命名されたことは、Pentium 4で実装したSSE2命令などによってストリーミング・ビデオなどのインターネット利用シーンでパフォーマンスを発揮する、新たなマイクロアーキテクチャの誕生をユーザに印象づけるために行われたと推定される[2]

NetBurstマイクロアーキテクチャは、極端に小さいL1キャッシュ、比較的大きなL2キャッシュ、帯域の広いFSBなど、他社を含め従来のプロセッサのそれとは大きく異なる点を多数備えている[3]

L1キャッシュはデータと命令とを分離して格納するが、命令は命令解釈(デコード)され、より細かな操作の集まりであるμOPsに変換された状態でL1キャッシュに格納される。この命令を格納するL1キャッシュをトレース・キャッシュと呼ぶ。デコーダは、NetBurstマイクロアーキテクチャの柔軟性と拡張性の核となっている所でもありマイクロコードで機能変更や拡張を行うことが可能である[4]。この柔軟性・拡張性を活かすことで比較的短い開発期間でHTTSSE3Intel 64Intel VT等を追加した。このデコーダは、同時に1命令までのx86命令をμOPsに変換が可能であるが、P6マイクロアーキテクチャが同時に3命令まで変換可能だったのと比べると劣る。しかし、命令実行時にトレース・キャッシュに目的の命令が格納されていれば命令実行時間のおよそ1/3を占めるデコードを省くことが可能となる。

Pentium 4は命令実行を行うパイプライン段数が同社のPentium IIIAMD社のAthlonに比べて大きく増加している。Pentium IIIが10段であったのに対し、Pentium 4では20段(Prescottでは31段)にも達し、Pentium 4において命令実行パイプラインより分離された命令解釈(デコード)ステージを含めると更に段数は増える。パイプライン段数の増加は動作クロック周波数を向上させやすいというメリットがあるが、条件分岐命令の予測ミスによりパイプラインがストールしてしまいCPUの動作密度が低下するというデメリットも伴う。そのため、NetBurstマイクロアーキテクチャはクロックあたりの処理性能が従来のアーキテクチャ(P6やAMD-K7など)と比較して劣る[5]

しかし、従来の条件分岐を多用するプログラムは現状より大幅な向上は求められておらず、それに代わって「ストリーミングSIMD拡張命令2 (SSE2) 」など新たに実装した命令を用いることで動作クロックに比例して処理能力が向上するアプリケーションが主流になるとの予想に基づいてNetBurstマイクロアーキテクチャは開発されている。比較的苦手な条件分岐処理においても動作クロックの向上によって性能の向上が期待できる。また、ALUのうち2個はクロック周波数の2倍で動作する等、演算能力の強化が図られている。

そして次世代あるいは次々世代Pentium 4で実装されると一般に考えられていた「ハイパースレッディング・テクノロジー (HTT)」もNetBurstマイクロアーキテクチャの柔軟な構造を活用し、第一世代のWillametteでは使用できない状態で販売されていたものの完成されていたと見られる。HTTはCPU動作密度の低下を補い、CPU全体としての演算能力を向上させるためのものである[6]。また後に、SSE3命令も追加される。

NetBurstマイクロアーキテクチャを採用したPentium 4は、その性格上必然的に動作クロック周波数が増加した。動作クロック=CPUの性能、そのCPUを搭載したコンピューターの性能だと大きく誤解している消費者に対し高性能という印象を与えることもあった。しかし「高クロック=高性能」とは一概に言えないことから、発熱や消費電力を増大させる高クロックの弊害が顕著になり、不満が漏れる事となる。そして従来のP6アーキテクチャ向けにコンパイルされたアプリケーションをNetBurstアーキテクチャで実行した際の実効性能は、同一クロックのP6プロセッサをほぼ下回る。これが後々まで、NetBurstアーキテクチャの登場した当初の実行効率の悪さの印象として固定化された。

なお誤解される事が多いが、NetBurstアーキテクチャ向けにコンパイルされたアプリケーションに関しては、P6アーキテクチャ向けのアプリケーションで同様な処理を行うよりも高速ではある(特に、SSE命令を多用する場合)。

発熱と消費電力の深刻な問題

NetBurstマイクロアーキテクチャは、パイプライン段数を増やすことにより分岐予測ミスのペナルティが増加してクロック周波数あたりの性能が低下しても、それを上回るだけクロック周波数が向上すればトータルの性能は向上する、という理論[7]に基づき設計された。これは、半導体プロセスが微細化すれば動作周波数は向上し、消費電力は下がるというスケーリング則が成立し続けることを前提としたものであった。

一般的に、発熱や消費電力は動作クロックに比例して大きくなる。スケーリング則が成り立っていた2000年代初頭までは、製造プロセスを微細化することで動作電圧を低減し発熱や消費電力を抑えることができたが、微細化がより高度になることによりリーク(漏れ)電流と呼ばれる電流が問題視されるようになった[8]

漏れ電流はどのような半導体でも発生する。コンピュータ以外も含むいかなる回路の中で、漏れ電流はその回路の動作に悪影響を与える存在として排除の対象となる。特にnm(ナノメートル)単位で設計されるようになった集積度の極めて高いマイクロプロセッサ類では、それまで大きな問題にならなかった漏れ電流が、実際の動作による消費電力と大差ないところまで増えてしまい、半導体業界全体の問題となった。その中でも業界最大手のIntelは、業界の最先端を走っていたことからその問題に大きくつまずくことになる。

130nmプロセス世代では、その前世代の180nmプロセスからの移行で、漏れ電流の増加より電圧低減による省消費電力化の効果が勝っていたが、90nmプロセスになると漏れ電流が極端に増加してしまった。動作クロックを高めることで性能向上を図るPentium 4では、この問題が小型なコンピューター本体・CPU冷却装置の低コスト化や冷却騒音低減、低消費電力が求められるモバイル向けで顕著にあらわれた。同様の問題はAMDのAthlon 64でも発生したが、Athlon 64はクロックあたりの処理能力を高めるという従来の手法を踏襲したことと、製造技術にSOI (Silicon on Insulator) を採用し、その影響を大きく抑えることに成功した。ただし、AMDの次世代マイクロアーキテクチャの開発には少なからずの影響を及ぼした。Pentium 4においても漏れ電流抑制技術が採用されたが、Intelは高コストで製造に手間が掛かるSOIを敬遠し、歪みシリコンと呼ばれる技術に留まった。その結果、消費電力の大きさがPentium 4の欠点としてクローズアップされた。

開発の終焉

最終的に10GHzへ到達することを予定していた動作クロックの向上による性能向上は断念せざるを得ず、4GHzの製品は予告だけで終わった。また、モバイル用途では絶対性能は高くないことから当初Pentium 4より格下に位置づけられていたPentium MをPentium 4よりも高位の製品として販売することとなった。

Pentium 4の動作クロックは、2004年11月に発表された3.8GHzが最高となった。そしてさらに消費電力が増大すると見られたTejasと呼ばれる次世代製品の開発は中止され[9]、CPUの性能向上はクロック数の向上から、処理効率の改善やデュアル・マルチコア化へと大きな転換点を迎えることになる[10]。そのためインテルはCoreマイクロアーキテクチャであるCoreシリーズの開発にシフトし「NetBurstマイクロアーキテクチャ」の開発は2007年に事実上終了した[11]。このインテルの動きに対し、様子見をしていたAMDもデュアルコア版Athlon 64 (Athlon 64 X2) を前倒しして市場に投入した。

特徴

バリエーション

プリフェッチと分岐予測の改良
高度な電力管理 Execute Disable Bit
ハイパースレッディング・テクノロジーの改良 Yamhill Intel 64
ハイパースレッディング・テクノロジー (Foser MP) ハイパースレッディング・テクノロジー (Prestonia) ハイパースレッディング・テクノロジー ストリーミングSIMD拡張命令3 拡張版ハイパースレッディング・テクノロジー Intel Virtualization テクノロジー デュアル・コア
ストリーミングSIMD拡張命令2 Faset FP Assist Faster SSE2 Conversions La Grande Support Tejas New Instructions 拡張版 Intel SpeedStep テクノロジー (Geyserville-III) 共有L3キャッシュ
ハイパーパイプライン Denormals are Zero L1 Thread ID Bit 符号付き乗算命令のレイテンシ改善 トレースキャッシュの増量 Enhanced HALT ステート PREFETCHW Support Intel Cache Safe テクノロジー
倍速実行エンジン L1 Cache Aliasing Reduced L1キャッシュの増量 Thermal Monitor 2
WC Buffer Eviction ライトコンバイニングバッファの追加
実行トレースキャッシュ qword/dword store, unaligned aword/word/byte load SF
16-byte MOB Split for Store Forwarding
4倍速バス
Willamette Northwood Northwood-HT Prescott Tejas Prescott-2M CedarMill Tulsa

製品一覧

Willamette 世代

デスクトップ向け

Willamette
Willamette
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium 4 1 (1) 2.0 0.25 71.8 400
1.9 69.2
1.8 66.7
1.7 64
1.6 61
1.5 57.8
1.4 54.7
Celeron 2.0 0.125 71.2
1.9
1.8 66.1
1.7 63.5
1.6
1.5
Willamette
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium 4 1 (1) 2.0 0.25 71.8 400
1.9 69.2
1.8 66.7
1.7 64
1.6 61
1.5 57.8
1.4 54.7
1.3 51.6

サーバー向け

Foster
Foster-MP
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
キャッシュ (MB)
L2 L3
Xeon 1 (2) 1.6 0.25 1 72 400
1.5 0.5 68
1.4 64
Foster-DP
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Xeon 1 (1) 2.0 0.25 77.5 400
1.7 65.8
1.5 59.2
1.4 56

Northwood 世代

デスクトップ向け

Gallatin
Gallatin XE
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
キャッシュ (MB)
L2 L3
Pentium 4
Extreme
1 (2) 3.46 0.5 2 110.7 1066
3.4 102.9 800
Gallatin XE
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
キャッシュ (MB)
L2 L3
Pentium 4
Extreme
1 (2) 3.4 0.5 2 102.9 800
3.2 92.1
Northwood
Northwood
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium 4 1 (2) 3.4 0.5 89 800
3.2 82
3.0 81.9
2.8 69.7
2.6 69
2.4 66.2
3.06 81.8 533
1 (1) 2.8 68.4
2.66 66.1
2.53 61.5
2.4 59.8
2.26 58
3.0 80 400
2.8 68.4
2.6 62.6
2.5 61
2.4 59.8
2.2 57.1
2.0 54.3
1.8 68.1
1.6 38
Celeron 2.8 0.125 68.4
2.7 66.8
2.6 62.6
2.5 61
2.4 59.8
2.3 58.3
2.2 57.1
2.1 55.5
2.0 52.8
1.8 66.1
1.6

サーバー向け

Gallatin
Gallatin-MP
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
キャッシュ (MB)
L2 L3
Xeon 1 (2) 3.0 0.5 4 85 400
2.8 2 72
2.7 80
2.2 65
2.0 57
2.5 1 66
2.0 57
1.9 55
1.5 48
Gallatin-DP
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
キャッシュ (MB)
L2 L3
Xeon 1 (2) 3.2 0.5 2 92 533
3.2 1
3.06 87
2.8 77
2.4
Prestonia
Prestonia
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Xeon 1 (2) 3.06 0.5 85 533
2.8 74
2.66 72
2.4 65
2.0 58
LV 2.4 40 400
LV 2.0 35
LV 1.6 30
Prestonia
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Xeon 1 (2) 3.0 0.5 85 400
2.8 74
2.6 60
2.4 65
2.2 61
2.0 58
1.8 55

モバイル向け

Northwood
Northwood-M
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium 4-M 1 (2) 3.2 0.5 76 533
3.06 70
2.8 68.4
2.66 66.4
2.4 59.8
1 (1) 3.06 70
2.8 68.4
2.66 66.4
2.4 59.8
2.6 35 400
2.5
2.4
2.3
2.2
2.0 32
1.9
1.8 30
1.7
1.6 26.9
1.5 25.8
1.4 20.8
Celeron 2.5 0.25 35
2.4
2.2
2.0 32
1.8 30
1.7
1.6
1.5
1.4
1.2 20.8

Prescott 世代

デスクトップ向け

Smithfield
Smithfield XE
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium
Extreme
840 2 (4) 3.2 2 130 800
Smithfield
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium D 840 2 (2) 3.2 2 130 800
830 3.0
820 2.8 95
805 2.66 533
Prescott
Prescott XE
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium 4
Extreme
1 (2) 3.73 2 115 1066
Prescott
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium 4 1 (2) 4.0 2 115 1066
672 3.8 800
670 3.8
662 3.6
660 3.6
650 3.4 84
640 3.2
630 3.0
620 2.8
580 4.0 1
571 3.8 115
570J 3.8
570 3.8
561 3.6
560J 3.6
560 3.6
551 3.4 84
550J 3.4
550 3.4
541 3.2
540J 3.2
540 3.2
531 3.0
530J 3.0
530 3.0
521 2.8
520J 2.8
520 2.8
524 3.06 533
517 2.93
519K 1 (1) 3.06
519J 3.06
519 3.06
516 2.93
515J 2.93
515 2.93
511 2.8
510J 2.8
510 2.8
506 2.66
505J 2.66
505 2.66
Celeron D 355 3.33 0.25
351 3.2
350J 3.2 73
346 3.06 84
345J 3.06
341 2.93
340J 2.93
336 2.8
335J 2.8
335 2.8 73
331 2.66 84
330J 2.66
330 2.66 73
326 2.53 84
325J 2.53
325 2.53
320 2.4
315 2.26 73
Prescott
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium 4 1 (2) 3.4E 1 103 800
3.2E
3.0E 89
2.8E
1 (1) 2.8A 103 533
2.66 89
2.4
Celeron D 350 3.2 0.25 73
345 3.06
340 2.93
335 2.8
330 2.66
325 2.53
320 2.4
315 2.26
310 2.13

サーバー向け

Paxville
Paxville-MP
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Xeon 7041 2 (4) 3.0 4 165 800
7030 2.8 2
7040 3.0 4 667
7020 2.66 2
Paxville-DP
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Xeon 2 (4) 2.8 4 135 800
Potomac
Potomac
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
キャッシュ (MB)
L2 L3
Xeon 1 (2) 3.33 1 8 129 667
3.0
2.83 4
Cranford
Cranford
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Xeon 1 (2) 3.66 1 110 667
3.16
Irwindale
Irwindale
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Xeon 1 (2) 3.8E 2 110 800
3.8
3.6E
3.6
3.4E
3.4
3.2E
3.2
3.0E
3.0
2.8E
2.8
3.0 55
Nocona
Nocona
ブランド CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Xeon 1 (2) 3.6 1 103 800
3.4
3.2
3.0D
3.0
2.8D
2.8
LV 2.8 55
1 (1) 3.5 110 667

モバイル向け

Prescott
Prescott-M
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium 4-M 552 1 (2) 3.46 1 88 533
548 3.33
538 3.2
532 3.06
518 2.8

CedarMill 世代

デスクトップ向け

Presler
Presler XE
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium
Extreme
965 2 (4) 3.73 4 130 1066
955 3.46
Presler
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium D 960 2 (2) 3.6 4 130 800
950 3.4
945 95
940 3.2 130
935 95
930 3.0
925
920 2.8
915
CedarMill
CedarMill
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Pentium 4 661 1 (2) 3.6 2 86 800
651 3.4
641 3.2
631 3.0
Celeron D 365 1 (1) 3.6 0.5 65 533
360 3.46
356 3.33 86
352 3.2
347 3.06

サーバー向け

Tulsa
Tulsa
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
キャッシュ (MB)
L2 L3
Xeon 7140M 2 (4) 3.4 2 16 150 800
7130M 3.2 8
7120M 3.0 4 95
7110M 2.6
7150N 3.5 16 150 667
7140N 3.33
7130N 3.16 8
7120N 3.0 4 95
7110N 2.5
Dempsey
Dempsey
ブランド 型番 CPU TDP
(W)
FSB
(MHz)
コア数
(スレッド数)
クロック
(GHz)
L2キャッシュ
(MB)
Xeon 5080 2 (4) 3.73 4 130 1066
5070 3.46
5060 3.2
5063 95
5050 3.0 667
5040 2.83
5030 2.66
5020 2.5

脚注

  1. ^ 米Intel、Pentium 4正式発表 P6以来5年ぶりの新アーキテクチャ”. 2025年1月1日閲覧。
  2. ^ Pentium 4のマイクロアーキテクチャをNetBurstと命名”. 2025年1月1日閲覧。
  3. ^ Pentium 4とそのプラットフォーム”. 2025年1月1日閲覧。
  4. ^ これが真のNetBurstアーキテクチャだ”. 2025年1月1日閲覧。
  5. ^ ゲームに影響するCPUの個性”. 2025年1月1日閲覧。
  6. ^ インテルCPU進化論 失敗作? NetBurst Architectureの実像”. 2025年1月1日閲覧。
  7. ^ E. Sprangle and D. Carmean, Increasing Processor Performance by Implementing Deeper Pipelines, Proc. ISCA-29, 2002. この文献では、周波数向上による性能向上が分岐予測ミスのペナルティを上回る52段まではパイプラインを深くできる、と予測している。
  8. ^ リーク電流に悩まされる90nm世代”. 2025年1月1日閲覧。
  9. ^ Intelが次世代デスクトップCPU「Tejas」をキャンセル”. 2025年1月1日閲覧。
  10. ^ マルチコア時代にGHzはどこへ行ってしまったのか”. 2025年1月1日閲覧。
  11. ^ Intel、Pentium D 945などを生産中止~NetBurstが終息へ”. 2025年1月1日閲覧。

関連項目