ChatGPTのような大規模言語モデル(LLM)を、自分のPCでローカル実行したい人が急増しています。しかし、ローカルLLMは「普通のゲーミングPC」ではスペック不足になりがちです。この記事では、7B・13B・30B・70Bクラスのモデルを想定しながら、ローカルLLMを快適に動かすためのPC構成をわかりやすく解説します。
目次
ローカルLLM用PC構成のポイント
- GPUのVRAMが最重要(まずここ)
- メモリは32〜128GBと“かなり多め”が前提
- CPUはi7以上でボトルネックを避ける
- SSDは高速NVMe+大容量(1〜2TB以上)
結論イメージ:
「ゲームもできるPC」ではなく、“VRAMとメモリに全振りした変態マシン”がローカルLLM向き。
「ゲームもできるPC」ではなく、“VRAMとメモリに全振りした変態マシン”がローカルLLM向き。
モデルサイズ別の必要スペック
まずは、モデルサイズごとのざっくりした目安から。
| モデルサイズ | 用途イメージ | 推奨VRAM | 推奨メモリ |
|---|---|---|---|
| 7Bクラス | 軽量チャットボット・補助ツール | 8〜12GB | 32GB |
| 13Bクラス | そこそこ賢いアシスタント | 16〜24GB | 32〜48GB |
| 30Bクラス | 高性能アシスタント・簡易GPT代替 | 24〜48GB | 64GB |
| 70Bクラス | 本格GPTクラスに近い性能 | 48GB以上 | 128GB |
ポイント:
量子化(4bit / 8bit)を使えばVRAMは節約できるが、
「VRAMが多いほど楽」「メモリが多いほど安定」という方向性は変わらない。
量子化(4bit / 8bit)を使えばVRAMは節約できるが、
「VRAMが多いほど楽」「メモリが多いほど安定」という方向性は変わらない。
CPUの選び方(ボトルネックを避ける程度でOK)
ローカルLLMではGPUが主役ですが、CPUが弱すぎるとトークン生成速度が頭打ちになります。
■ 推奨CPUライン
- Intel:Core i7(12世代以上)〜 Core i9
- AMD:Ryzen 7(5000番台以上)〜 Ryzen 9
■ こんな考え方でOK
- 7B〜13B中心 → i7で十分
- 30B以上・並列推論 → i9 / Ryzen 9が安心
GPU(VRAM)の選び方(最重要パーツ)
ローカルLLMの性能は、ほぼVRAM容量で決まります。
■ 推奨GPUの目安
| 用途 | 推奨GPU |
|---|---|
| 7Bモデル中心 | RTX 4060 / 4060 Ti / 4070 |
| 13Bモデル中心 | RTX 4070 / 4070 Ti / 4080 |
| 30Bモデルも触りたい | RTX 4080 / 4090 |
| 70Bモデルも視野に入れる | RTX 4090(ほぼ一択) |
■ VRAM目安
- 8GB:7Bをギリギリ(強めの量子化前提)
- 12GB:7Bは余裕、13Bも工夫次第
- 16〜24GB:13Bが現実的、30Bは工夫が必要
- 24〜48GB:30Bが現実的、70Bはかなり工夫
結論:
「どのモデルをメインで動かしたいか」=「VRAM何GBにするか」の直結問題。
「どのモデルをメインで動かしたいか」=「VRAM何GBにするか」の直結問題。
メモリ(RAM)の選び方(32〜128GBが前提)
ローカルLLMは、GPUだけでなくメインメモリもかなり使います。
■ 推奨メモリ容量
| 用途 | 推奨メモリ |
|---|---|
| 7B〜13B中心 | 32〜48GB |
| 30Bも触りたい | 64GB |
| 70B・複数モデル同時運用 | 128GB |
- 32GB:最低限の快適ライン
- 64GB:ローカルLLMを「ちゃんと遊べる」ライン
- 128GB:ガチ勢・検証環境・複数モデル同時運用
SSD(ストレージ)の選び方(容量と速度が命)
LLMモデル・ベクトルDB・ログ・データセットなどで、ストレージはあっという間に埋まります。
■ 推奨構成
- OS+アプリ用:NVMe SSD 1TB
- モデル・データ用:NVMe SSD 1〜2TB
■ 容量の目安
- 7B〜13Bモデル数本+周辺ツール → 1TBでも可
- 30B以上・複数モデル・ベクトルDB → 2TB以上推奨
ポイント:
HDDは論外。Gen3でもいいのでNVMe SSD必須。 余裕があればGen4にしておくとモデルロードが速くなる。
HDDは論外。Gen3でもいいのでNVMe SSD必須。 余裕があればGen4にしておくとモデルロードが速くなる。
用途別おすすめ構成例
■ ① お試しローカルLLM構成(7B中心)
- CPU:Core i7 / Ryzen 7
- GPU:RTX 4060 / 4060 Ti(8〜16GB VRAM)
- メモリ:32GB
- SSD:1TB(NVMe)
■ ② 実用ローカルアシスタント構成(7B〜13B)
- CPU:Core i7〜i9 / Ryzen 7〜9
- GPU:RTX 4070 / 4070 Ti / 4080
- メモリ:32〜64GB
- SSD:1〜2TB(NVMe)
■ ③ ガチ勢向けローカルLLM構成(30B〜70B)
- CPU:Core i9 / Ryzen 9 / Threadripper
- GPU:RTX 4090(24GB VRAM)
- メモリ:64〜128GB
- SSD:2TB以上(NVMe)
ノートPCでローカルLLMは現実的か?
結論から言うと、「7B〜13Bを軽く触る程度ならアリ」「30B以上を本気でやるならほぼナシ」です。
- ノート用GPUはVRAMが少なめ(〜16GBが多い)
- メモリがオンボードで増設不可のモデルが多い
- 発熱で性能が落ちやすい
結論:
ノートPCでやるならRTX 4070 Laptop+メモリ32GBあたりが現実的な上限。 本気でローカルLLMを回すならデスクトップ一択。
ノートPCでやるならRTX 4070 Laptop+メモリ32GBあたりが現実的な上限。 本気でローカルLLMを回すならデスクトップ一択。
まとめ:ローカルLLM用PCは“VRAMとメモリ”がすべて
- CPU:i7以上(ボトルネック回避用)
- GPU:7B→RTX 4060〜、13B→RTX 4070〜、30B→RTX 4080/4090
- メモリ:最低32GB、できれば64GB、ガチ勢は128GB
- SSD:NVMe 1〜2TB(モデル+データ用に十分な容量)
ローカルLLMは、スペックさえ満たせば「自分専用のGPT環境」を手元に持てる強力な選択肢です。どのモデルをどこまで動かしたいかを決めてから、VRAMとメモリを中心にPC構成を組むのが、後悔しないローカルLLMマシンの作り方です。