2026年、ローカルLLM界隈に激震を走らせたデバイスがASUS Ascent GX10です。NVIDIAの「DGX Spark」をベースとしたこのマシンは、単なるミニPCの枠を超え、個人や小規模チームが「クラウドを解約して100B超えモデルを日常使いする」ことを現実にするデスクトップAIスーパーコンピューターです。
本記事では、その驚異的なスペックと、2025年の革命的モデル「gpt-oss-120b」を用いた実運用Tipsを詳細に解説します。
1. 異次元のスペック:なぜLLMに最適なのか?
Ascent GX10が最強とされる理由は、単なるGPU性能ではなく、そのアーキテクチャにあります。
■ NVIDIA GB10 Grace Blackwell Superchip
最大の肝は、CPUとGPUがNVLink-C2Cで直結されている点です。従来のPCIe接続で発生していたデータ転送のボトルネックが事実上消滅し、メモリ帯域を極限まで引き出しています。
■ 128GB ユニファイドメモリの破壊力
ローカルLLMにおいて、モデルの重みを載せるVRAM容量は正義です。
- 128GB LPDDR5x: CPUとGPUが完全にメモリを共有。
- 対応モデル例:gpt-oss-120b (MXFP4): 余裕で動作。128kコンテキストをフル活用可能。Llama-3.1-405B (Q2/Q3): 2台クラスタ化により、256GBメモリ空間で推論可能。Qwen2.5-72B: fp16(無量化)に近い高精度で運用可能。
- gpt-oss-120b (MXFP4): 余裕で動作。128kコンテキストをフル活用可能。
- Llama-3.1-405B (Q2/Q3): 2台クラスタ化により、256GBメモリ空間で推論可能。
- Qwen2.5-72B: fp16(無量化)に近い高精度で運用可能。
■ 圧倒的な静音性と省電力
- サイズ: 1.1L(手のひらサイズ)
- 消費電力: 負荷時でも120〜170W程度。一般的なゲーミングPCの半分以下でありながら、AI性能は数倍というワットパフォーマンスを誇ります。
