AIインフラ

ChatGPTに質問を送って、返答が来るまで数秒待つことがありますよね。あの待ち時間は、AIの賢さだけでなく、返答を処理する計算設備の能力で変わります。 🤝 OpenAIとBroadcomが組んで設計したもの OpenAIとBroadcomが2026年6月24日に発表した「Jalapeño（ハラペーニョ）」は、OpenAI初の自社設計AIチップです。公式には「Intelligence Processor（LLMの推論処理に特化した演算装置）」と呼んでいます。役割分担はこうなっています。チップの実装とネットワーク技術をBroadcom（ブロードコム）が担当し、ボード・ラック・システム全体をCelestica（セレスティカ）が手がけます。OpenAIはチップ設計にとどまらず、その上で動くソフトウェアのカーネル（OSの中核部分）、メモリ、ネットワーク、スケジューリング、展開システムまで含めた基盤として整備する計画です。ラボにはエンジニアリングサンプルが届いています。GPT-5.3-Codex-Sparkを含む機械学習ワークロードで、生産目標の周波数と電力範囲内での稼働をOpenAIが確認しました。詳細な性能レポートは今後数カ月以内に発表予定で、具体的な数値は現段階では非公開です。 OpenAIは、モデルだけでなく、返答を処理するチップと周辺システムまで自社の使い方に合わせて作ろうとしています。ここが今回の発表の芯なんです。ちょっと気になるのは、OpenAIがBroadcomとの独自チップ計画を明かしてから約9カ月でここまで来たというタイミングです。半導体開発は設計から量産まで一般に数年かかります。ラボ稼働サンプルの公表まで9カ月というのは、かなり積極的なペースです。 ⚙️ 推論とは何か。チップがChatGPTに関係する理由 AIが返答を出す処理を「推論」と呼びます。ユーザーの入力を受け取り、ChatGPTの返答やコード生成の結果を出す工程のことです。大量のデータでモデルを育てる「訓練」とは別の工程です。訓練はある期間で完結しますが、推論はChatGPTを使う人が増えるほど、1回の質問が長くなるほど、計算量が増え続けます。混雑した時間帯に返答が遅くなったり、API（他のアプリにAI機能を組み込む仕組み）の利用に制限がかかったりするのは、この推論処理がボトルネック（処理が集中して速度が落ちる場所）になるからです。 OpenAIがJalapeñoをChatGPT、Codex（コード生成AI）、API、将来のエージェント製品の推論処理向けに設計したと説明するのはそのためです。どのチップで返答を生成するかは、応答速度とサービスの安定性に直結します。現在、OpenAIはNvidiaのGPU（画像処理向けに設計された、AI計算にも使われる汎用チップ）を中心とする設備に依存しています。Microsoft、Meta、AmazonもすでにAIサーバー向けの自社チップ開発を進めており、Jalapeñoはその流れに沿った動きです。チップの名前は小さな部品の話に見えますが、実際にはAIサービス全体の混雑とコストに触れる話なんですよね。 💡 速さ・安定性・料金。利用者への影響が出るとしたら OpenAIは初期テストで、JalapeñoがNvidiaなど現世代の最先端品と比べてワットあたりの性能が大きく上回る見込みだと述べています。同じ電力で多くのリクエストを処理できるということです。これが積み重なると、混雑時の安定性の改善、APIの利用料金の変化、エージェント型AIの実行コストの変化につながる可能性があります。ただし、「可能性がある」という段階の話です。OpenAIは初期展開を2026年末までに開始し、その後数年かけて広げる計画だと説明しています。今日からChatGPTの返答が速くなる話ではありません。利用者がJalapeño搭載のサービスを選んで使える仕組みもありません。スマホを新機種に替えるような話ではなく、通信事業者が基地局の設備を刷新するのに近い変化です。実際に体験が変わるとしても、気づかないうちに改善されているという形になります。 📋 性能の詳細・料金への影響はこれから詳細な性能レポートは未公開です。「現世代と比べて大きく上回る見込み」という言葉は確認できますが、具体的な数値は今後数カ月以内に出てくる予定です。料金への影響も、APIの制限緩和の有無も、日本のユーザーへの恩恵がいつ届くかも、今は不明です。BroadcomのHock Tan CEOは「2026年からギガワット規模のデータセンター展開を可能にする」と述べています。ギガワットは発電所級の電力を連想させる単位で、AI基盤が半導体だけでなく電力とデータセンター投資の話になっていることを示しています。ただ、それがChatGPTやAPIの体験にどう反映されるかは、現段階ではわかりません。一般ユーザーにとってJalapeñoは、今日触れるものではなく、2026年末以降に始まるAIサービス基盤の更新です。ChatGPTやAPIの体験がモデルの性能だけでなく、処理するチップにも左右されるという構図が、今回の発表で明確になりました。参考 OpenAI - OpenAI and Broadcom unveil LLM-optimized inference chip（https://openai.com/index/openai-broadcom-jalapeno-inference-chip/） The Verge - OpenAI reveals its first AI processor: Jalapeño（https://www.theverge.com/ai-artificial-intelligence/955939/openai-reveals-its-first-ai-processor-jalapeno）