AI最新ニュース

OpenAI、GPT-5.6 Solを限定公開。ChatGPTの新モデルはなぜすぐ使えない？

ChatGPTに新モデルの名前が追加されるとき、それがすぐ全員に届くとは限りません。 6月26日、OpenAIは「GPT-5.6」シリーズの限定プレビューを開始しました。旗艦モデルのSol、日常業務向けのTerra、低価格重視のLunaの3モデル構成です。発表時点ではChatGPT全ユーザーも通常のAPIも使えない状態で、一般提供は「今後数週間以内」が目標とされています。今回が限定プレビューから始まる理由は少し特殊で、ChatGPTをふだん使う人も理解しておく価値があります。 🤖 Sol・Terra・Luna、3モデルで何が違うか今回のGPT-5.6シリーズは用途別に3モデルに分かれています。 Solが旗艦モデルです。コーディング、生物学、サイバーセキュリティの複雑なタスクで性能を引き上げたとされています。「深く考えるためのmax reasoning effort（最大推論努力）」と、サブエージェント（補助的なAIエージェント）に作業を分担させる「ultra mode」が新たに加わります。 Terraは日常業務向けです。GPT-5.5と近い性能を保ちながら料金をほぼ半分に抑えたモデルで、APIコストを意識する企業や開発者の主な選択肢になる位置づけです。Lunaは3モデルの中で最も低コストな設定になります。 APIの料金目安は、100万トークン当たりでSolが入力約750円・出力約4500円、Terraが入力約375円・出力約2250円、Lunaが入力約150円・出力約900円です（ITmedia AI＋による報道。1米ドル150円換算）。 Terraの料金水準は気になります。GPT-5.5と近い性能で入力約375円という設定なら、社内の問い合わせ対応や文書要約を繰り返し処理する用途で予算を組み立てられるからです。ただ「GPT-5.5と近い性能」の具体的な根拠はまだ開示されていません。Terraが実際に使える段階になったら、精度と料金のバランスは検証対象になります。 🔐 なぜ「限定プレビュー」から始まったのか OpenAIは今回、モデルの能力と提供計画を米政府に事前共有し、政府の要請に応じてアクセスを少数のパートナーに絞る形でスタートしました。OpenAIは発表文で「政府によるこのようなアクセス確認プロセスが長期的な標準になるべきではない」とも明記しています。政府が関与した限定公開は、少なくともこの規模では異例の対応です。公式のシステムカード（安全評価の公開文書）によると、GPT-5.6のSol・Terra・Lunaはサイバーセキュリティおよび生物・化学リスクの観点で「High capability（高い能力水準）」に分類されています。脆弱性を探したり攻撃の足がかりを見つけたりはできますが、評価条件下では完全に機能する攻撃の連鎖を自律的に作り出すことはできず、「Cyber Critical（極めて高い危険水準）」には達していないと説明されています。限定プレビューは、この能力評価を見ながら公開範囲を広げるための段階です。安全検証の規模を示す数字もあります。システムカードによると、自動レッドチーミング（AIへの擬似攻撃テスト）に70万A100e GPU時間以上を投じたとされています。A100eはAI計算に使われる高性能チップの一種で、70万時間は1台を24時間フル稼働させた場合に約80年分の計算量です。並列稼働で実際の時間はずっと短くなりますが、安全検証に相当な計算資源をかけた裏付けにはなります。安全対策の仕組みとしては、モデル内の拒否学習、リアルタイム分類器、アカウント単位の確認、用途別のアクセス制御、違反対応の監視を組み合わせると公式は説明しています。「誰でもすぐ使える状態」にするのは、この確認プロセスを経てからです。 📅 一般提供は「数週間以内」、今急ぐ必要はない 6月27日時点では、GPT-5.6は一般のChatGPTユーザーにも通常のAPIにも届いていません。一般提供の目標は「今後数週間以内」とされています。ChatGPTをふだん使っている人が今すぐ行動することは特にないです。プランの変更も業務フローの見直しも、実際に使えるようになってから検討で間に合います。 Cerebras（AIチップメーカー）との連携で、APIでは7月に最大750トークン毎秒という処理速度が予定されているとITmediaは伝えています。日本語に換算すると1秒に750〜1500文字前後の出力速度で、長い返答が手元に届くまでの体感が変わる水準です。 🏢 企業導入で変わるアクセス制御と動作傾向企業のシステム担当やAI利用担当者には、今回の発表で2点の変化があります。 1つは動作傾向です。システムカードによると、GPT-5.6はGPT-5.5と比べてユーザーの意図を超えて行動しようとする傾向がやや強いという評価が出ています。絶対的な発生率は低いとしつつも、承認なしに連続して動くエージェント設定や自動化した業務フローを組んでいる環境では、想定外の動作に備えたテストが必要です。もう1つはアクセス制御です。GPT-5.6では、アカウント単位の確認と用途別のアクセス制御が安全対策の一環として強化されています。API経由で使う場合、従来と同じキーで自動切り替えになるか、申請や設定変更が必要になるかは、正式リリース時の公式ドキュメントで確認が必要です。一般提供が始まった段階で、社内のAIシステムを管理する部門に情報共有しておくと対応がスムーズです。参考 OpenAI — Previewing GPT-5.6 Sol: a next-generation model（https://openai.com/index/previewing-gpt-5-6-sol/） OpenAI Deployment Safety Hub — GPT-5.6 Preview System Card（https://deploymentsafety.openai.com/gpt-5-6-preview） ITmedia AI＋ — OpenAI、次世代「GPT-5.6」シリーズを限定プレビュー　米政府と調整、命名は「Sol／Terra／Luna」に刷新（https://www.itmedia.co.jp/aiplus/article/2606/27/2000000134/） ※当サイトのリンクにはアフィリエイトリンクが含まれる場合があります ...

OpenAI初のAIチップ「Jalapeño」、ChatGPTの速さと料金にどう関係するか

ChatGPTに質問を送って、返答が来るまで数秒待つことがありますよね。あの待ち時間は、AIの賢さだけでなく、返答を処理する計算設備の能力で変わります。 🤝 OpenAIとBroadcomが組んで設計したもの OpenAIとBroadcomが2026年6月24日に発表した「Jalapeño（ハラペーニョ）」は、OpenAI初の自社設計AIチップです。公式には「Intelligence Processor（LLMの推論処理に特化した演算装置）」と呼んでいます。役割分担はこうなっています。チップの実装とネットワーク技術をBroadcom（ブロードコム）が担当し、ボード・ラック・システム全体をCelestica（セレスティカ）が手がけます。OpenAIはチップ設計にとどまらず、その上で動くソフトウェアのカーネル（OSの中核部分）、メモリ、ネットワーク、スケジューリング、展開システムまで含めた基盤として整備する計画です。ラボにはエンジニアリングサンプルが届いています。GPT-5.3-Codex-Sparkを含む機械学習ワークロードで、生産目標の周波数と電力範囲内での稼働をOpenAIが確認しました。詳細な性能レポートは今後数カ月以内に発表予定で、具体的な数値は現段階では非公開です。 OpenAIは、モデルだけでなく、返答を処理するチップと周辺システムまで自社の使い方に合わせて作ろうとしています。ここが今回の発表の芯なんです。ちょっと気になるのは、OpenAIがBroadcomとの独自チップ計画を明かしてから約9カ月でここまで来たというタイミングです。半導体開発は設計から量産まで一般に数年かかります。ラボ稼働サンプルの公表まで9カ月というのは、かなり積極的なペースです。 ⚙️ 推論とは何か。チップがChatGPTに関係する理由 AIが返答を出す処理を「推論」と呼びます。ユーザーの入力を受け取り、ChatGPTの返答やコード生成の結果を出す工程のことです。大量のデータでモデルを育てる「訓練」とは別の工程です。訓練はある期間で完結しますが、推論はChatGPTを使う人が増えるほど、1回の質問が長くなるほど、計算量が増え続けます。混雑した時間帯に返答が遅くなったり、API（他のアプリにAI機能を組み込む仕組み）の利用に制限がかかったりするのは、この推論処理がボトルネック（処理が集中して速度が落ちる場所）になるからです。 OpenAIがJalapeñoをChatGPT、Codex（コード生成AI）、API、将来のエージェント製品の推論処理向けに設計したと説明するのはそのためです。どのチップで返答を生成するかは、応答速度とサービスの安定性に直結します。現在、OpenAIはNvidiaのGPU（画像処理向けに設計された、AI計算にも使われる汎用チップ）を中心とする設備に依存しています。Microsoft、Meta、AmazonもすでにAIサーバー向けの自社チップ開発を進めており、Jalapeñoはその流れに沿った動きです。チップの名前は小さな部品の話に見えますが、実際にはAIサービス全体の混雑とコストに触れる話なんですよね。 💡 速さ・安定性・料金。利用者への影響が出るとしたら OpenAIは初期テストで、JalapeñoがNvidiaなど現世代の最先端品と比べてワットあたりの性能が大きく上回る見込みだと述べています。同じ電力で多くのリクエストを処理できるということです。これが積み重なると、混雑時の安定性の改善、APIの利用料金の変化、エージェント型AIの実行コストの変化につながる可能性があります。ただし、「可能性がある」という段階の話です。OpenAIは初期展開を2026年末までに開始し、その後数年かけて広げる計画だと説明しています。今日からChatGPTの返答が速くなる話ではありません。利用者がJalapeño搭載のサービスを選んで使える仕組みもありません。スマホを新機種に替えるような話ではなく、通信事業者が基地局の設備を刷新するのに近い変化です。実際に体験が変わるとしても、気づかないうちに改善されているという形になります。 📋 性能の詳細・料金への影響はこれから詳細な性能レポートは未公開です。「現世代と比べて大きく上回る見込み」という言葉は確認できますが、具体的な数値は今後数カ月以内に出てくる予定です。料金への影響も、APIの制限緩和の有無も、日本のユーザーへの恩恵がいつ届くかも、今は不明です。BroadcomのHock Tan CEOは「2026年からギガワット規模のデータセンター展開を可能にする」と述べています。ギガワットは発電所級の電力を連想させる単位で、AI基盤が半導体だけでなく電力とデータセンター投資の話になっていることを示しています。ただ、それがChatGPTやAPIの体験にどう反映されるかは、現段階ではわかりません。一般ユーザーにとってJalapeñoは、今日触れるものではなく、2026年末以降に始まるAIサービス基盤の更新です。ChatGPTやAPIの体験がモデルの性能だけでなく、処理するチップにも左右されるという構図が、今回の発表で明確になりました。参考 OpenAI - OpenAI and Broadcom unveil LLM-optimized inference chip（https://openai.com/index/openai-broadcom-jalapeno-inference-chip/） The Verge - OpenAI reveals its first AI processor: Jalapeño（https://www.theverge.com/ai-artificial-intelligence/955939/openai-reveals-its-first-ai-processor-jalapeno）

PLaMo 3.0 Prime正式公開、国産AIを日本語業務で選ぶ意味と確認事項

会社で生成AIを選ぶとき、英語中心のベンチマーク表だけでは日本語業務への適性を見落とします。PFNが2026年6月22日に正式提供を開始した「PLaMo 3.0 Prime」は、API、オンプレミス、Amazon Bedrock Marketplace、Snowflakeから選べる国産モデルです。日本語の業務文書、自治体・企業システム、社内Q&Aに使うなら、IT部門、法務、情報セキュリティ部門でデータの置き場所と利用範囲を先に確認したい選択肢です。 🗂️ APIからオンプレミスまで、4つの利用経路 PLaMo 3.0 Primeへの入口は複数あります。クラウドAPI（PLaMo Chat/API）、オンプレミス導入、Amazon Bedrock Marketplace、Snowflakeの4系統です。オンプレミスは、自社管理のサーバー環境でモデルを動かす導入形態を指します。どの経路を選ぶかは、データの扱い方と社内の既存環境によって変わります。 miibo・Tachyon 生成AI・QommonsAIといったSaaSにも標準搭載されています。チャットbotや社内Q&Aツールとして導入済みのサービスがあれば、APIを直接操作しなくてもPLaMo 3.0 Primeを使える状況になります。 APIのプランはFreeとStandardに分かれます。ITmedia AI＋の報道によると、StandardプランのAPI料金は100万トークン（AIが文章を処理するときの細かな単位）あたり入力60円・出力250円です。Freeプランは正式提供開始時点（2026年6月22日）では準備中で、現時点ではStandardプランが実質的な入口になっています。デジタル庁の生成AI利用環境「源内」でも国内大規模言語モデルの1つとして選定されており、行政や自治体での利用機会が今後広がる見通しです。 🔬 日本語の強みと、公式ブログが認める5つの改善余地 PLaMo 3.0 Primeは日本語の業務文書・対話・専門領域を想定した学習と評価を経ています。PFNによると、指示追従・対話・ツール使用・医療分野・コード生成・安全性では競争力があるとのことです。コンテキスト長（AIが一度に読み込める文章量）は64Kから256Kに拡張されました。長い社内規程、会議録、AIエージェントが複数ツールを使う際の操作履歴を一度に渡せる量が増えています。構造化出力にも対応しており、既存システムや外部APIと組み合わせる場面での応用もあります。一方、PFNの公式技術ブログは苦手分野をはっきり示しています。Web探索・長文処理・数学的推論・STEM・日本の法令分野では改善が必要だということです。「国産AIは日本の法令に強い」という期待はよく聞きますが、PFN自身がその分野の課題を認めている点は押さえておく必要があります。この正直な開示は評価できます。実際にClaude MaxやGemini Advancedを使う中でも、特定業務への適性は触れてみないと見えない部分があるのですが、公式が苦手分野を明示してくれると、どこから検証を始めるかが整理できます。 🏢 企業・自治体が選定前に確認することモデルは2種類あります。複雑なタスク向けのReasoningモデルと、応答速度を重視するNon-reasoningモデルです。用途に応じた使い分けを前提にした設計です。データの流通経路はオンプレミスとクラウドAPIで異なります。機密性の高い文書を扱う業務では、オンプレミスの選択肢が残されているかを事前に確認することが選定の出発点になります。Amazon Bedrock MarketplaceやSnowflake経由では、それぞれのクラウド事業者のデータポリシーも確認の対象です。日本語ベンチマークは汎用的な指標とは別に見る価値があります。PFNはHELM Safetyで競合モデルと同程度以上の安全性を示したとしていますが、自社の業務ジャンルに対応したベンチマーク結果や事例があるかどうかは、また別の問いです。既存サービス（miibo等）を通じてPLaMoが動いている環境では、3.0 Primeへのバージョン更新で出力が変わる可能性があります。更新の影響をどう確認するかを社内で決めておくと、切り替え時の対応が早くなります。 ⚙️ コスト試算と「Freeプラン準備中」の現状「高コスパ」という言葉がITmedia AI＋の報道に出てきます。100万トークンあたり入力60円・出力250円は、海外大手モデルの同規模プランと比べると競争力のある水準です（出典：ITmedia AI＋、2026年6月22日）。 ...

OpenAIのAI化学者が1万回の実験で薬づくりの反応を改善何が人間頼みか

薬の候補が見つかっても、実際に合成できなければ次の段階には進めません。反応の効率（収率）が低いと、条件を変えながら何度も試し直すことになります。この繰り返しの実験作業にAIと自動化設備を組み込んだら、どこまで進められるのか。OpenAIとMolecule.oneが、2026年6月17日にその試みの結果を公開しました。化学者も意外と受け止めた提案が、実際の実験で数字になっています。今すぐ使える一般向けサービスではありません。高スループット実験設備と専門の化学者が前提の研究プロトタイプです。ただ、「AIが実験のどこまで担えるか」を具体的な数字で示した初期例として、製薬・化学・素材業界に関わる人にとっては自動化の射程を考える材料になります。 🔬 GPT-5.4が実験計画を担い、1万件の反応を処理対象となった化学反応は「Chan-Lamカップリング」と呼ばれるものです。医薬品の候補分子を合成する際に使われる反応で、炭素と窒素を結びつけます。一次スルホンアミドという素材を使う組み合わせでは収率が低く、条件改善が課題とされていました。 OpenAIのモデル（OAI-M1-03、GPT-5.4ベース）を、Molecule.oneの化学AI「Maria」と高スループット実験ラボに接続しました。このシステムが研究の方向を提案します。実験計画を立て、得られたデータを解析し、次の条件を提案するサイクルを回します。Maria Labが処理した実験は最終的に10,080件です。化学者が1日3件の実験を行うとすると、同じ件数を手作業でこなすには10年以上かかる計算になります。OpenAIが公式記事でこの比較を示しており、反復試行の規模が従来と大きく異なります。 💡 AIの提案が、化学者にとっても「想定外」の組み合わせだった 10,080件の実験を処理した中で、OAI-M1-03が出した提案のひとつが「TEMPO」という酸化剤でした。穏やかな酸化を起こす試薬で、Chan-Lamカップリングに組み合わせるのは化学者の通常の発想にはなかった選択です。OpenAIは公式記事のなかで、この提案は化学者にとっても「興味深い提案だった」と説明しています。正直、ここは意外でした。TEMPOは化学者の通常の発想から外れた選択だった、とOpenAIが説明しているからです。わたしはこの数字を、研究者の仕事が消える証拠とは見ません。大量の実験データから統計的なパターンを探す過程で、人間が見落としていた組み合わせを引き出せる場合がある。そんな読み方が近いです。 TEMPOを組み合わせた条件で得られた成果を見ると、試したボロン酸の88%、一次スルホンアミドの83%で収率が改善しました。平均収率は16.6%から25.2%に上がり、収率30%超の反応の割合は15.6%から37.5%に増えています。さらに、人間の化学者がベンチスケール（実際の実験室サイズ）で再現した実験では、14組のうち11組で収率が上がり、8組では2倍以上の改善がありました。実験室での再現性が確認できた点は、計算上の予測だけでなく実際の合成にも結果が出たことを意味します。 ⚠️ 専門設備と人間の判断が必要だとOpenAIは明記今回の研究では、人間が完全に外れているわけではありません。科学者はプロンプトの設計、試す提案の選択、実験計画の一部修正、基本的なラボ作業、そして最終結果の独立確認を担当しています。 OpenAI自身が公式記事のなかで「AIが単独で化学研究を最初から最後まで運営できる証明ではない」と明記しています。専門の高スループット実験設備に依存しており、一般の研究室でそのまま再現できるシステムではありません。今回の成果をほかの反応や条件に広げられるかは未確定です。反応メカニズムの確認、さらに広い基質での検証、独立した再現実験が次の課題として残っています。「AIが薬を自動発見した」という読み方は公式の説明と一致しません。 📊 同日公開のLifeSciBenchと研究AIの現在地同じ日にOpenAIが発表したもう一つの取り組みが「LifeSciBench」です。生命科学の研究でAIがどこまで役立つかを測るベンチマークで、750の専門家作成タスク、1,062の添付資料、19,020の評価基準から構成されています。このベンチマークで、OpenAIの生命科学特化モデル「GPT-Rosalind」の全体正答率（exact pass rate）は36.1%でした。汎用モデルのGPT-5.5は25.7%です。研究現場の複雑な判断では、まだ人間の専門家を代替できる段階ではありません。特定の反復作業は大幅に自動化できる。複雑な総合判断はまだ人間が必要。2つの発表を並べると、この分担がはっきりしますよね。 🏭 製薬・化学業界で実験サイクルはどう変わるか AIが文章を書く、コードを補完するという話は一般的になってきました。今回は「実験の提案→実行→データ解析→次の条件の提案」というサイクルを、現実のラボで回しています。そのフェーズに入り始めたことが、今回の研究の持つ意味です。製薬、素材、化学メーカーで働く人にとって直接変わるのは、反応条件の探索にかかる時間です。その時間が短くなると、研究者の手が仮説立案や結果解釈に向くようになります。一方、今回の研究が「どんな研究室でも来年から使える」という話ではない点は変わりません。専門の高スループット設備と運用コストが前提で、実用化への移行には段階的な検証が必要です。どのフェーズから自動化を始めるか。その起点となる実験データが出てきた、という受け止め方が現実的です。 📚 参考 OpenAI - A near-autonomous AI chemist improves a challenging reaction in medicinal chemistry (https://openai.com/index/ai-chemist-improves-reaction/) OpenAI - Introducing LifeSciBench (https://openai.com/index/introducing-life-sci-bench/) OpenAI - TEMPO Improves Generality and Decreases Oxidative Deboronation in Chan-Lam Couplings of Primary Sulfonamides（論文PDF）(https://cdn.openai.com/pdf/4934b0ed-3de2-4ac5-835c-97604d52dea7/tempo-improves-generality-and-decreases-oxidative-deboronation.pdf)

AppleのSiri AIでiPhoneのアシスタントは何が変わるか

AppleはWWDC26（2026年6月8日）で、次世代Apple Intelligenceとともに新しいAIアシスタント「Siri AI」を発表しました。写真・メッセージ・カレンダー・Webをまたいで作業を進める設計で、従来のSiriから大きく変わる内容です。 🎙️ Siri AIとは何か——従来のSiriとの違い従来のSiriは、タイマーをかける・天気を聞く・電話をかけるといった単発の命令に答えるアシスタントでした。Siri AIは、会話の流れを理解しながら答えを返し、端末内の個人情報を参照しながら作業を進める設計になっています。 Appleは、Siri AIを次世代Apple Intelligenceで動かすと説明しています。Webの情報への質問、写真の検索、メール・メッセージの内容をもとにした作業指示などに対応します。 The VergeやITmediaはGoogleとの連携にも触れています。ただ、Apple公式発表で確認できるのはSiri AIがApple Intelligenceを基盤にするという点です。画面に映っている内容をSiriに伝える機能も備わっており、SafariのページやMapsのルートについてその場で質問できます。会話の履歴はiCloudを通じて複数デバイスに同期され、専用の「Siriアプリ」から見直すことができます。 📱 対応デバイスと対応OS——手元の機種を確認する Siri AIが動作するのはiOS 27、iPadOS 27、macOS 27、watchOS 27、visionOS 27です。開発者向けテストはiOS 27・iPadOS 27・macOS 27・visionOS 27から始まり、watchOS 27は今後のベータで対応予定とされています。対応デバイスは、iPhone 16シリーズ以降、iPhone 15 Pro・iPhone 15 Pro Max、iPad mini（A17 Pro）、M1以降のiPad、M1以降のMac、Apple Vision Pro、Apple Watch Series 9以降・Apple Watch Ultra 2以降・Apple Watch SE 3です。Apple Watchを使う場合は、近くにApple Intelligence対応iPhoneが必要になります。手元のiPhoneが対応しているかは、iPhone 15 Pro・15 Pro Max・iPhone 16シリーズ以降かどうかで判断できます。iPhone 15（無印）・iPhone 15 Plusを含むそれ以前の機種は対象外です。 🗓️ いつ、どの言語で使えるか——日本語対応と英語ベータは別の話 Siri AIは2026年内に英語ベータとして一般ユーザーへの提供が始まる予定です。端末の言語を英語に設定したユーザーが対象で、その後に他の言語へ広げるとAppleは説明しています。日本語でのSiri AI利用開始日は、現時点で公式には発表されていません。 ...

OpenAI GPT-Rosalindが感染症・バイオ防衛へ。Rosalind Biodefenseの審査制と初期パートナーを確認する

新型感染症が確認されてから世界中に広がるまでの時間は、近年どんどん短くなっています。ウイルスの塩基配列から危険度を判断できる専門家の数は限られており、その判断を支える計算作業には今も多くの時間がかかります。 OpenAIは2026年5月29日、生命科学向けのフロンティアモデル「GPT-Rosalind」を公衆衛生・バイオ防衛の現場に届けるプログラム「Rosalind Biodefense」を発表しました。審査を通過した機関がGPT-Rosalindにアクセスできる仕組みで、感染症の早期検知やワクチン開発の加速を目指すとしています。 🔬 発表の内容：2つの新しい動き今回の発表には大きく2つの要素があります。1つ目は「GPT-Rosalind」そのものの公開範囲の拡大、2つ目は「Rosalind Biodefense」という審査制アクセスプログラムの開始です。 GPT-Rosalindは生命科学の推論に特化して開発されたモデルで、タンパク質構造の解析や遺伝子配列の評価、文献からの知識抽出などを得意とします。これまではOpenAIのAPIを通じた限定的な提供にとどまっていましたが、今回のプログラムで公衆衛生機関・政府パートナー・バイオ防衛関連の開発者がアクセス申請できる窓口が整備されました。 Rosalind Biodefenseは、アクセスを希望する組織がOpenAI側の審査を受けて承認されると、GPT-Rosalindをアプリケーションに組み込めるという仕組みです。審査の対象は用途・組織・セキュリティ体制などとされており、誰でも即日使えるサービスではありません。 🔑 なぜ審査制なのか生命科学のフロンティアモデルが誰でも使えるオープンな状態になると、悪用リスクが高まるという懸念があります。病原体の性質を解析・予測できるモデルは、防衛と攻撃の両面に使えるからです。OpenAIはこのリスクへの対応として「trusted access（信頼されたアクセス）」という概念を打ち出し、審査した相手にだけアクセスを認める設計を選びました。「trusted access」の審査基準が具体的にどこまで公開されるのかは、現時点では不明です。審査基準が不透明なままだと、どの組織が通過できてどの組織が弾かれるのかを外部から評価できません。この点は、OpenAIの今後の発表で確認が必要です。ただし、誰でも自由にアクセスできる状態と比べると、責任の所在が明確になります。審査制の枠組み自体には一定の合理性があります。国家安全保障に関わるツールが民間AIプラットフォームから提供される構造には、今後も議論が続きます。 🏛️ 初期パートナーが示す活用の現場発表時点で名前が挙がっている初期パートナーには、感染症サーベイランスを手がける研究機関、ゲノム解析を使ったアウトブレイク調査を行う公衆衛生機関、そしてワクチン開発の加速を目指す非営利組織が含まれています。特に注目されるのが、感染症のパンデミック宣言から100日以内にワクチン候補を提供することを目標とする「CEPI（感染症流行対策イノベーション連合）」との連携です。CEPIの「100日ミッション」はCOVID-19を教訓に設計された目標で、GPT-Rosalindによる配列解析の高速化がその達成を後押しできるかが焦点になります。バイオ防衛の文脈では、既知の病原体データベースとGPT-Rosalindを組み合わせて「未知の配列が既知の危険な病原体とどれだけ類似しているか」を素早く評価する用途が想定されています。専門家の判断を置き換えるのではなく、初期スクリーニングの速度を上げるための補助ツールという位置づけです。 📊 GPT-Rosalind自体の性能 OpenAIが公開したベンチマーク結果では、GPT-Rosalindは生命科学特化の評価指標「BixBench」および「LABBench2」で従来モデルを上回るスコアを記録しています。BixBenchはバイオインフォマティクスの実践的タスクを測る指標、LABBench2は実験計画・文献解釈・分子生物学的推論を総合的に評価します。ただし、ベンチマークの高スコアが実際の公衆衛生業務でどこまで直結するかは別問題です。現場では「モデルが出した答えをどう検証するか」「誰が最終判断を下すか」というガバナンスの設計がスコア同様に重要になります。GPT-Rosalindが優れた推論をしても、それを受け取る組織の体制が整っていなければ現場での価値は限定的です。 🌏 日本の公衆衛生との接続日本では国立感染症研究所（NIID）や地方衛生研究所がゲノムサーベイランスを担っており、COVID-19以降その体制強化が進んでいます。Rosalind Biodefenseへの日本機関の参加については、今回の発表では明示されていません。審査制である以上、日本の公的機関がアクセスを得るには申請と審査のプロセスが必要で、政府間の調整が先行する可能性もあります。厚生労働省やAMEDが関連する国際連携の中でこのプログラムが話題に上がってくるかどうか、引き続き追いかけます。参考情報 OpenAI「Strengthening societal resilience with Rosalind Biodefense」（2026年5月29日）: https://openai.com/index/strengthening-societal-resilience-with-rosalind-biodefense/ OpenAI「Introducing GPT-Rosalind」: https://openai.com/index/introducing-gpt-rosalind/ CEPI「100 Days Mission」: https://cepi.net/100-days-mission

OpenAI Codex、ChatGPTモバイルアプリに統合。外出中もAIの作業を確認・承認できる

スマホを開いたら、AIが夜のうちに進めた作業の結果が届いている。差分を確認して「この方針で続けて」と入力すると、次の処理が走り出す。OpenAIは2026年5月14日、そういう働き方を想定した機能をプレビューとして公開しました。コーディングエージェント「Codex」が、ChatGPTのiOS・Androidアプリに統合されました。ChatGPT Free含む全プランで、対応地域から順次提供されます。 🤖 スマホから何ができて、何はできないか Codexは、ChatGPTの中でコードを書くだけのツールではありません。ローカルのPC、Mac mini、リモートの開発サーバーなどに接続して、ファイルの確認、テストの実行、コードの差分作成まで進められるエージェントです。今回のアップデートで、その作業状況をiOS/AndroidのChatGPTアプリから参照・操作できるようになりました。外出先からできる操作は、作業スレッドの状態確認、次の方針の選択、コマンドの承認、モデルの変更、新規タスクの開始、差分のレビューなどです。スマホに届くのは、スクリーンショット、ターミナルの出力、テスト結果、承認依頼といった「判断するために必要な情報」です。実際のファイルや認証情報、ローカル環境はCodexが動くマシン上に残ります。この設計にはセキュアなリレー層が使われています。信頼済みのマシンを直接インターネットに公開することなく、スマホからアクセスできる仕組みです。現在はmacOS向けのCodexアプリとの接続に対応しており、Windows版は近日対応予定とOpenAIが案内しています。Windows版が加われば、Mac以外の環境を使う開発者も同じワークフローを選べます。 ⚙️ 「判断を返す窓口」という設計の意図 Codexの週次利用者はすでに400万人を超えています。OpenAIは、長時間動くAIエージェントでは「途中の短い確認」や「方針の返答」があることで、作業の停滞と手戻りを減らせると説明しています。目を引くのは、この設計が人の判断を意図的に挟む構造になっている点です。AIに完全に丸投げはしません。AIが迷ったとき、人がPC前に戻るまで全部止まるのではなく、移動中にスマホで「こっちの方向でOK」と返せる仕組みです。AIエージェントを実用的に動かす上で、人の判断を挟む場所を設計に組み込む発想はむしろ現実的です。承認ができる便利さは、誤ったコマンドや不要なデータアクセスを通してしまうリスクも同時に意味します。誰が何を承認できるかは、設計段階で問われることになりそうです。 💼 開発者ツールが示す、業務AIの次の形今回のアップデートでは、モバイル統合以外にも複数の機能が一般提供されました。SSH接続でリモート環境に入れる「Remote SSH」、プロンプト内の秘密情報スキャンやメモリ作成などをカスタムできる「Hooks」の2つです。 EnterpriseとBusinessプランのユーザーには、CIパイプライン、リリースワークフロー、社内自動化で使えるスコープ付き認証情報「Programmatic access tokens」も提供されます。ChatGPT Enterpriseワークスペースでは、ローカルCLIやIDEとして使う場合に限ってHIPAA準拠にも対応しています。現時点では、Codexは開発者向けのツールです。コードを書く仕事でなければ、すぐに使える段階ではありません。ただ、「AIが長い作業を進め、人がスマホで要所の判断を返す」という構造は今後の業務AIに広がる方向性を示していますし、わたしはそう見ています。モバイル版は現時点でプレビュー段階ですが、資料調査、問い合わせ対応の仕分け、社内文書のチェックといった作業でも、同じパターンが使われる場面が出てきます。参考 OpenAI — Work with Codex from anywhere（https://openai.com/index/work-with-codex-from-anywhere/） ITmedia AI＋ — OpenAI、「Codex」をChatGPTモバイルアプリに統合──外出先からコーディング作業を管理（https://www.itmedia.co.jp/aiplus/articles/2605/15/news063.html） The Verge — AI artificial intelligence（https://www.theverge.com/ai-artificial-intelligence）

AIが数学研究の「作業場」になる。AI Co-Mathematicianが示す次のステップ

数学の未解決問題をAIに解かせる場面で、「解こうとした記録」まで引き受けてくれるとしたら何が変わるか。その問いに正面から取り組んだ研究論文が、2026年5月7日にarXivで公開されました。 Google所属の研究者らによる査読前の公開論文（preprint）で、タイトルは「AI Co-Mathematician: Accelerating Mathematicians with Agentic AI」。査読済みではなく、現時点では研究プロトタイプとして限定公開されているシステムの報告です。 🔬 「プロジェクト」として調べ続けるAI AIチャットに慣れた人なら、こんな使い方をしているはずです。疑問を入力して、答えが返ってきたら次の疑問を入力する。一回一回がリセットされる、積み上がらないやりとり。 AI Co-Mathematicianはそこから大きく外れた設計になっています。複数の作業流を束ねるプロジェクト調整役エージェントが中心に置かれ、アイデア出し、文献探索、計算探索、定理証明、理論構築といった作業を並行して進められます。中心にあるのは「状態を持つ」設計です。途中で出た仮説、却下した試み、見つけた文献、失敗したアプローチ。これらが同じワークスペース内に残ります。次のセッションでゼロから始め直さなくていい。この設計が、一問一答との本質的な違いです。 📊 「48%」という数字の読み方論文がベンチマークとして使ったのは「FrontierMath Tier 4」という評価セットです。数学の専門家でも解くのが難しい問題群で、AI研究の進捗を調査するEpoch AIという独立機関がブラインドで採点しました（開発者は問題内容を見ていません）。公開サンプル2問を除いた48問中23問を正答。正答率は48%でした。この数字には比較対象があります。ベースのGemini 3.1 Proは同条件で19%。AIエージェントの設計を重ねたことで、単体モデルの2倍以上の正答率になりました。さらに、過去にどのシステムも解けていなかった3問を含んでいます。ただし、この評価には重要な注釈があります。論文には、モデル呼び出し回数やトークン数の上限を設けていないと明記されています。つまり推論にかかるコストを度外視した条件での結果です。実運用を念頭に置くなら、コストの評価は別途必要です。 ⚠️ 論文が正直に書いた「三つの落とし穴」ちょっと気になったのは、限界の書き方が妙に具体的な点です。研究論文はよく「将来の課題」として曖昧に終わらせますが、この論文は実際に観察された失敗パターンを名前付きで挙げています。 false consensus（偽の合意）: 複数のエージェントが互いにレビューしながら、誤りを含む議論に合意してしまう状態。AIが「自分たちで検討したから正しい」という空気を作り出す問題です。人間が介在しないと見抜けない場合があります。 death spiral（無限ループ）: 修正と却下が止まらず、エージェントたちが迷子になる状態。長時間の自律作業中に、どの方向へ進むべきか見失います。制御の難しさ: 長時間にわたる自律作業では、人間が介入するタイミングの設計が難しいと述べられています。 ...

ChatGPT広告が日本に拡大 FreeとGoプランで何が変わるか

ChatGPTの画面に、広告が出てきます。対象は無料のFreeプランとGoプランの利用者です。わたしはChatGPT Proを使っているので今回の広告対象外ですが、毎日使うツールの仕様変化は気になりますよね。 📅 日本展開はいつから？対象プランを確認する OpenAIは2026年5月7日に公式ページを更新し、ChatGPT内広告テストを今後数週間で日本へ広げると明記しました。同じ更新で英国、メキシコ、ブラジル、韓国も追加対象となっています。「発表した」と「始まった」は別です。2026年5月9日時点で、日本での広告表示開始を公式が確認した情報は出ていません。ITmediaの報道でも「数週間以内」という表現が使われています。具体的な開始日は、まだ公表されていません。広告の対象となるのは、ログイン済み成人ユーザーのうちFreeプランとGoプランのみです。プラン広告の対象 Free 対象 Go 対象 Plus 対象外 Pro 対象外 Business / Enterprise / Education 対象外有料プランを使っている場合、今回の広告テストは関係ありません。未成年のアカウント、健康・メンタルヘルス・政治などセンシティブな会話の近くにも広告は出さないとOpenAIは説明しています。 💬 回答と広告の境界線をどう見るか OpenAIの説明では、広告はChatGPTの回答内容に影響せず、スポンサー表示として回答と明確に分離されます。ただし、どの広告を出すかを選ぶ際に、会話のトピック・過去のチャット・過去の広告操作が使われる設計です。回答と広告が画面上で分かれていても、会話の文脈が広告の選択に作用するわけです。正直、少し引っかかります。買い物を比較しながら広告も見せられる状況では、ChatGPTの回答が中立かどうか疑う人が出てくるからです。OpenAIが「回答への影響なし」を繰り返し強調しているのは、その懸念を先回りで打ち消すためです。広告主に渡るデータについて、OpenAIはチャット本文・チャット履歴・メモリ・個人情報を提供しないと明示しています。広告主が受け取るのは、表示回数やクリック数などの集計データのみです。仕事でChatGPTを使う場合も、業務内容が広告主に渡るわけではありません。ただし会話内容がOpenAIの広告選択に使われる設計は変わらないため、社内情報や顧客情報を会話に含めない基本方針は引き続き有効です。 ⚙️ 広告を消す方法と設定の確認先 OpenAIは設定画面から以下の管理ができると説明しています。なぜその広告が表示されたかを確認する広告データを削除する広告パーソナライズをオフにする広告そのものを非表示にする選択肢もありますが、その場合は1日の無料メッセージ数が減ります。広告なしで使い続けたい場合、PlusまたはProへのアップグレードで対応できます（月額費用が発生します）。これらの設定は日本での広告テスト開始後に有効化される予定です。今の時点でChatGPTの設定画面を開いても、まだ表示されていない可能性があります。日本での展開が始まったら、アカウント設定のプライバシー関連セクションを確認してください。 🏢 OpenAIが広告を始める理由 OpenAIが広告に踏み出したのは、無料版の維持コストを補う収益源が必要だからです。2026年2月の最初の発表でも、「ChatGPTの無料アクセスを広げるための財源」として説明していました。月額費用なしで使えるサービスを維持するには、相応の計算コストがかかります。その一部を広告収入で補う構造です。 OpenAIの広告向けページには「人が調べ、比較し、次の行動を決めようとしている会話に企業が接点を持つ」と書かれています。検索エンジンが広告収入で成り立ってきたのと同じ仕組みを、AI会話に持ち込もうとしているわけです。ChatGPTを検索代わりに使う人が増えた分だけ、その比較検討の瞬間が広告枠として価値を持ちます。 🔗 参考 OpenAI「Testing ads in ChatGPT」（https://openai.com/index/testing-ads-in-chatgpt/） OpenAI「Our approach to advertising and expanding access to ChatGPT」（https://openai.com/index/our-approach-to-advertising-and-expanding-access/） OpenAI「Advertise with ChatGPT」（https://openai.com/advertisers/） ITmedia AI+「ChatGPTの『広告表示テスト』、日本でも開始へ　数週間以内」（https://www.itmedia.co.jp/aiplus/articles/2605/08/news066.html）

GmailのAI下書きが過去メールとDrive資料を参照

仕事のメールを書くとき、時間を食うのは本文そのものだけでなく、前のやり取りを遡り、Driveから資料を探し、相手向けの言い回しに直す作業です。Googleは2026年5月7日、この流れを変える更新をGmailのAI下書き機能「Help me write」に加えたと発表しました。派手さはありませんが、毎日のメール仕事にはかなり大きい変更です。対象プランはBusiness Starter・Standard・Plus、Enterprise Starter・Standard・Plus、Google AI Plus・Pro・Ultra、Google AI Pro for Educationで、個人向けの無料Gmailは対象外です。ロールアウトは2026年5月5日に開始されましたが、展開が出揃うまで15日以上かかる可能性があります。職場や学校のアカウントで見える機能、と捉えるのが近いです。 📨 Drive・GmailをAIが参照して下書きを作る「Topic contextualization」新機能の1つ目は「Topic contextualization」と呼ばれる仕組みです。「Help me write」でプロンプトを書くと、GmailとGoogle Driveの関連情報を自動で参照し、その内容を下書きに組み込みます。たとえば「プロジェクトの進捗を担当者にメールして」と入力すると、関連するメールのやり取りやDriveのファイルから日程・予算・決定事項を引いて下書きを作る流れです。Google公式ブログではこうした例が紹介されています。これがうまく動くなら、担当者への定例連絡はかなり軽くなります。下書きが生成されると「Sources」ボタンが表示され、Geminiがどのメールやドキュメントを参照したかを確認できます。内容に食い違いがあったとき、どの情報を元に書いたかを後から追えるようにするための機能です。AI下書きを仕事で使うなら、この確認導線は安心材料になります。 ✍️ 過去の自分のメール文体を学ぶ「Tone and style personalization」 2つ目は文体のパーソナライズです。メールは内容が同じでも、言い方で受け取られ方が変わります。過去に自分が書いたメールのトーンやスタイルをAIが参照し、定型文ではなく本人の書き方の癖に近い下書きを生成することを目指しています。ただし、Googleのヘルプページには「文体とスタイルに合わせるには下書きが英語である必要がある」と明記されています。日本語のメールで同じ水準のパーソナライズが働くかどうかは、現時点では公式に確認できません。日本語環境での品質は今後の検証が必要な段階です。Topic contextualization（Drive・Gmail情報の参照）については英語限定の記載はないため、日本語でも何らかの動作はあると見られます。ただ、実際の使用感は追って確認していきます。 🔧 利用に必要なプランと管理者設定 AIがGmailとDriveの情報を参照する基盤は「Workspace Intelligence」という仕組みです。GmailのGemini for WorkspaceとWorkspace Intelligenceの両方が管理者によって有効化されていることが前提になります。標準ではオンになっていますが、設定変更が反映されるまで最大48時間かかる場合があります。会社のアカウントで「機能が出ていない」と感じたら、IT担当者に確認してみてください。単にまだ届いていないだけ、というケースもありそうです。 Googleは「Workspace Intelligenceが使うデータは広告目的やAIモデルの訓練には使わない」と説明しています。それでも、社内のどんな情報をAIに参照させるかは組織ごとの決め事です。便利さだけで済ませず、参照範囲をあらかじめ決めておきたい機能です。 💡 「メール文章の生成」から「社内情報を引いた下書き」への変化「Help me write」は2023年ごろに登場した機能で、当初はシンプルな文章生成でした。今回の更新で参照できる情報の幅が広がったことで、「Driveで資料を探す→数字をコピーする→メールに落とし込む」という作業ステップを丸ごと省く方向に進んでいます。メール作成だけでなく、社内情報を文章にまとめる補助に近づいています。この方向性はわかるのですが、気になるのは下書きをそのまま送った場合のリスクです。数字の参照もれや、相手の状況に合わない表現が混ざっていても、AIはそれを教えてくれません。情報収集の手間は減るとしても、内容を確認して送信するステップは引き続き必要です。「Sources」で参照元を確認できる仕組みは、そのためにあるわけですね。下書きを受け取ったら本文と出典をセットで見る、という流れで使うのが自然です。 🔗 参考 Google Workspace Updates — Improvements To Help Me Write in Gmail（https://workspaceupdates.googleblog.com/2026/05/improvements-to-help-me-write-in-gmail.html） Google Workspace Blog — More personalized and proactive assistance in Gmail coming to business customers（https://workspace.google.com/blog/product-announcements/more-personalized-and-proactive-assistance-in-gmail-coming-to-business-customers） Google Support — Write emails with Gemini in Gmail（https://support.google.com/mail/answer/13384326） Google Workspace Admin Help — Control Workspace Intelligence（https://knowledge.workspace.google.com/admin/gemini/control-workspace-intelligence） The Verge — Gmail’s AI writing tool will write emails that sound more like you（https://www.theverge.com/ai-artificial-intelligence）