GPT-5.4

薬の候補が見つかっても、実際に合成できなければ次の段階には進めません。反応の効率（収率）が低いと、条件を変えながら何度も試し直すことになります。この繰り返しの実験作業にAIと自動化設備を組み込んだら、どこまで進められるのか。OpenAIとMolecule.oneが、2026年6月17日にその試みの結果を公開しました。化学者も意外と受け止めた提案が、実際の実験で数字になっています。今すぐ使える一般向けサービスではありません。高スループット実験設備と専門の化学者が前提の研究プロトタイプです。ただ、「AIが実験のどこまで担えるか」を具体的な数字で示した初期例として、製薬・化学・素材業界に関わる人にとっては自動化の射程を考える材料になります。 🔬 GPT-5.4が実験計画を担い、1万件の反応を処理対象となった化学反応は「Chan-Lamカップリング」と呼ばれるものです。医薬品の候補分子を合成する際に使われる反応で、炭素と窒素を結びつけます。一次スルホンアミドという素材を使う組み合わせでは収率が低く、条件改善が課題とされていました。 OpenAIのモデル（OAI-M1-03、GPT-5.4ベース）を、Molecule.oneの化学AI「Maria」と高スループット実験ラボに接続しました。このシステムが研究の方向を提案します。実験計画を立て、得られたデータを解析し、次の条件を提案するサイクルを回します。Maria Labが処理した実験は最終的に10,080件です。化学者が1日3件の実験を行うとすると、同じ件数を手作業でこなすには10年以上かかる計算になります。OpenAIが公式記事でこの比較を示しており、反復試行の規模が従来と大きく異なります。 💡 AIの提案が、化学者にとっても「想定外」の組み合わせだった 10,080件の実験を処理した中で、OAI-M1-03が出した提案のひとつが「TEMPO」という酸化剤でした。穏やかな酸化を起こす試薬で、Chan-Lamカップリングに組み合わせるのは化学者の通常の発想にはなかった選択です。OpenAIは公式記事のなかで、この提案は化学者にとっても「興味深い提案だった」と説明しています。正直、ここは意外でした。TEMPOは化学者の通常の発想から外れた選択だった、とOpenAIが説明しているからです。わたしはこの数字を、研究者の仕事が消える証拠とは見ません。大量の実験データから統計的なパターンを探す過程で、人間が見落としていた組み合わせを引き出せる場合がある。そんな読み方が近いと思います。 TEMPOを組み合わせた条件で得られた成果を見ると、試したボロン酸の88%、一次スルホンアミドの83%で収率が改善しました。平均収率は16.6%から25.2%に上がり、収率30%超の反応の割合は15.6%から37.5%に増えています。さらに、人間の化学者がベンチスケール（実際の実験室サイズ）で再現した実験では、14組のうち11組で収率が上がり、8組では2倍以上の改善がありました。実験室での再現性が確認できた点は、計算上の予測だけでなく実際の合成にも結果が出たことを意味します。 ⚠️ 専門設備と人間の判断が必要だとOpenAIは明記今回の研究では、人間が完全に外れているわけではありません。科学者はプロンプトの設計、試す提案の選択、実験計画の一部修正、基本的なラボ作業、そして最終結果の独立確認を担当しています。 OpenAI自身が公式記事のなかで「AIが単独で化学研究を最初から最後まで運営できる証明ではない」と明記しています。専門の高スループット実験設備に依存しており、一般の研究室でそのまま再現できるシステムではありません。今回の成果をほかの反応や条件に広げられるかは未確定です。反応メカニズムの確認、さらに広い基質での検証、独立した再現実験が次の課題として残っています。「AIが薬を自動発見した」という読み方は公式の説明と一致しません。 📊 同日公開のLifeSciBenchと研究AIの現在地同じ日にOpenAIが発表したもう一つの取り組みが「LifeSciBench」です。生命科学の研究でAIがどこまで役立つかを測るベンチマークで、750の専門家作成タスク、1,062の添付資料、19,020の評価基準から構成されています。このベンチマークで、OpenAIの生命科学特化モデル「GPT-Rosalind」の全体正答率（exact pass rate）は36.1%でした。汎用モデルのGPT-5.5は25.7%です。研究現場の複雑な判断では、まだ人間の専門家を代替できる段階ではありません。特定の反復作業は大幅に自動化できる。複雑な総合判断はまだ人間が必要。2つの発表を並べると、この分担がはっきりしますよね。 🏭 製薬・化学業界で実験サイクルはどう変わるか AIが文章を書く、コードを補完するという話は一般的になってきました。今回は「実験の提案→実行→データ解析→次の条件の提案」というサイクルを、現実のラボで回しています。そのフェーズに入り始めたことが、今回の研究の持つ意味です。製薬、素材、化学メーカーで働く人にとって直接変わるのは、反応条件の探索にかかる時間です。その時間が短くなると、研究者の手が仮説立案や結果解釈に向くようになります。一方、今回の研究が「どんな研究室でも来年から使える」という話ではない点は変わりません。専門の高スループット設備と運用コストが前提で、実用化への移行には段階的な検証が必要です。どのフェーズから自動化を始めるか。その起点となる実験データが出てきた、という受け止め方が現実的です。 📚 参考 OpenAI - A near-autonomous AI chemist improves a challenging reaction in medicinal chemistry (https://openai.com/index/ai-chemist-improves-reaction/) OpenAI - Introducing LifeSciBench (https://openai.com/index/introducing-life-sci-bench/) OpenAI - TEMPO Improves Generality and Decreases Oxidative Deboronation in Chan-Lam Couplings of Primary Sulfonamides（論文PDF）(https://cdn.openai.com/pdf/4934b0ed-3de2-4ac5-835c-97604d52dea7/tempo-improves-generality-and-decreases-oxidative-deboronation.pdf)