News

ニュース

2026.05.28

プレスリリース

医療現場の事務作業を支援する高性能な日本語LLMを開発しました―日本の医療特性を踏まえた安全性検証により医療LLMの社会実装を後押し―

　本日ABEJAは、2025年6月より当社が参画しておりました「日本語版医療特化型LLMの社会実装に向けた安全性検証・実証」について、関係各所と連名でプレスリリースを発表いたしました。参照リリース：https://www.abejainc.com/news/20250617/1

NEDO（国立研究開発法人新エネルギー・産業技術総合開発機構）

さくらインターネット株式会社

国立大学法人東京大学

株式会社ＡＢＥＪＡ

国立研究開発法人理化学研究所

学校法人国際医療福祉大学

学校法人藤田学園　藤田医科大学

国立大学法人東京科学大学

国立大学法人九州大学

株式会社ヘリオス

　NEDOが推進した「AIの安全性確保に関する研究開発・検証等の推進事業／日本語版医療特化型LLMの社会実装に向けた安全性検証・実証」（以下、本事業）において、連名機関10者は、医療機関のオンプレミス環境または医療機関が管理する国内クラウド環境などの患者情報を安全に管理できる環境で運用可能で、世界最先端の商用LLMに迫る性能を有する医療業務支援向け日本語LLMを開発しました。

独自に構築したベンチマークによる検証の結果、専門医試験を模した学術試験において最大90.8％の正答率を達成し、比較対象とした主要な商用LLM（91.4％）に迫る水準に到達しました。あわせて、日本の医療特性を踏まえた安全性検証を実施し、医療現場での利用に求められる性能と安全性の両立を確認しました。

本研究開発の成果については、医療現場の業務効率化および医療の質向上に資することを目指し、今後、段階的に社会実装を進めていく予定です。

1．背景

　医療機関がAIを活用するにあたっては、以下の三つの構造的課題が存在します。

1）患者情報の管理に関する課題：一般的なAIサービスの多くは、患者情報が国外のサーバや外部事業者の管理下で処理される構造になっており、医療機関側で患者情報の所在や取り扱いを十分に把握・管理することが困難です。

2）データ標準化の課題：医療機関ごとに用語やコード体系が異なり、データの相互運用性が十分に確保されていません。

3）安全性基準の課題：医療現場におけるLLM^※1活用にあたっての安全性基準が未整備であり、導入判断のよりどころが乏しい状況にあります。

本事業^※2では、患者情報を安全に管理できる環境で運用可能であり、かつ主要なAIに匹敵する性能を有するAIの開発を目標として、（1）LLM開発、（2）安全性検証、（3）ユースケース検証の3点に取り組みました。

2．今回の成果

（1）患者情報を安全に管理できる環境で運用可能な高性能日本語LLMの開発

　公開されているオープンなLLMをベースモデルとして、日本の診療ガイドライン・専門医試験問題・臨床事例などの医療分野の教材から生成したデータを学習させた追加学習^※3モデルを開発しました。その結果、患者情報を安全に管理できる環境で運用可能でありながら、主要な商用LLMに迫る性能を実現しました。

　主な成果として、専門医試験を模した学術試験において、外部文書を参照しながら回答する方式（RAG）を用いることで最大90.8％の正答率に到達し、比較対象とした主要な商用LLM（91.4％）に迫る水準に到達しました。また、日本の診療ガイドラインに沿った応答ができるかを評価する指標では、ベースモデルと比較して最大10.8ポイントの性能向上を確認しました（表1）。

　加えて、独自アーキテクチャによる国産のフルスクラッチ開発^※4モデルも構築しました。同規模のオープンモデルと比較して競争力のある性能を示し、将来の国産基盤モデル開発に向けた技術的知見を蓄積しました。