ABEJA、NEDO推進「GENIAC」プロジェクト 第二期事業の終了に伴う成果報告 ~ 構築した小型化LLMの日本語性能が世界最高水準を達成 ~|株式会社ABEJA
top of page
hero-news.jpg

News

ニュース

2025.06.03

プレスリリース

ABEJA、NEDO推進「GENIAC」プロジェクト 第二期事業の終了に伴う成果報告 ~ 構築した小型化LLMの日本語性能が世界最高水準を達成 ~

 


 人とAIの協調により「ゆたかな世界を、実装する」株式会社ABEJA(本社:東京都港区、代表取締役CEO:岡田 陽介、以下「ABEJA」)は、経済産業省とNEDOが実施する、国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の第二期である「競争力ある生成AI基盤モデルの開発(助成)」事業※1(以下「第二期事業」)にて、LLMおよび周辺技術の研究開発を進めてまいりました。

 2024年10月より開始した当該事業は、2025年4月末日をもって終了いたしましたことをお知らせいたします。 

 ABEJAは、当該事業において、学習コスト1億円を上限に3つの小型化LLMを構築しました。3モデルのうち、32Bリーズニングモデルおよび7Bモデルは、同規模モデルにおける世界最高水準の日本語性能を達成しております。

 ABEJAは、このたびの研究開発によって、LLMの社会実装を阻む障壁であった「精度とコストのトレードオフ」という課題を克服したと認識しております。またABEJAは、社会実装の加速化を実現すべく、エッジ環境でのデプロイも可能にし、第二期事業における研究開発で得られた各モデルおよびノウハウなどを公開しております。



概要

 ABEJAは、「ゆたかな世界を、実装する」を経営理念に掲げ、ミッションクリティカル業務へのAI導入支援のため、基盤システムとなるABEJA Platformの開発・導入・運用を行う「デジタルプラットフォーム事業」を展開しています。ABEJAは、2012年の創業時よりディープラーニング、2018年からLLM、2019年から量子コンピューティングなどの前衛的研究開発を積極的に行っており、随時、研究開発成果をABEJA Platformに搭載しております。

 


 現在、世界中の企業がLLMを中心とする生成AIから生み出される巨大な価値を享受するため、様々な取り組みを開始しています。このような背景の元、経済産業省およびNEDOは、日本国内の基盤モデル開発力を底上げし、また企業などの創意工夫を促すため、GENIACを立ち上げました。GENIACでは生成AIに係る様々な支援を進め、日本の開発力の向上を目指しています。

ABEJAは、GENIACに、第一期(2024年2月~2024年8月)、第二期(2024年10月~2025年4月)と継続して参画し、LLMの社会実装に貢献しております。

 


 LLMにおける重要な法則の1つとして、LLMの精度の向上に合わせて、計算量、学習データサイズ、モデルのパラメータ数が巨大化していく「スケール則」があります。LLMの精度を向上させるためには、必然的にコストが増大するため、精度とコストにはトレードオフの関係があるとされていました。

 ABEJAは、従来よりLLMの社会実装における最大の課題は、「精度とコストのトレードオフ」にあると考えており、この課題を解決するため、第二期事業においては高精度の特化型モデルの開発に向けたモデルの小型化を進めてまいりました。このたびの研究開発によって、LLMの社会実装を阻む障壁であった「精度とコストのトレードオフ」という課題克服を大きく前進させる成果が得られております。


ABEJAおよびNEDOが取り組んだ第二期事業(概要図)
ABEJAおよびNEDOが取り組んだ第二期事業(概要図)

■ 第二期事業における成果  

(1)世界最高水準の性能を備えた利便性の高い小型化日本語LLMの構築

 第二期事業において、ABEJAは、Alibaba社のQwenシリーズをベースモデルとして、32B小型化モデル「ABEJA Qwen2.5-32B Model」、32B小型化リーズニングモデル「ABEJA QwQ-32B Reasoning Model」、7B小型モデル「ABEJA Qwen2.5-7B Model」の3モデルを構築いたしました。

 これら3モデルのうち、32B小型化リーズニングモデル「ABEJA QwQ-32B Reasoning Model」、7B小型モデル「ABEJA Qwen2.5-7B Model」の2モデルの日本語性能が、それぞれ同規模モデルとの比較において、世界最高水準の性能を達成しています。

 このたび構築した3モデルは、精度やコスト、利便性の観点から実用性を備えており、エッジ環境でのデプロイが可能であるため、オフィスや工場など多様なエッジ環境での実装が可能です。

 なお、ABEJAは、こうした3つの高精度LLMを学習コスト合計1億円以内(トライアンドエラーも含む)で開発しており、LLMの構築においても、経済合理性を大きく改善させています。

 

 また他の2モデルより先んじて2025年1月に公開した「ABEJA Qwen2.5-32B Model」※2においては、日本経済新聞社「NIKKEI Digital Governance」「AIモデルのスコア化ランキング」(25年3月公開)※3で、日系1位、グローバル16位にランクインしております。またWandBのNejumi Leaderboard3 ※4の総合スコアでは50B以下のモデルとして1位を獲得しております。


32B以下モデルに関する性能指標 
32B以下モデルに関する性能指標 

10B以下モデルに関する性能指標
10B以下モデルに関する性能指標

 ABEJAが構築した3モデルと主なモデルおよびその精度

モデル名

性能

ABEJA Qwen2.5-32B Model

OpenAI GPT-4超え

ABEJA QwQ-32B Reasoning Model

同規模モデルの最高水準かつOpenAI GPT-4o、o1-preview超え

ABEJA Qwen2.5-7B Model

同規模モデルの最高水準かつOpenAI GPT-3.5 Turbo超え

・「ABEJA Qwen2.5-32B Model」に関する性能:

 汎用的言語性能を図る指標「MT-Bench」における主なモデルの総合スコア(ABEJA調べ)

モデル名

総合スコア

ABEJA Qwen2.5-32B Model

8.29

gpt-4

7.73

Qwen2.5-32B-Instruct

8.09

・「ABEJA QwQ-32B Reasoning Model」に関する性能:

 汎用的言語性能を図る指標「MT-Bench」における主なモデルの総合スコア(ABEJA調べ)

モデル名

総合スコア

ABEJA QwQ-32B Reasoning Model

8.67

anthropic.claude-3-5-sonnet

8.64

o1-preview

8.64

QwQ-32B

8.56

gpt-4o

8.51

Qwen2.5-72B-Instruct

8.38

Qwen2.5-32B-Instruct

8.0

・ABEJA Qwen2.5-7B Model」に関する性能:

 汎用的言語性能を図る指標「MT-Bench」における主なモデルの総合スコア(出典:WandB Nejumi Leaderboard3)

モデル名

総合スコア

ABEJA Qwen2.5-7B Model

7.26

anthropic.claude-3-haiku

7.13

Qwen2.5-7B-Instruct

6.86

gpt-3.5-turbo

6.82

Meta-Llama-3-8B-Instruct

6.21

 

(2)情報の公開

 第二期事業の期間中、ABEJAおよびNEDOは、LLMを利活用する企業や組織の増加、社会におけるAI技術革新の大幅な加速、そして次世代の研究や技術者の育成を目的に、情報公開してまいりました。  

 モデルについてはHugging Faceで、また研究開発において得られたノウハウや評価などの詳細についてはブログで公開しております。さらにNEDOが主催する各企業とのマッチングイベント、各種セミナー、イベントなどにABEJAは積極的に参加し、情報を公開するなど両者で社会実装に向けた啓蒙活動も推進いたしました。

 

ABEJAが構築した3モデルおよびその公開先

 

■ 今後の予定

 このたび構築した3モデルは、低コストで高い精度を有した、利便性の高い小型化モデルです。そのため、コスト負荷が高く遠隔にあるデータセンターではなく、オフィスや工場などの環境下で利用が可能になります。またクラウドが不要となるため、セキュリティの高いクローズドな環境で利用することも可能です。ABEJAは、具体的に、高度なプライバシー処理が求められる銀行や病院、インタ-ネットから断絶している環境、迅速かつ正確な操作や入力が必要となる工場などでの活用を想定し、企業のAI実装を支援する基盤となる「ABEJA Platform」に搭載し、提供してまいります。

 


 ABEJAは、引き続き、LLMの社会実装を推進し、ABEJAの企業理念である「ゆたかな世界を、実装する」の実現に努めてまいります。

 


 この成果は、NEDOの助成事業の結果得られたものです。

 

 

※1「競争力ある生成AI基盤モデルの開発(助成)」事業:https://www.nedo.go.jp/koubo/IT3_100331.html

※2 他の2モデルより先んじて2025年1月に公開した「ABEJA Qwen2.5-32B Model」:

「ABEJA QwQ-32B Reasoning Model」および「ABEJA Qwen2.5-7B Model」については、2025年4月に公開。

※3 日本経済新聞社「NIKKEI Digital Governance」「AIモデルのスコア化ランキング」(25年3月公開 ):

日本経済新聞社が発行する電子媒体「Digital Governance」で定期的に公開されるAIモデルの精度をスコア化したランキングチャート。https://vdata.nikkei.com/prime/digital-governance/ai-model-score/ (有料記事)

※4 WandBのNejumi Leaderboard3:

WandB:https://wandb.ai/site

Nejumi Leaderboard3:日本語対応のLLMを対象に網羅的な性能評価を行う指標。

https://wandb.ai/wandb-japan/llm-leaderboard3/reports/Nejumi-LLM-3--Vmlldzo3OTg2NjM2

 

 

■株式会社ABEJAについて

ABEJAは、「ゆたかな世界を、実装する」を経営理念に掲げ、ミッションクリティカル業務へのAI導入支援のため、基盤システムとなるABEJA Platformの開発・導入・運用を行う「デジタルプラットフォーム事業」を展開しています。ABEJA Platformは、ミッションクリティカル業務における堅牢で安定した基盤システムとアプリケーション群であり、生成AIをはじめとする最先端技術による運用が人とAIの協調により実現可能です。ABEJAは、2012年の創業時よりABEJA Platformの研究開発を進めており、顧客企業からの信頼のもと、数多くの導入を進めることで「テクノロジーの力で産業構造を変革する」ミッションに取り組んでいます。

 

本 社:東京都港区三田一丁目1番14号 Bizflex麻布十番2階

設 立:2012年9月10日

代 表:代表取締役CEO 岡田 陽介

事 業:ミッションクリティカル業務へのAI導入支援のため、基盤システムとなるABEJA Platformの開発・導入・運用を行う「デジタルプラットフォーム事業」

URL:https://abejainc.com

bottom of page