楽天グループが、国産最大規模の高性能LLM「Rakuten AI 3.0」を公開した、という事例です。
「LLMの話なんて、うちみたいな中小企業には関係ないでしょ」と思った方、ちょっと待ってください。 これは「自社でLLMを作る話」ではなく、「国産LLMという選択肢が増えた」話として読むと、中小企業のAI導入判断にも効いてきます。
僕が注目したのは、MT-Benchで8.88(GPT-4oの8.67を上回る)というスコアそのものより、「MoE(Mixture of Experts)で必要なときだけパラメータを動かす」という構成です。 ここを押さえずに「7000億パラメータLLMが日本語で動く」と読むと、コスト感をミスリードします。
国産LLMをめぐる中小企業の課題
中小企業がAI活用を進めるときに、よく出てくる構造的な悩みは以下です。
- ChatGPT/Claude/Gemini など海外モデルへの依存度が高く、料金改定の影響を受けやすい
- 機密データを海外サーバーに送ることに、社内ルール上の抵抗がある
- 「国産LLMもあるらしいが、どれを選べばいいかわからない」状態
- 業務特化チューニングをしたいが、自社で基盤モデルを持つコストは現実的でない
「国産モデルを使えば全部解決」というほど単純ではありません。 ただ、選択肢が増えれば「この業務はClaude、この業務は国産モデル」と使い分ける余地が出てきます。
Rakuten AI 3.0をどう開発したか
一次情報(楽天プレスリリース、2025-12-18)の範囲では、以下の構成です。
- モデルアーキテクチャ: MoE(Mixture of Experts)
- 総パラメータ数: 約7,000億(国内最大規模)
- アクティブパラメータ: 推論時 約400億
- 基盤: 前モデル「Rakuten AI 2.0」(47B)からのスケールアップ
- 開発体制: 経済産業省/NEDO「GENIAC」第3期(2024-07採択)
- 公開予定: 2026年春にオープンウェイト公開予定
ポイントは MoE構成 です。 総パラメータは7,000億あっても、推論時に動くのは400億程度。 これは「巨大モデルの性能を、現実的な推論コストで動かす」設計で、商用利用を前提とした作りです。
8.88という数字の内訳と実態
プレスリリースで報告された主要な数値は以下です。
- 日本語MT-Bench: 8.88(GPT-4o 8.67を上回る)
- 前モデル Rakuten AI 2.0(47B)の6.79から大幅向上
- 楽天エコシステム内で最大90%のコスト削減を実現
- 用途: 楽天市場・楽天証券などグループ各社のAIアシスタント基盤
注意点として、MT-Bench 8.88はあくまで日本語ベンチマーク上のスコアであって、自社の業務タスクで同等の精度が出るとは限りません。 LLMは「ベンチで強い=自分の業務で強い」ではないので、最終的にはPoCで自社データで試すのが定石です。
また、「楽天エコシステム内で90%のコスト削減」は、楽天グループ内で完結する利用形態の話です。 外部企業が同じコスト効率で使えるかは、オープンウェイト公開後のホスティング条件次第になります。
中小企業で再現するなら
ここからが本題です。中小企業(年商5〜30億)が国産LLMをどう取り入れるかの話です。 「自社でLLMを作る」は対象外なので、「選択肢として持つ」視点でまとめます。
構成
| 項目 | 楽天グループ | 中小企業(年商5〜30億・社員30〜200名) |
|---|---|---|
| 対象 | 楽天エコシステム全体 | 業務別に使い分け(顧客対応・社内Q&A・文書要約等) |
| ツール | Rakuten AI 3.0(自社開発) | Claude/ChatGPT + 国産LLM(Rakuten AI 3.0/PLaMo/CyberAgent等)を併用 |
| 月額費用 | (グループ内最適化) | 推定 月1〜5万円(クラウドAPI利用、2026年5月時点。要最新価格確認) |
| 初期費用 | 数百億円規模(GENIAC支援含む) | 推定 30〜100万円(用途整理+PoC+運用ルール策定) |
| 体制 | AI研究組織+グループ各社 | 情シス担当+外部支援月5〜10時間 |
| 期間 | 1年以上 | 2〜4ヶ月でPoC→本格運用 |
評価軸スコア
| 評価軸 | スコア |
|---|---|
| ROI(投資対効果) | ★★★☆☆ |
| 再現性(中小企業) | ★★★☆☆ |
| 難易度(低いほど簡単) | ★★★☆☆ |
(難易度=数字小さいほど簡単)
スコア根拠は以下です。
- ROIは中程度。国産LLMで海外モデルから切り替えても、業務効果はモデル選定より「用途設計」で決まる
- 再現性は中程度。オープンウェイト公開後の利用環境整備が前提
- 難易度は中程度。複数モデル併用の運用設計と、用途ごとのモデル選定基準づくりが必要
前提条件・必要データ
- AI活用したい業務が、最低3〜5つ言語化されている
- 業務ごとに「どの程度の精度・速度・コスト感が必要か」が整理できる
- 機密データの取り扱いルールが社内で合意済み
- 「複数モデルを使い分ける」運用に抵抗がない情シス体制
失敗条件・適用しないケース
- 「とりあえず国産LLMにすれば安心」と、用途設計をスキップする
- 1モデルで全業務をカバーしようとする(モデル特性を活かせない)
- ベンチマークスコアだけ見て、自社業務でのPoCを省略する
- オープンウェイト公開前提なのに、リリース時期・利用条件を確認しないまま導入計画を組む
「国産LLMが出たから、これで海外モデル依存から抜けられる」わけではありません。
業務の用途整理→必要精度・コスト感の言語化→複数モデルでのPoC→用途別の使い分けルール策定、という4ステップを踏んで、ようやく「国産LLMを選択肢として持つ」意味が出てきます。
特に「Rakuten AI 3.0」はオープンウェイト公開が2026年春予定なので、それまでは「いつ・どう試すか」を準備しておくフェーズです。
出典・参考
市野
愛知県岡崎市でAI活用支援を手がける一人社長。 中小企業の現場でAIを実装してきた経験から、他社事例を「うちで再現するには」の視点で読み解いて発信中。
