「うちは機密情報を扱うから、ChatGPTのようなクラウドAIは怖くて使えない」――。中小企業の現場で、こんな声を何度も聞いてきました。生成AIの便利さは分かっていても、顧客情報や設計図、契約書を社外のサーバーに送る不安が拭えず、結局AI活用に踏み出せない。そんな企業にとって見過ごせないニュースが、2026年6月5日に飛び込んできました。
リコーが、社内(オンプレミス)で動かせる軽量な日本語AIモデルを発表したのです。しかも自社開発したベンチマークの一部では、グーグルの最新クラウドAIにほぼ並ぶ日本語の文書読解性能を示したとされています。クラウドにデータを出せない企業が、自社の中だけで高性能なAIを動かす――その選択肢が、また一段と現実味を帯びてきました。
この記事では、リコーの発表内容を一次情報で正確に整理したうえで、そもそもなぜオンプレミス(社内設置)のAIが必要な企業があるのか、リコーの商用キットと自前構築(OllamaなどのOSS)はどう違うのか、自社にはどちらが向くのかを、比較表とチェックリストで具体的に解説します。煽るためではなく、自社のAI導入の選択肢を1つ増やすための実務記事です。

リコーが発表したオンプレ向け日本語LLMとは何か
まず、何が発表されたのかを正確に押さえます。リコーは2026年6月5日、オンプレミス環境(クラウドを使わず社内に設置するサーバー)で動かすことを想定した日本語の軽量AIモデルを2つ、同時に開発したと公表しました(出典: リコー公式リリース https://jp.ricoh.com/release/2026/0605_1 )。
発表された2つのモデルは、次のとおりです。アリババクラウドが開発したオープンなAIモデル「Qwen(クウェン)」シリーズをベースに、リコーが日本語の業務文書読解に特化させた強化を施したものです。
| モデル名 | 規模 | 位置づけ |
|---|---|---|
| Qwen3.6-Ricoh-27B | 270億パラメータ(27B) | 標準モデル。読解性能を重視 |
| Qwen3.5-Ricoh-9B | 90億パラメータ(9B) | 軽量モデル。少ないGPUで運用 |
「パラメータ」とは、AIモデルの規模を示す目安だと考えてください。数が大きいほど一般に賢くなりますが、その分だけ動かすのに必要なコンピュータの性能(特にGPU)も上がります。今回リコーが標準と軽量の2種類を用意したのは、企業のIT環境に応じて選べるようにするためです。さらに、それぞれにFP16・8ビット・4ビットという量子化版(モデルを軽量化したフォーマット)も用意され、サーバーの性能に合わせて細かく選べる構成になっています。
注目は「図表を含む文書を読み解く」推論性能
今回のモデルの特徴は、単に文章を生成するだけでなく、図や表を含む企業ドキュメントを多段階で読み解く「リーズニング(推論)」性能を高めた点にあります。リコーは独自の強化学習とカリキュラム学習という手法で、決算資料や報告書のような、図表とテキストが混在した実務文書から答えを導く力を鍛えたとしています。
その評価に使われたのが、リコーが2026年5月にHugging Face(AIモデルやデータを公開するプラットフォーム)で無償公開した「JDocQA-Reasoning」という日本語の文書読解ベンチマークです。図表を含む設問1,362件で構成され、多段推論の力を測るものです。リコー公式リリースの表によると、スコアは次のようになっています。
| モデル | JDocQA-Reasoning | JDocQA |
|---|---|---|
| Qwen3.6-Ricoh-27B | 0.881 | 4.22 |
| 同 8ビット版 | 0.873 | 4.21 |
| 同 4ビット版 | 0.868 | 4.20 |
| Qwen3.5-Ricoh-9B(軽量版) | 0.782 | 4.00 |
ここで一番のポイントは、比較対象として置かれた商用クラウドAIとの近さです。リコーの公式リリースの表では、グーグルの「Gemini 3 Pro Preview」がJDocQA-Reasoningで0.880、リコーの27Bモデルが0.881と、ほぼ同等(むしろわずかに上回る)の結果が示されています。社内で動かせるモデルが、最新のクラウドAIに肩を並べる――これが今回のインパクトです。
ただし、ここは正確に受け止める必要があります。この「ほぼ同等」は、あくまでリコーが自社開発した日本語ビジネス文書読解という特定のベンチマーク上での話です。汎用的なあらゆる能力でクラウドAIと並んだという意味ではありません。また、世間でよく比較対象にされるOpenAIのGPT系モデルとの直接比較ではない点も押さえておいてください。比較相手はあくまでグーグルのGeminiです。誇張せず、「日本語の業務文書読解という土俵では、社内モデルがここまで来た」と理解するのが正確です。
提供形態は「無料のOSS」ではなくSI込みのキット
もう一つ、誤解しやすい点を先に整理しておきます。今回のモデルは、誰でもダウンロードして無料で使えるOSS(オープンソース)として単体公開されたわけではありません。リコーは、自社の「RICOH オンプレLLM スターターキット」という、導入支援(SI)まで含んだパッケージ製品にこのモデルを搭載し、リコージャパンを通じて2026年6月下旬頃から提供する形をとっています。
つまり「モデルだけが無料で配られた」のではなく、「日本語文書に強いモデル+導入の手伝い」がセットになった商用サービスだと理解してください。なお、価格や必要なGPUの具体的なスペックは、現時点(2026年6月)では公表されていません。導入を本格検討する際は、リコーへの直接の見積もり確認が前提になります。
そもそも、なぜオンプレミスAIが必要な企業があるのか
ここで一歩引いて、「なぜわざわざ社内にAIを置くのか」という根本を整理します。クラウドAIは手軽で高性能ですが、すべての企業が無条件に使えるわけではありません。オンプレミス(社内設置)を選ぶ理由は、おおむね次の3つに集約されます。
1. 機密情報を社外に出せない
最大の理由がこれです。クラウドAIにプロンプト(指示文)を送ることは、その文章を社外のサーバーに送信することと同じです。顧客の個人情報、未公開の財務データ、製品の設計図、契約書の文面――こうした情報を扱う業務では、たとえ便利でも「社外に出す」こと自体が許されない場合があります。社内に閉じたオンプレミスなら、データが自社のネットワークから一歩も外に出ません。
2. データガバナンス・内部統制の要請
金融・医療・製造・公共といった分野では、「どのデータを、誰が、どこで処理したか」を厳密に管理・記録する内部統制が求められます。クラウドAIはデータの処理場所や保存ポリシーがサービス提供側の仕様に依存するため、自社の統制ルールに完全には合わせきれないことがあります。処理のすべてを社内で完結させられるオンプレミスは、ガバナンス上の説明責任を果たしやすい構成です。
3. 業界規制・契約上の制約
取引先との契約で「データを国外に持ち出さない」「第三者のクラウドで処理しない」と定められているケースや、業界固有の規制でデータの取り扱いが厳しく制限されているケースもあります。こうした制約下では、クラウドAIの利用がそもそも選択肢から外れます。オンプレミスは、規制や契約を守りながらAIの恩恵を受けるための、現実的な解になります。
逆に言えば、これらの制約が薄い業務――一般的な調べものや社外公開前提の文章作成など――では、無理にオンプレミスを選ぶ必要はありません。手軽さと性能ではクラウドAIに分があるからです。オンプレミスはあくまで「クラウドにデータを出せない/出したくない業務」のための選択肢だと位置づけるのが健全です。クラウドAIとオンプレミスの一般的な判断軸については、ローカルAI vs クラウドAI 企業導入の判断軸2026でも詳しく整理しています。
PR
どのモデルを選ぶかの前に、自社のどの業務にAIを効かせるかの設計が成果を分けます。資料作成や業務自動化から組織への定着まで、豊富な実例で「会社としての使い方」を学べる一冊。オンプレ・クラウドの技術選定に入る前の土台づくりに向いています。
リコー商用キット vs OSS自前構築――どう違うのか
オンプレミスでAIを動かすと決めたとき、選択肢は大きく2つに分かれます。リコーのようなSI込みの商用キットを使うか、Ollamaやllama.cppといった無料のOSSツールで自前構築するかです。それぞれの違いを整理します。
まず、自前構築でよく使われるOSSツールを簡単に紹介します。これらはいずれも無料で、社内のサーバーやPCでAIモデルを動かすための道具です。
・Ollama: ローカルでLLMを手軽に動かせるツール。コマンド1つでモデルを起動でき、検証や小規模利用に向く
・llama.cpp: 軽量な推論エンジン。CPUでも動き、Ollamaなどの土台にもなっている
・vLLM: 多数の同時アクセスをさばける高速な推論サーバー。本番の社内運用向け
これらに、Qwen(リコー版のベースでもあります)やLlama、gpt-ossといったオープンなAIモデルを組み合わせれば、無料で社内AI環境を構築できます。ただし「無料」はソフトの利用料の話であり、構築や運用の手間、サーバー(GPU)の費用は別途かかる点に注意が必要です。両者の違いを表で整理します。
| 比較項目 | リコー商用キット | OSS自前構築(Ollama等) |
|---|---|---|
| 初期費用 | 有償(価格は未公表・要見積もり) | ソフトは無料(GPU等のハード費用は別途) |
| 日本語業務文書への最適化 | 図表読解・多段推論を専用にチューニング済み | 自社でモデル選定・追加学習が必要 |
| 導入の手間 | SI(導入支援)込みで負担が小さい | モデル選定・GPUサイジング・構築を自社負担 |
| 運用・保守 | ベンダーのサポートを受けられる | 自社で監視・更新・トラブル対応 |
| カスタマイズの自由度 | キットの仕様の範囲内 | 高い(モデル差し替え・調整が自由) |
| 必要な社内スキル | 低め(ベンダーが伴走) | 高め(インフラ・AIの知見が必要) |
| 向いている企業 | 専任IT人材が薄く、早く確実に始めたい | 技術者がいて、コストと自由度を重視する |
大まかに言えば、リコーの商用キットは「お金で時間と確実性を買う」選択、OSS自前構築は「手間とスキルでコストを抑える」選択です。どちらが優れているという話ではなく、自社の人材・予算・要求精度のバランスで決まります。
OSSなら「すべて自由・無料」ではない点に注意
自前構築を検討する際、一つ落とし穴があります。OSSのAIモデルは、すべてが完全に自由に使えるわけではないという点です。ライセンス(利用条件)はモデルごとに異なります。
・Apache 2.0系(Qwen、gpt-oss等): 商用利用も含め比較的自由
・独自ライセンス系(Llama、Gemma等): 商用可だが、利用規模などに条件が付くことがある
「OSSだから何でも無料で商用OK」と早合点せず、使うモデルのライセンスを必ず個別に確認してください。日本語特化のモデル(ELYZAやSwallowなど)は、派生元のライセンス条件を引き継ぐものが多く、商用利用時は特に注意が必要です。この「ライセンス確認の手間」も、自前構築のコストの一部だと考えておくのが現実的です。
自社に向くのはどちらか――判断チェックリスト
では、自社にとってリコーの商用キットとOSS自前構築のどちらが向くのか。以下のチェックリストで、自社の状況を点検してみてください。「はい」が多いほど、その選択肢が向いています。
リコー商用キットが向いている企業
・専任IT人材: AIインフラを構築・運用できる専任の技術者が社内にいない
・導入スピード: 検証に時間をかけるより、早く確実に業務で使い始めたい
・日本語文書: 決算資料・報告書など、図表混じりの日本語文書の読解が主用途
・サポート重視: トラブル時にベンダーの支援を受けられる体制が欲しい
・予算確保: 初期費用を投じてでも、確実な導入と運用の安心を優先したい
OSS自前構築が向いている企業
・技術者の存在: サーバー構築やAIに知見のあるエンジニアが社内にいる
・コスト最優先: ソフト費用を抑え、ハード投資の範囲で完結させたい
・自由度: 使うモデルを自由に選び、自社用に細かく調整したい
・段階導入: まず小規模に検証し、効果を見ながら広げる進め方をしたい
・学習意欲: 社内にAI運用のノウハウを蓄積していきたい
判断に迷ったら、まずはOllamaなどのOSSで小さくPoC(試験導入)を行い、自社の業務でどこまで使えるかの感触をつかむのが堅実です。そのうえで「精度や運用負荷を考えると、商用キットの方が結果的に安い」と判断できれば、リコーのようなパッケージに切り替える――この順番なら、最初から大きく投資して失敗するリスクを避けられます。
Before / After ――オンプレミスAIで業務はどう変わるか
抽象論で終わらせないために、クラウドAIを使えずにいた中小企業(社員50名・士業や製造業を想定)が、オンプレミスAIを導入した場合の典型的な変化を整理します。数字や状況は説明のための想定ですが、現場の感覚に近いはずです。
| 業務 | Before(AI活用できず) | After(オンプレミスAI導入) |
|---|---|---|
| 契約書チェック | 機密ゆえクラウドAI不可。担当者が全文を手作業で確認 | 社内AIに要点抽出を任せ、人は最終判断に集中 |
| 社内文書の検索 | 過去資料の在りかが分からず、探すだけで数十分 | 社内AIに質問し、図表入り資料からも該当箇所を提示 |
| 報告書の要約 | 長い報告書を毎回読み込み、要約も手書き | 図表を含む文書をAIが多段推論で要約 |
| 情報漏洩リスク | クラウド利用を禁止し、AI活用そのものを断念 | データが社外に出ないため、安心して全社展開 |
| AIへの心理的ハードル | 「機密だから無理」で議論が止まる | 「社内で完結するなら」と現場が前向きに |
ポイントは、オンプレミスAIの価値が「最新の万能AIを手に入れること」ではない点です。本質は、これまで機密性を理由にAI活用をあきらめていた業務に、ようやく着手できるようになることです。クラウドAIを使える企業との「AI活用の差」を、規制の壁を越えて埋める――そこにオンプレミスの意味があります。
導入前に押さえておきたい3つの注意点
オンプレミスAIは万能ではありません。導入を検討する前に、現実的な注意点を3つ挙げておきます。
まず、ハードウェアの初期投資です。高性能なモデルを快適に動かすには、相応のGPUを積んだサーバーが必要になります。クラウドのように「使った分だけ」ではなく、最初にまとまった設備投資が発生する点は織り込んでおく必要があります。リコーのキットでも必要スペックや価格は未公表のため、見積もり確認は必須です。
次に、性能の割り切りです。今回リコーが示した「クラウドAIにほぼ同等」は、あくまで日本語ビジネス文書読解という特定の土俵での話でした。最新のクラウドAIが持つ最先端の汎用性能や、頻繁なアップデートのすべてを社内モデルが代替できるわけではありません。「機密業務はオンプレミス、公開前提の一般業務はクラウド」と使い分けるハイブリッド構成が、多くの企業にとって現実的です。
最後に、運用体制です。社内にAIを置くということは、その更新・監視・トラブル対応を自社(または委託先)が担うということです。OSS自前構築なら特にこの負荷が大きくなります。導入して終わりではなく、運用し続ける体制まで含めて検討してください。
PR
AI白書 2025 生成AIエディション(東京大学 松尾・岩澤研究室 協力)
オンプレミスかクラウドかの判断には、生成AIの技術動向と法的・ガバナンス論点を俯瞰する視点が欠かせません。手法・モデルから国内外の規制・著作権まで、社内のAI方針を決める担当者が手元に置いておきたい一冊です。
よくある質問(FAQ)
Q1. リコーのモデルは、ChatGPT(GPT-4)より性能が高いのですか?
そうとは言えません。リコーが比較対象として公表したのは、グーグルの「Gemini 3 Pro Preview」であり、OpenAIのGPT系との直接比較ではありません。また「ほぼ同等」とされたのは、リコー自社開発の日本語ビジネス文書読解ベンチマーク上での話です。汎用的なあらゆる能力で上回ったという意味ではない点に注意してください。
Q2. このモデルは無料でダウンロードして使えるのですか?
いいえ。誰でも使える無料のOSSとして単体公開されたわけではありません。リコーの「RICOH オンプレLLM スターターキット」という導入支援込みの有償パッケージに搭載され、2026年6月下旬頃から提供される形です。価格は現時点で未公表です。
Q3. オンプレミスAIは、どんな企業に必要なのですか?
機密情報を社外に出せない、データガバナンスを厳密に求められる、業界規制や契約でクラウド利用が制限される――こうした事情でクラウドAIを使えない企業に向いています。逆に、これらの制約が薄い業務では、手軽なクラウドAIで十分なことが多いです。
Q4. OllamaなどのOSSで自前構築すれば、すべて無料で済みますか?
ソフト自体は無料ですが、動かすためのGPUサーバーの費用、構築・運用の人件費はかかります。また、使うモデルのライセンス確認も必要です。「ソフトが無料」と「導入が無料」は別物だと考えてください。
Q5. 軽量版(9Bモデル)でも実用になりますか?
用途次第です。リコーの公表値では、軽量版のJDocQA-Reasoningスコアは標準版より下がります。少ないGPUで動かせる利点があるため、まず軽量版で試し、精度が足りなければ標準版を検討する、という段階的な進め方が現実的です。
Q6. クラウドAIとオンプレミスAIは、どちらか一方に決めるべきですか?
必ずしも一方に絞る必要はありません。機密業務はオンプレミス、社外公開前提の一般業務はクラウドAI、というハイブリッド構成をとる企業が多くあります。データの機密度で使い分けるのが、性能とコストの両面で現実的です。
Q7. 中小企業がまず最初にやるべきことは何ですか?
自社の業務を「クラウドに出せる情報」と「出せない機密情報」に仕分けることです。この棚卸しをしないと、そもそもオンプレミスが必要かどうかが判断できません。仕分けたうえで、機密業務の量が多ければオンプレミスの検討に進む、という順番が堅実です。
Q8. 導入にはどれくらいの期間がかかりますか?
構成によって大きく異なります。リコーのようなSI込みキットはベンダーが伴走するぶん立ち上げが早めですが、OSS自前構築は検証から本番までに相応の期間を要します。いずれにせよ、まず小規模なPoCで感触をつかんでから本格導入に進むのが安全です。

本記事のまとめ
リコーが2026年6月5日に発表したオンプレミス向け日本語LLMは、自社開発のベンチマーク上でグーグルのGemini 3 Pro Previewにほぼ並ぶ文書読解性能を示し、図表を含む日本語業務文書の読解を強みとしています。標準版(27B)と軽量版(9B)、量子化版を揃え、SI込みの「RICOH オンプレLLM スターターキット」として6月下旬頃から提供されます。ただし価格・必要スペックは未公表で、無料OSSではない点に注意が必要です。
このニュースの本当の意味は、「機密情報があるからAIは無理」とあきらめていた企業に、現実的な選択肢が増えたことにあります。クラウドにデータを出せない企業は、リコーのような商用キットで早く確実に始めるか、OllamaなどのOSSで自社のスキルとコストに合わせて構築するか――自社の人材・予算・要求精度を見極めて選べばよいのです。まずは自社の業務を機密度で仕分け、小さく試すことから始めてみてください。
