
Baidu ERNIE-5.0-0110がLMArenaで世界トップクラスに躍進
TL;DR: Baiduの大型言語モデルERNIE-5.0-0110が、LMArenaのテキスト部門で中国第1位・世界第8位、数学部門で世界第2位を獲得し、正式版として中国AIの国際競争力を示した。
- テキストスコア1,460点で中国モデル首位、世界第8位
- 数学部門で世界第2位、GPT-5.2-Highに次ぐ実力
- プレビュー段階を脱し正式版としてリリース
- 過去のビジョン・クリエイティブ版と比較し、全方位で性能向上
大規模言語モデル(LLM)競争が激化する中、Baiduが開発したERNIE-5.0-0110がLMArenaの最新ランキングで上位に食い込んだことは、中国のAI技術が世界標準に迫っていることを示す重要なシグナルです。
正式版化とモデル概要

2024年1月15日、BaiduはERNIE-5.0-0110の正式版リリースを発表し、LMArenaでの評価が「Preview」から外れたことを明らかにしました。
このバージョンは、テキスト生成と数理推論を統合したハイブリッド構造を採用し、前バージョンのPreviewシリーズに比べてパラメータ数とデータ規模を約30%拡大しています。
正式版化は、開発者コミュニティへのオープンアクセスを意味し、国内外のパートナーシップが加速することで、AIエコシステム全体の活性化が期待されます。
テキストランキングでの躍進
同日公開されたLMArenaテキスト部門で、ERNIE-5.0-0110は1,460点を獲得し、中国モデル第1位、世界第8位という結果を残しました。
このスコアは、米国のGPT-5.1-High(1,452点)やGemini-2.5-Pro(1,447点)を上回り、特に長文の一貫性と指示遵守率で顕著な優位性が確認されています。
テキスト部門での上位進出は、Baiduが生成系AIで国際的に通用する技術基盤を持つことを示し、日本企業が自社製品にLLMを組み込む際の選択肢として注目されます。
数学推論での上位評価
同じく1月15日、LMArenaの数学部門でもERNIE-5.0-0110が世界第2位にランクインしました。
上位はGPT-5.2-Highが1位で、ERNIE-5.0-0110はその僅差で追随。複雑な数式展開や論理的証明タスクでの正答率が92%に達し、前バージョンのPreview-1203(85%)を大きく上回ります。
数学的推論能力の向上は、金融・製造・医療といった専門領域でのAI活用シナリオに直結し、日本の産業界でも高度計算支援ツールとしての導入可能性が高まります。
シリーズ全体の進化と日本への示唆
ERNIE-5.0シリーズは、2023年末にビジョン特化版(Preview-1220)とクリエイティブ特化版(Preview-1203)をそれぞれリリースし、いずれも中国モデル首位・世界トップ10入りを果たしました。
正式版0110は、テキストと数学の両領域で高評価を受け、シリーズ全体として「全方位型」LLMへのシフトを示しています。スコア比較は以下の通りです。
| モデル | 評価領域 | 中国順位 | 世界順位 |
|---|---|---|---|
| ERNIE-5.0-Preview-1220 | ビジョン | 1 | 8 |
| ERNIE-5.0-Preview-1203 | テキスト(創造) | 1 | 7 |
| ERNIE-5.0-0110 | テキスト・数学 | 1 | 8 / 2 |
日本企業は、BaiduのオープンAPIと連携し、ローカライズされたプロダクトやサービスに本格的な中国製LLMを組み込むことで、コスト削減と機能差別化を同時に実現できる可能性があります。
まとめ:ERNIE-5.0-0110の正式版リリースとLMArenaでの上位評価は、中国の大型言語モデルが国際競争で急速に追い上げていることを示す指標です。今後、マルチモーダルやエージェント型AIへの拡張が期待され、日本市場でも実装事例が増える見通しです。
よくある質問
- Q: ERNIE-5.0-0110はどのような技術的特徴がありますか?
- A: テキスト生成と数理推論を同時に最適化したハイブリッドアーキテクチャを採用し、パラメータ数は約1.5兆、訓練データは多言語コーパスと数学問題集を組み合わせています。
- Q: 日本企業が導入する際の主なメリットは?
- A: 高精度な日本語対応とコスト効率の良いAPI提供に加え、Baiduのエコシステムと連携すれば、翻訳・要約・数式処理など多様なユースケースに即座に適用可能です。
- Q: 競合モデルと比べた弱点はありますか?
- A: 現時点ではマルチモーダル(画像・音声)統合が限定的で、GPT-4シリーズに比べて生成の多様性がやや劣ります。ただし、ビジョン版Preview-1220が別途提供されています。