独自トレーニングシーケンスを用いて、短時間・低コストでベースモデルの特化性機能向上を達成
Axcxept株式会社は、独自研究による疑似GRPO/PPOアプローチを活用し、短時間かつ低コストで日本語LLMの性能向上を実現しました。今回、その成果をもとにしたオープンウェイトモデル「EZO2.5-gemma-3-12b-it-Preview」を公開しました。
上記プレスリリースの詳細については、こちらからご覧ください。
Axcxept株式会社は、独自研究による疑似GRPO/PPOアプローチを活用し、短時間かつ低コストで日本語LLMの性能向上を実現しました。今回、その成果をもとにしたオープンウェイトモデル「EZO2.5-gemma-3-12b-it-Preview」を公開しました。
上記プレスリリースの詳細については、こちらからご覧ください。