AMDは8月9日、推論に特化したオープンな言語モデル「Instella-Math」を発表した。同社が3月に発表した30億パラメータのオープンモデル「Instella-3B-Instruct」をベースに、5段階のトレーニングを通じて機能を拡張したモデルとなる。 Instella-Mathは、30億パラメータを ...
中国のAI研究チームが数学特化の大規模言語モデル「Qwen2-Math」を公開しました。Qwen2-MathはGPT-4oやGemini-1.5-Proなどのクローズドソースの大規模言語モデルをしのぐ数学性能を備えています。 QwenLM/Qwen2-Math: A series of math-specific large language models of our Qwen2 series.
AMDが、AMDのGPUのみでトレーニングしたという言語モデル「Instella-Math」を発表しました。パラメーター数は30億で、推論や数学的問題解決等に特化しているとのことです。 Introducing Instella-Math: Fully Open Language Model with Reasoning Capability — ROCm Blogs ...
「Qwen2」を聞いたことがない人もいるかもしれないが、今日から状況が変わるだろう。ソフトウェア開発、エンジニアリング、そして世界中の STEM 分野において非常に重要な科目である数学に関して、他のすべてを凌駕する驚くべき新リリースが登場した。