
Microsoft розширяє сімейство малих ШІ-моделей Phi. Компанія представила три нові відкриті моделі «міркування» — Phi 4 reasoning, Phi 4 reasoning plus, Phi 4 mini reasoning. Заявляється, що найпотужніша з них може конкурувати з o3-mini від OpenAI.
Моделями «міркування» називають такі, що витрачають більше часу на перевірку фактів і пошук рішень складних завдань. Microsoft каже, що її нова трійка поєднує компактний розмір із високою продуктивністю.
«Вони достатньо малі, щоб працювати в середовищах із низькою затримкою, але при цьому зберігають потужні здібності до міркування, які можна порівняти з набагато більшими моделями. Така комбінація дозволяє навіть пристроям з обмеженими ресурсами ефективно виконувати складні завдання з міркування», — йдеться на їхньому сайті.
- Phi-4-reasoning — це модель з відкритими вагами на 14 млрд параметрів. Йдеться, що вона генерує докладні ланцюжки міркувань й ефективно використовує додаткові обчислення, коли виконує запити. Її навчали на даних моделі OpenAI o3-mini.
- Phi-4-reasoning-plus базується на можливостях Phi-4-reasoning, додатково натренована з використанням зворотного зв’язку та винагород. Вона використовує у 1,5 раза більше токенів, коли виконує задачі. Це, як заявляється, дає змогу досягти вищої точності.
- Phi-4-mini-reasoning — має близько 3,8 млрд параметрів. Це компактна модель для математичного міркування в умовах обмежених ресурсів. Її навчали на приблизно 1 млн синтетичних математичних задач, згенерованих китайською моделлю від DeepSeek R1. Йдеться, що ця вона підходить для освітніх застосунків або розгортання на мобільних пристроях.
Microsoft каже, що Phi-4-reasoning і Phi-4-reasoning-plus перевершують OpenAI o1-mini та DeepSeek-R1-Distill-Llama-70B на більшості бенчмарків, включаючи математичне міркування та запитання рівня Ph.D.
Зображення Microsoft
А також демонструє кращі результати, ніж повна модель DeepSeek-R1 із 671 млрд параметрів на тесті AIME 2025 — відбірковому етапі до Математичної олімпіади США. Обидві моделі вже доступні на Azure AI Foundry та HuggingFace.
Зображення Microsoft