Корпорация Microsoft объявила о запуске своей самой маленькой модели (SLM) искусственного интеллекта (ИИ). Об этом сообщает издание The Verge.
Представленная Phi-3 Mini базируется на 3,8 миллиарда параметров. Она обучалась на меньшем наборе данных по сравнению с большими языковыми моделями (LLM), такими как GPT-4. Модель будет доступна для пользователей сервисов Azure, Hugging Face и Ollama.
Специалисты компании заявили, что Phi-3 работает заметно лучше предыдущей версии модели. Также она очень эффективна: Phi-3 может давать такие же ответы, что и модели, имеющие примерно в 10 раз больше параметров. По словам представителя корпорации Эрика Бойда, новая модель по своим возможностям не уступает LLM типа GPT-3.5, однако имеет «меньший форм-фактор».
Бойд также рассказал, что разработчики обучали Phi-3 по «учебной программе». Специалистов вдохновило то, как дети получают знания с помощью сказок на ночь — книг с более простыми словами и структурой предложений. «Детских книг не хватало, поэтому мы взяли список из более чем трех тысяч слов и попросили инженеров написать нам "сказки на ночь"», — заключил Бойд.
В декабре 2023 года Microsoft представила модель Phi-2, также в ближайшее время корпорация планирует выпустить модели Phi-3 Small и Phi-3 Medium.
Ранее стало известно, что в октябре прошлого года корпорация Microsoft предлагала американским военным использовать нейросеть DALL-E в качестве боевого инструмента. Специалисты отмечали, что нейросеть можно применять при создании изображений для обучения систем управления боем.