ИИ-модель DeepSeek R1 обучена за $294 тыс. — в 340 раз дешевле ChatGPT



Компания DeepSeek раскрыла детали бюджета на обучение своей флагманской модели R1: всего $294 тысячи на тонкую настройку (fine-tuning) для задач логики, математики и программирования! Для сравнения: глава OpenAI Сэм Альтман ещё в 2023 году оценивал стоимость обучения базовой версии ChatGPT свыше $100 миллионов. Разница в 340 раз показывает, как китайский стартап переписывает правила игры в области ИИ.

Базовая модель всё же стоила дороже — $6 миллионов, но и это на порядок меньше аналогов. DeepSeek использовала всего 512 ускорителей Nvidia H800 (несмотря на запрет поставок таких чипов в Китай с 2023 года) и применила инновационные методы сжатия данных, а вместо гигантских параметров — точная настройка под конкретные задачи. Модель показывает SOTA-результаты в логике и коде, не пытаясь быть универсальной.

DeepSeek уже работает над R2 — ещё более эффективной архитектурой. Их успех может заставить Google, OpenAI и Meta пересмотреть свои затратные подходы к обучению ИИ. Ведь если можно добиться многого с малым — зачем платить больше?

15:54 20.09.2025 | Просмотры: 30