DeepSeek – китайская альтернатива ChatGPT взорвала МИР

DeepSeek — китайская компания, специализирующаяся на разработке искусственного интеллекта, а также семейство больших языковых моделей. Компания базируется в Ханчжоу, основана и поддерживается китайским хедж-фондом High-Flyer. DeepSeek выпустила свои модели с открытым исходным кодом. Версия DeepSeek-V3 считается сравнимой с другими языковыми моделями в 2024 году, такими как Qwen и ChatGPT. Выход модели DeepSeek-R1 в январе 2025 года вызвал резкое снижение курсов акций мировых технологических компаний и дискуссии о переоценке инвестиций в ИИ.

DeepSeek — что это простыми словами?

DeepSeek — новая нейросеть, которая может составить конкуренцию ChatGPT и уже повлияла на рынок криптовалют. Экстренно, вместе с экспертами, разбираемся, что это за проект и как он работает.

DeepSeek — китайская компания, специализирующаяся на разработке моделей искусственного интеллекта и составляющая конкуренцию OpenAI и GPT.

Как появился DeepSeek ?

В 2015 году три инженера из Чжэцзянского университета основали компанию High-Flyer. Она использовала машинное обучение для торговли акциями. В 2019 году создана компания High-Flyer AI, которая занималась исследованиями алгоритмов искусственного интеллекта. К 2021 году все стратегии High-Flyer использовали ИИ, её сравнивали с Renaissance Technologies. В апреле 2023 года High-Flyer объявила о новом проекте для исследования общего искусственного интеллекта. Он не будет использоваться для торговли акциями и отделится от финансового бизнеса High-Flyer. В мае 2023 года компания была запущена под названием DeepSeek, её возглавил один из сооснователей хедж-фонда High-Flyer Лян Вэньфэн. Разработка DeepSeek финансируется High-Flyer.

Запуск первой версии нейросети DeepSeek

Выпуск DeepSeek-V2 в мае 2024 года спровоцировал ценовую войну моделей искусственного интеллекта в Китае, так как предлагалась высокая производительность по низкой цене. Её окрестили «Pinduoduo ИИ», а другим крупным технологическим гигантам, таким как ByteDance, Tencent, Baidu и Alibaba, пришлось начать снижать цены на свои модели ИИ. Несмотря на низкую цену DeepSeek, компания отчиталась о прибыли по сравнению с конкурентами, которые, по-видимому, несли убытки.

Прорыв на рынке ИИ

В январе 2025 года компания представила модель DeepSeek-R1, которая произвела фурор на мировом рынке искусственного интеллекта. За один день китайская языковая модель DeepSeek-R1 смогла стать одним из самых популярных приложений в мире, обвалить акции Nvidia на $600 млрд и стать конкурентом ChatGPT. «Газета.Ru» протестировала нейросеть, чтобы ответить, почему все заговорили о DeepSeek, что она умеет, чем удивляет и как ей пользоваться в России.

DeepSeek-R1 уже показывает впечатляющие результаты, поскольку настроена методом обучения с подкреплением (RL), имитирующем сам процесс на основе принимаемых решений и ошибок:

  • AIME 2024: 71% точности (86,7% с методом majority voting);
  • MATH-500: 97,3%;
  • Codeforces: 96,3%;
  • MMLU: 90,8%.

Эти результаты ставят её в один ряд с лучшими моделями OpenAI. В качестве теста я дал моделям от OpenAI o1 и DeepSeek-R1 решить последнюю задачу с демо-версии ЕГЭ 2024 года по профильной математике. Обе модели справились, однако DeepSeek потребовалось 2 минуты и 18 секунд, тогда как OpenAI o1 справилась за 8 минут и 22 секунды. Решение задачи скрыто в рассуждениях.

Для отправки комментария вам необходимо авторизоваться. Вы можете:

Популярные статьи: