Автор Тема: В Китае выпустили свою альтернативу нейросети OpenAI o1  (Прочитано 147 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84112
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Китайская компания DeepSeek представила большую языковую модель, способную, по словам её создателей, соперничать с OpenAI o1-preview. Главная особенность нейросети — возможность рассуждать и поэтапно решать поставленную задачу.

Модель под названием DeepSeek-R1-Lite-Preview пока представлена в виде тестовой версии, которая «задумывается» в среднем по 20 секунд. При этом она показывает, как пришла к выданному ответу. В специализированных бенчмарках AIME 2024, MATH и Codeforces китайский ИИ обошёл o1 от OpenAI в некоторых дисциплинах.

Модель можно протестировать на официальном Просмотр ссылок доступен только зарегистрированным пользователям после регистрации с лимитом в 50 запросов на день. Исходный код и API будут доступны всем желающим в ближайшее время. Нейросеть может отвечать на русском языке, если её попросить, но цепочка рассуждений при этом всё равно будет выдана на английском.


Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84112
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Re: В Китае выпустили свою альтернативу нейросети OpenAI o1
« Ответ #1 : 22, Ноября 2024, Пятница, 08:34:20 am »
Я так понимаю, что пока основной упор на кодинг. DeepSeek умеет генерировать код на различных языках программирования, таких как Python, JavaScript, Java, C++, и других.

Вот Просмотр ссылок доступен только зарегистрированным пользователям можно прочитать про различные бенчмарки и характеристики LLM с открытым кодом. Китайцы красавцы!

DeepSeek Coder можно развернуть локально на компьютере. При этом, как заверяют китайцы:

- Предварительно обучено на 2 триллионах токенов на более чем 80 языках программирования.
- Различные размеры моделей ( 1.3B , 5.7B , 6.7B и 33B ) для удовлетворения различных требований.
- Размер окна составляет 16 КБ , что поддерживает автодополнение и заполнение кода на уровне проекта .
- Самая высокая производительность среди моделей с открытым кодом.
- Открытый исходный код и бесплатное для исследовательских целей и коммерческого использования .


Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84112
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Re: В Китае выпустили свою альтернативу нейросети OpenAI o1
« Ответ #2 : 22, Ноября 2024, Пятница, 08:48:48 am »
Кстати, китаец легко решил олимпиадную задачу, на которой я тестирую чатботы, причём очень красиво, с использованием теории графов:

Решение задачи:

Условие задачи:

- У Пetyи 28 одноклассников, всего в классе 29 учеников (включая Пety).

- У каждого из 28 одноклассников различное число друзей в классе.

Анализ:

- Каждый из 28 одноклассников имеет уникальное количество друзей в классе.

- Возможные значения числа друзей для каждого ученика: 0, 1, 2, ..., 28.

- Невозможно одновременно иметь ученика с 0 друзьями и ученика с 28 друзьями.

Логика решения:

- Сумма степеней (числа друзей) всех вершин в графе должна быть четной (по лемме о рукопожатиях).

- Исключаем одно значение степени (например, 14) для того, чтобы избежать противоречия.

- Сумма степеней для оставшихся 28 одноклассников: 406 - 14 = 392 (четная).

- Petya's степень должна быть такой, чтобы общая сумма оставалась четной. Если исключаем 14, Petya's степень также должна быть 14.

Заключение:

- Petya имеет 14 друзей в классе.

Ответ: У Пetyи 14 друзей в классе.

Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84112
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Re: В Китае выпустили свою альтернативу нейросети OpenAI o1
« Ответ #3 : 22, Ноября 2024, Пятница, 08:56:08 am »
Причём китаец использовал алгоритм Хавел-Хакими (Havel-Hakimi algorithm). Я попросил пояснить суть этого алгоритма. Ответ:

Алгоритм Хавел-Хакими используется в теории графов для определения, является ли данная последовательность степеней графической, то есть может ли она соответствовать простому графу. Алгоритм работает следующим образом:

1. Сортировка: Сортируйте последовательность степеней по убыванию.

2. Удаление и уменьшение: Удалите первый элемент (самую большую степень) и уменьшите следующие 'd' элементов на 1, где 'd' - это значение удаленного элемента.

3. Повторение: Повторяйте процесс с новой последовательностью.

4. Проверка: Если вы можете сократить последовательность до всех нулей, то она является графической; в противном случае, нет.

Пример: Пусть последовательность степеней равна [3, 3, 2, 2, 1, 1].

1. Сортировка: [3, 3, 2, 2, 1, 1]

2. Удалить 3 и уменьшить следующие 3 элемента на 1: [2, 1, 1, 1, 1]

3. Сортировка: [2, 1, 1, 1, 1]

4. Удалить 2 и уменьшить следующие 2 элемента на 1: [0, 0, 1, 1]

5. Сортировка: [1, 1, 0, 0]

6. Удалить 1 и уменьшить следующие 1 элемент на 1: [0, 0, 0]

7. Сортировка: [0, 0, 0]

Таким образом, последовательность является графической.

Дополнительные сведения:

- Лемма о рукопожатии: Сумма степеней всех вершин в графе должна быть четной.

- Применение: Алгоритм Хавел-Хакими широко используется в сетевом анализе и других областях, где применяется теория графов.

Этот алгоритм предоставляет систематический способ определения возможности построения простого графа из заданной последовательности степеней.


Оффлайн Сергей Горбачевский

  • Administrator
  • Знаменитый писатель
  • *****
  • Сообщений: 84112
  • Пол: Мужской
  • Есть вопросы? Пишите в личку
    • Награды
Re: В Китае выпустили свою альтернативу нейросети OpenAI o1
« Ответ #4 : 22, Ноября 2024, Пятница, 09:43:02 am »
Вот ещё одна Просмотр ссылок доступен только зарегистрированным пользователям про DeepSeek и математику. Это репозиторий на GitHub.


Теги: deepseek