как запустить deepseek r1 локально

DeepSeek-r1 вызвал бурное обсуждение в мировом сообществе благодаря своей выдающейся производительности. Однако с ростом числа пользователей и кибератаками на неизвестные территории официальные сервисы часто оказываются перегруженными. Сегодня я расскажу вам, как создать специализированный, никогда не выходящий из строя ИИ-ассистент без особых затрат.

Почему стоит выбрать частное развертывание? В чем преимущества частного развертывания? Помимо стабильности сервиса, частное развертывание дает нам полный контроль над безопасностью данных, а также позволяет свободно настраивать параметры и расширять функции по мере необходимости. Бесплатных ресурсов GPU, предоставляемых Tencent Cloud (эквивалент уровня RTX 4080, 10 000 минут в месяц, облачный сервис 16 Гб графической памяти), более чем достаточно, что позволяет нам наслаждаться плавной работой ИИ без необходимости инвестировать в оборудование. Ниже приведены подробные шаги по развертыванию:

Оглавление

Шаг 1: Подготовительная работа

Посетите Tencent Cloud Studio

чтобы завершить регистрацию и проверку реального имени. Этот шаг очень важен, поскольку только пользователи с реальными именами могут получать бесплатные ресурсы GPU.

Вы также можете выбрать ресурсы, предоставляемые другими поставщиками облачных услуг. В этой статье в качестве примера используется Tencent Cloud. Бесплатные ресурсы GPU теперь доступны

Шаг 2: Создайте рабочее пространство

Поиск "Оллама" в интерфейсе выбора шаблона рабочего пространства и выберите базовый тип (бесплатная версия) для создания рабочего пространства. Подождите 2-5 минут, пока завершится инициализация.

Шаг 3: развертывание модели

Создайте новый терминал в рабочей области и последовательно выполните следующие команды:

Примечание: Загрузка модели занимает около 10-15 минут, в зависимости от состояния сети. После завершения загрузки вы сможете напрямую общаться с AI в терминале.

Шаг 4: Настройка проникновения в интранет

Чтобы разрешить другим устройствам доступ к вашему помощнику ИИ, необходимо настроить проникновение в интрасеть:

Проверьте работающий порт Ollama

Начало проникновения в интранет

Примечание: 6399 - это пример номера порта, пожалуйста, замените его в соответствии с результатами предыдущего шага.

После выполнения вы получите адрес доступа к публичной сети в формате:

Шаг 5: Настройте автоматический перезапуск (необязательно, но рекомендуется)

Для поддержания стабильной работы сервиса рекомендуется добавить скрипт автоматического перезапуска:

Шаг 6: Конфигурация

В качестве примера используется CherryStudio. Для подробного ознакомления,

Загрузите и установите CherryStudio
Добавьте новую конфигурацию модели в настройках:
- Название модели: deepseek-r1:14b
- Адрес сервера: введите адрес публичной сети gradio.
- Ключ API: оставьте пустым

Советы по оптимизации производительности

Хотите, чтобы ваш ИИ-помощник отвечал быстрее? Попробуйте эти параметры оптимизации:

Часто задаваемые вопросы

Если вы столкнулись с тем, что порт занят:

Загрузка модели прервана:

Недостаточный объем памяти

Советы

Бесплатные экземпляры GPU будут автоматически переходить в спящий режим в 2 часа ночи каждое утро. Рекомендуется избегать этого периода времени
Срок действия адреса проникновения в интрасеть истекает через 72 часа. Не забывайте регулярно проверять его
Вы можете контролировать длину ответа, изменяя параметр -max-tokens, чтобы сбалансировать скорость и полноту.
Если вы обнаружили, что отклик замедляется, попробуйте перезапустить службу

На этом этапе ваш собственный ИИ-ассистент готов к работе. Он не только стабилен и надежен, но и полностью под вашим контролем. Будь то ежедневная работа, программирование или анализ данных, у вас будет способный помощник, который будет вам помогать.

Не забывайте сохранять свой адрес доступа, а если у вас возникнут вопросы по процессу развертывания, задавайте их в разделе комментариев. Желаю всем вам в новом году достичь новых высот с помощью искусственного интеллекта!

Без категории

Насколько хорош Janus-Pro от DeepSeek?

Авторянус-ай 4 февраля 2025 года4 февраля 2025 года

В преддверии Весеннего фестиваля была выпущена модель DeepSeek-R1. Благодаря своей чистой RL-архитектуре она переняла великие инновации CoT и превзошла ChatGPT в математике, коде и логических рассуждениях. Кроме того, открытые веса модели, низкая стоимость обучения и дешевые цены на API сделали DeepSeek хитом во всем интернете, даже...

Без категории

Подробная информация о документе DeepSeek V3: Как обойти монополию CUDA!

Авторянус-ай 29 января 2025 г.29 января 2025 г.

Подробная информация о документе DeepSeek V3: Как обойти монополию CUDA! Две недавно выпущенные модели DeepSeek, DeepSeek-V3 и DeepSeek-R1, достигают производительности, сравнимой с аналогичными моделями от OpenAI, при гораздо меньших затратах. По сообщениям зарубежных СМИ, всего за два месяца они обучили языковую модель MoE с 671 миллиардом параметров на кластере из 2 048...

Без категории

Исчерпывающее руководство по DeepSeek, технике использования, о которой не знают 90% людей (рекомендуется добавить в закладки)

Авторянус-ай 29 января 2025 г.29 января 2025 г.

Исчерпывающее руководство по DeepSeek, технике использования, о которой не знают 90% людей (рекомендуется добавить в закладки) С тех пор как месяц назад вышла DeepSeek-V3, я постоянно обновляю статьи и видео, связанные с DeepSeek, потому что считаю ее очень удивительной компанией. И вот вчера, наконец, свершилась история: в американском магазине приложений Apple App Store появилась...

Без категории

Janus-Series: Унифицированные мультимодальные модели понимания и генерации

Авторwd.gstar@gmail.com 28 января 2025 г.28 января 2025 г.

Разблокируйте возможности ИИ нового поколения с помощью инноваций с открытым исходным кодом Серия Janus от DeepSeek представляет собой революционный скачок в области мультимодального ИИ, органично объединяя понимание изображений, генерацию текста в изображение и продвинутое языковое моделирование. Предназначенные для исследователей, разработчиков и предприятий, эти модели переопределяют гибкость и производительность в приложениях ИИ. 🚀 Последние обновления Будьте в курсе последних новинок: 🔥 Почему стоит выбрать серию Janus? 1. Janus-Pro: масштабирование мультимодальных...

Без категории

Выпущено поздно ночью! DeepSeek переосмысливает создание и понимание изображений с помощью искусственного интеллекта: дебютирует революционная комплексная модель Janus-Pro!

Авторwd.gstar@gmail.com 28 января 2025 г.28 января 2025 г.

Ключевые моменты🔹 Унифицированная архитектура трансформатора: Единая модель управляет как пониманием, так и генерацией изображений, устраняя необходимость в отдельных системах.🔹 Масштабируемость и открытый исходный код: Доступны версии с параметрами 1B и 7B (с лицензией MIT), оптимизированные для различных приложений и коммерческого использования.🔹 Современная производительность: Превосходит OpenAI's DALL-E 3 и Stable Diffusion в таких бенчмарках, как GenEval и DPG-Bench.🔹 Упрощенное развертывание: Оптимизированная архитектура снижает затраты на обучение/инференцию, сохраняя гибкость. Связи между моделями...

Без категории

Полное объяснение: от DeepSeek Janus до Janus-Pro!

Авторянус-ай 30 января 2025 года30 января 2025 года

Главный вывод: Janus - это простая, унифицированная и расширяемая модель мультимодального понимания и генерации, которая разделяет мультимодальное понимание и генерируемое визуальное кодирование, смягчая потенциальные конфликты между этими двумя задачами. В будущем она может быть расширена для включения дополнительных модальностей ввода. Janus-Pro опирается на этот фундамент, оптимизируя стратегию обучения (включая увеличение...

как запустить deepseek r1 локально

Шаг 1: Подготовительная работа

Шаг 2: Создайте рабочее пространство

Шаг 3: развертывание модели

Шаг 4: Настройка проникновения в интранет

Шаг 5: Настройте автоматический перезапуск (необязательно, но рекомендуется)

Шаг 6: Конфигурация

Советы по оптимизации производительности

Насколько хорош Janus-Pro от DeepSeek?

Подробная информация о документе DeepSeek V3: Как обойти монополию CUDA!

Исчерпывающее руководство по DeepSeek, технике использования, о которой не знают 90% людей (рекомендуется добавить в закладки)

Janus-Series: Унифицированные мультимодальные модели понимания и генерации

Полное объяснение: от DeepSeek Janus до Janus-Pro!

Добавить комментарий Отменить ответ

Ресурсы

Друзья

Шаг 1: Подготовительная работа

Шаг 2: Создайте рабочее пространство

Шаг 3: развертывание модели

Шаг 4: Настройка проникновения в интранет

Шаг 5: Настройте автоматический перезапуск (необязательно, но рекомендуется)

Шаг 6: Конфигурация

Советы по оптимизации производительности

Похожие записи

Добавить комментарий Отменить ответ

Ресурсы

Друзья