как запустить deepseek r1 локально

DeepSeek-r1 вызвал бурное обсуждение в мировом сообществе благодаря своей выдающейся производительности. Однако с ростом числа пользователей и кибератаками на неизвестные территории официальные сервисы часто оказываются перегруженными. Сегодня я расскажу вам, как создать специализированный, никогда не выходящий из строя ИИ-ассистент без особых затрат.

Почему стоит выбрать частное развертывание? В чем преимущества частного развертывания? Помимо стабильности сервиса, частное развертывание дает нам полный контроль над безопасностью данных, а также позволяет свободно настраивать параметры и расширять функции по мере необходимости. Бесплатных ресурсов GPU, предоставляемых Tencent Cloud (эквивалент уровня RTX 4080, 10 000 минут в месяц, облачный сервис 16 Гб графической памяти), более чем достаточно, что позволяет нам наслаждаться плавной работой ИИ без необходимости инвестировать в оборудование. Ниже приведены подробные шаги по развертыванию:

Оглавление

Шаг 1: Подготовительная работа

Посетите Tencent Cloud Studio

чтобы завершить регистрацию и проверку реального имени. Этот шаг очень важен, поскольку только пользователи с реальными именами могут получать бесплатные ресурсы GPU.

Вы также можете выбрать ресурсы, предоставляемые другими поставщиками облачных услуг. В этой статье в качестве примера используется Tencent Cloud. Бесплатные ресурсы GPU теперь доступны

Шаг 2: Создайте рабочее пространство

Поиск "Оллама" в интерфейсе выбора шаблона рабочего пространства и выберите базовый тип (бесплатная версия) для создания рабочего пространства. Подождите 2-5 минут, пока завершится инициализация.

Шаг 3: развертывание модели

Создайте новый терминал в рабочей области и последовательно выполните следующие команды:

Примечание: Загрузка модели занимает около 10-15 минут, в зависимости от состояния сети. После завершения загрузки вы сможете напрямую общаться с AI в терминале.

Шаг 4: Настройка проникновения в интранет

Чтобы разрешить другим устройствам доступ к вашему помощнику ИИ, необходимо настроить проникновение в интрасеть:

Проверьте работающий порт Ollama

Начало проникновения в интранет

Примечание: 6399 - это пример номера порта, пожалуйста, замените его в соответствии с результатами предыдущего шага.

После выполнения вы получите адрес доступа к публичной сети в формате:

Шаг 5: Настройте автоматический перезапуск (необязательно, но рекомендуется)

Для поддержания стабильной работы сервиса рекомендуется добавить скрипт автоматического перезапуска:

Шаг 6: Конфигурация

В качестве примера используется CherryStudio. Для подробного ознакомления,

Загрузите и установите CherryStudio
Добавьте новую конфигурацию модели в настройках:
- Название модели: deepseek-r1:14b
- Адрес сервера: введите адрес публичной сети gradio.
- Ключ API: оставьте пустым

Советы по оптимизации производительности

Хотите, чтобы ваш ИИ-помощник отвечал быстрее? Попробуйте эти параметры оптимизации:

Часто задаваемые вопросы

Если вы столкнулись с тем, что порт занят:

Загрузка модели прервана:

Недостаточный объем памяти

Советы

Бесплатные экземпляры GPU будут автоматически переходить в спящий режим в 2 часа ночи каждое утро. Рекомендуется избегать этого периода времени
Срок действия адреса проникновения в интрасеть истекает через 72 часа. Не забывайте регулярно проверять его
Вы можете контролировать длину ответа, изменяя параметр -max-tokens, чтобы сбалансировать скорость и полноту.
Если вы обнаружили, что отклик замедляется, попробуйте перезапустить службу

На этом этапе ваш собственный ИИ-ассистент готов к работе. Он не только стабилен и надежен, но и полностью под вашим контролем. Будь то ежедневная работа, программирование или анализ данных, у вас будет способный помощник, который будет вам помогать.

Не забывайте сохранять свой адрес доступа, а если у вас возникнут вопросы по процессу развертывания, задавайте их в разделе комментариев. Желаю всем вам в новом году достичь новых высот с помощью искусственного интеллекта!

Без категории

Взрыв! Подарок DeepSeek на китайский Новый год - подробное объяснение мультимодальной модели Janus-Pro

Авторянус-ай 28 января 2025 г.28 января 2025 г.

Взрыв! Подарок DeepSeek к китайскому Новому году - подробное объяснение мультимодальной модели Janus-Pro Новейшая модель Janus-Pro от DeepSeek напрямую соединяет "левый и правый мозг" мультимодального ИИ! Этот двуликий убийца, способный одновременно понимать изображения и тексты и генерировать изображения, переписывает правила индустрии с помощью самостоятельно разработанной структуры. Это не...

Без категории

Выпущено поздно ночью! DeepSeek переосмысливает создание и понимание изображений с помощью искусственного интеллекта: дебютирует революционная комплексная модель Janus-Pro!

Авторwd.gstar@gmail.com 28 января 2025 г.28 января 2025 г.

Ключевые моменты🔹 Унифицированная архитектура трансформатора: Единая модель управляет как пониманием, так и генерацией изображений, устраняя необходимость в отдельных системах.🔹 Масштабируемость и открытый исходный код: Доступны версии с параметрами 1B и 7B (с лицензией MIT), оптимизированные для различных приложений и коммерческого использования.🔹 Современная производительность: Превосходит OpenAI's DALL-E 3 и Stable Diffusion в таких бенчмарках, как GenEval и DPG-Bench.🔹 Упрощенное развертывание: Оптимизированная архитектура снижает затраты на обучение/инференцию, сохраняя гибкость. Связи между моделями...

Без категории

Полное объяснение: от DeepSeek Janus до Janus-Pro!

Авторянус-ай 30 января 2025 года30 января 2025 года

Главный вывод: Janus - это простая, унифицированная и расширяемая модель мультимодального понимания и генерации, которая разделяет мультимодальное понимание и генерируемое визуальное кодирование, смягчая потенциальные конфликты между этими двумя задачами. В будущем она может быть расширена для включения дополнительных модальностей ввода. Janus-Pro опирается на этот фундамент, оптимизируя стратегию обучения (включая увеличение...

Без категории

Глубокий анализ: Какие новшества есть в недавно выпущенном Janus-Pro от DeepSeek?

Авторянус-ай 4 февраля 2025 года4 февраля 2025 года

Компания DeepSeek обновила свой сайт. В канун Нового года DeepSeek неожиданно объявила на GitHub, что в пространстве проекта Janus открыты исходные данные модели Janus-Pro и технический отчет. Для начала отметим несколько ключевых моментов: Модель призвана решить сложную для индустрии проблему: сбалансировать мультимодальное понимание и генерацию изображений Согласно...

Без категории

Насколько хорош Janus-Pro от DeepSeek?

Авторянус-ай 4 февраля 2025 года4 февраля 2025 года

В преддверии Весеннего фестиваля была выпущена модель DeepSeek-R1. Благодаря своей чистой RL-архитектуре она переняла великие инновации CoT и превзошла ChatGPT в математике, коде и логических рассуждениях. Кроме того, открытые веса модели, низкая стоимость обучения и дешевые цены на API сделали DeepSeek хитом во всем интернете, даже...

Без категории

Курсор поддерживает DeepSeek R1, а в новых версиях обновляется множество функций

Авторянус-ай 29 января 2025 г.29 января 2025 г.

В настоящее время существует слишком много инструментов для программирования ИИ: Windsurf, Trae (The Real AI Engineer), Cursor и Copilot. Среди них Cursor - самый продвинутый и самый дорогой. Я уже заплатил за Cursor и всегда обращаю внимание на новейшие функции, чтобы получить лучшее соотношение цены и качества за свои деньги. С появлением...

как запустить deepseek r1 локально

Шаг 1: Подготовительная работа

Шаг 2: Создайте рабочее пространство

Шаг 3: развертывание модели

Шаг 4: Настройка проникновения в интранет

Шаг 5: Настройте автоматический перезапуск (необязательно, но рекомендуется)

Шаг 6: Конфигурация

Советы по оптимизации производительности

Взрыв! Подарок DeepSeek на китайский Новый год - подробное объяснение мультимодальной модели Janus-Pro

Полное объяснение: от DeepSeek Janus до Janus-Pro!

Глубокий анализ: Какие новшества есть в недавно выпущенном Janus-Pro от DeepSeek?

Насколько хорош Janus-Pro от DeepSeek?

Курсор поддерживает DeepSeek R1, а в новых версиях обновляется множество функций

Добавить комментарий Отменить ответ

Ресурсы

Друзья

Шаг 1: Подготовительная работа

Шаг 2: Создайте рабочее пространство

Шаг 3: развертывание модели

Шаг 4: Настройка проникновения в интранет

Шаг 5: Настройте автоматический перезапуск (необязательно, но рекомендуется)

Шаг 6: Конфигурация

Советы по оптимизации производительности

Похожие записи

Добавить комментарий Отменить ответ

Ресурсы

Друзья