DeepSeek-r1 вызвал бурное обсуждение в мировом сообществе благодаря своей выдающейся производительности. Однако с ростом числа пользователей и кибератаками на неизвестные территории официальные сервисы часто оказываются перегруженными. Сегодня я расскажу вам, как создать специализированный, никогда не выходящий из строя ИИ-ассистент без особых затрат.

Почему стоит выбрать частное развертывание? В чем преимущества частного развертывания? Помимо стабильности сервиса, частное развертывание дает нам полный контроль над безопасностью данных, а также позволяет свободно настраивать параметры и расширять функции по мере необходимости. Бесплатных ресурсов GPU, предоставляемых Tencent Cloud (эквивалент уровня RTX 4080, 10 000 минут в месяц, облачный сервис 16 Гб графической памяти), более чем достаточно, что позволяет нам наслаждаться плавной работой ИИ без необходимости инвестировать в оборудование. Ниже приведены подробные шаги по развертыванию:

Шаг 1: Подготовительная работа

Посетите Tencent Cloud Studio

чтобы завершить регистрацию и проверку реального имени. Этот шаг очень важен, поскольку только пользователи с реальными именами могут получать бесплатные ресурсы GPU.

Вы также можете выбрать ресурсы, предоставляемые другими поставщиками облачных услуг. В этой статье в качестве примера используется Tencent Cloud. Бесплатные ресурсы GPU теперь доступны

Шаг 2: Создайте рабочее пространство

Поиск "Оллама" в интерфейсе выбора шаблона рабочего пространства и выберите базовый тип (бесплатная версия) для создания рабочего пространства. Подождите 2-5 минут, пока завершится инициализация.

Шаг 3: развертывание модели

Создайте новый терминал в рабочей области и последовательно выполните следующие команды:

Примечание: Загрузка модели занимает около 10-15 минут, в зависимости от состояния сети. После завершения загрузки вы сможете напрямую общаться с AI в терминале.

Шаг 4: Настройка проникновения в интранет

Чтобы разрешить другим устройствам доступ к вашему помощнику ИИ, необходимо настроить проникновение в интрасеть:

  1. Проверьте работающий порт Ollama
  1. Начало проникновения в интранет

Примечание: 6399 - это пример номера порта, пожалуйста, замените его в соответствии с результатами предыдущего шага.

После выполнения вы получите адрес доступа к публичной сети в формате:

Шаг 5: Настройте автоматический перезапуск (необязательно, но рекомендуется)

Для поддержания стабильной работы сервиса рекомендуется добавить скрипт автоматического перезапуска:

Шаг 6: Конфигурация

В качестве примера используется CherryStudio. Для подробного ознакомления,

  • Загрузите и установите CherryStudio
  • Добавьте новую конфигурацию модели в настройках:
    • Название модели: deepseek-r1:14b
    • Адрес сервера: введите адрес публичной сети gradio.
    • Ключ API: оставьте пустым

Советы по оптимизации производительности

Хотите, чтобы ваш ИИ-помощник отвечал быстрее? Попробуйте эти параметры оптимизации:

Часто задаваемые вопросы

Если вы столкнулись с тем, что порт занят:

Загрузка модели прервана:

Недостаточный объем памяти

Советы

  • Бесплатные экземпляры GPU будут автоматически переходить в спящий режим в 2 часа ночи каждое утро. Рекомендуется избегать этого периода времени
  • Срок действия адреса проникновения в интрасеть истекает через 72 часа. Не забывайте регулярно проверять его
  • Вы можете контролировать длину ответа, изменяя параметр -max-tokens, чтобы сбалансировать скорость и полноту.
  • Если вы обнаружили, что отклик замедляется, попробуйте перезапустить службу

На этом этапе ваш собственный ИИ-ассистент готов к работе. Он не только стабилен и надежен, но и полностью под вашим контролем. Будь то ежедневная работа, программирование или анализ данных, у вас будет способный помощник, который будет вам помогать.

Не забывайте сохранять свой адрес доступа, а если у вас возникнут вопросы по процессу развертывания, задавайте их в разделе комментариев. Желаю всем вам в новом году достичь новых высот с помощью искусственного интеллекта!

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *