DeepSeek-r1 causou uma discussão acalorada na comunidade global devido ao seu excelente desempenho. No entanto, à medida que o número de usuários aumenta e com ataques cibernéticos em algumas áreas desconhecidas, os serviços oficiais são frequentemente sobrecarregados. Hoje, ensinarei a você como criar um assistente de IA dedicado e ininterrupto a custo zero.

Por que escolher a implementação privada? Quais são os benefícios da implementação privada? Além da estabilidade do serviço, a implementação privada também nos dá controle total sobre a segurança dos dados e nos permite ajustar livremente os parâmetros e expandir as funções conforme necessário. Os recursos gratuitos de GPU fornecidos atualmente pela Tencent Cloud (equivalente ao nível RTX 4080, 10.000 minutos por mês, serviço de nuvem de memória gráfica de 16G) são mais do que suficientes, o que nos permite desfrutar de uma experiência de IA suave sem precisar investir em hardware. As etapas detalhadas da implementação são as seguintes:

Etapa 1: Trabalho preparatório

Visitar Tencent Cloud Studio

para concluir o registro e a verificação do nome real. Essa etapa é crucial, pois somente usuários com nomes reais podem receber recursos gratuitos de GPU.

Você também pode escolher recursos fornecidos por outros provedores de serviços em nuvem. Este artigo usa a Tencent Cloud como exemplo. Recursos gratuitos de GPU já estão disponíveis

Etapa 2: Criar um espaço de trabalho

Pesquisar por "Ollama" na interface de seleção do modelo de espaço de trabalho e selecione o tipo básico (versão gratuita) para criar um espaço de trabalho. Aguarde de 2 a 5 minutos para que a inicialização seja concluída.

Etapa 3: Implementação do modelo

Crie um novo terminal no espaço de trabalho e execute os seguintes comandos em sequência:

Observação: O download do modelo leva de 10 a 15 minutos, dependendo das condições da rede. Após a conclusão do download, você poderá falar diretamente com a IA no terminal.

Etapa 4: Configurar a penetração na intranet

Para permitir que outros dispositivos acessem seu assistente de IA, é necessário configurar a penetração da intranet:

  1. Verifique a porta de execução do Ollama
  1. Iniciar a penetração da intranet

Observação: 6399 é um exemplo de número de porta, substitua-o de acordo com o resultado da etapa anterior

Após a execução, você obterá um endereço de acesso à rede pública no formato:

Etapa 5: Defina a reinicialização automática (opcional, mas recomendada)

Para manter a operação estável do serviço, é recomendável adicionar um script de reinicialização automática:

Etapa 6: Configuração

O CherryStudio é usado como exemplo. Para obter uma introdução detalhada,

  • Faça o download e instale o CherryStudio
  • Adicione uma nova configuração de modelo nas configurações:
    • Nome do modelo: deepseek-r1:14b
    • Endereço do servidor: preencha o endereço da rede pública do Gradio
    • Chave de API: deixar em branco

Dicas de otimização de desempenho

Deseja que seu assistente de IA responda mais rápido? Experimente estes parâmetros de otimização:

Perguntas frequentes

Se você encontrar uma porta ocupada:

O download do modelo foi interrompido:

Memória insuficiente

Dicas

  • As instâncias de GPU gratuitas entrarão automaticamente em repouso às 2h todas as manhãs. Recomenda-se evitar esse período de tempo
  • O endereço de penetração da intranet expirará após 72 horas. Lembre-se de verificá-lo regularmente
  • Você pode controlar a duração da resposta ajustando o parâmetro -max-tokens para equilibrar a velocidade e a integridade
  • Se perceber que a resposta está ficando mais lenta, tente reiniciar o serviço

Nesse ponto, seu próprio assistente de IA está pronto para ser usado. Ele não é apenas estável e confiável, mas também está totalmente sob seu controle. Seja para escrever diariamente, programar ou analisar dados, você terá um assistente capaz para apoiá-lo.

Lembre-se de manter seu endereço de acesso seguro e, se tiver alguma dúvida sobre o processo de implantação, sinta-se à vontade para discuti-la na seção de comentários. Desejo a todos vocês um ano novo em que possam alcançar novos patamares com a ajuda da IA!

Publicações semelhantes

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *