como executar o deepseek r1 localmente

DeepSeek-r1 causou uma discussão acalorada na comunidade global devido ao seu excelente desempenho. No entanto, à medida que o número de usuários aumenta e com ataques cibernéticos em algumas áreas desconhecidas, os serviços oficiais são frequentemente sobrecarregados. Hoje, ensinarei a você como criar um assistente de IA dedicado e ininterrupto a custo zero.

Por que escolher a implementação privada? Quais são os benefícios da implementação privada? Além da estabilidade do serviço, a implementação privada também nos dá controle total sobre a segurança dos dados e nos permite ajustar livremente os parâmetros e expandir as funções conforme necessário. Os recursos gratuitos de GPU fornecidos atualmente pela Tencent Cloud (equivalente ao nível RTX 4080, 10.000 minutos por mês, serviço de nuvem de memória gráfica de 16G) são mais do que suficientes, o que nos permite desfrutar de uma experiência de IA suave sem precisar investir em hardware. As etapas detalhadas da implementação são as seguintes:

Índice

Etapa 1: Trabalho preparatório

Visitar Tencent Cloud Studio

para concluir o registro e a verificação do nome real. Essa etapa é crucial, pois somente usuários com nomes reais podem receber recursos gratuitos de GPU.

Você também pode escolher recursos fornecidos por outros provedores de serviços em nuvem. Este artigo usa a Tencent Cloud como exemplo. Recursos gratuitos de GPU já estão disponíveis

Etapa 2: Criar um espaço de trabalho

Pesquisar por "Ollama" na interface de seleção do modelo de espaço de trabalho e selecione o tipo básico (versão gratuita) para criar um espaço de trabalho. Aguarde de 2 a 5 minutos para que a inicialização seja concluída.

Etapa 3: Implementação do modelo

Crie um novo terminal no espaço de trabalho e execute os seguintes comandos em sequência:

Observação: O download do modelo leva de 10 a 15 minutos, dependendo das condições da rede. Após a conclusão do download, você poderá falar diretamente com a IA no terminal.

Etapa 4: Configurar a penetração na intranet

Para permitir que outros dispositivos acessem seu assistente de IA, é necessário configurar a penetração da intranet:

Verifique a porta de execução do Ollama

Iniciar a penetração da intranet

Observação: 6399 é um exemplo de número de porta, substitua-o de acordo com o resultado da etapa anterior

Após a execução, você obterá um endereço de acesso à rede pública no formato:

Etapa 5: Defina a reinicialização automática (opcional, mas recomendada)

Para manter a operação estável do serviço, é recomendável adicionar um script de reinicialização automática:

Etapa 6: Configuração

O CherryStudio é usado como exemplo. Para obter uma introdução detalhada,

Faça o download e instale o CherryStudio
Adicione uma nova configuração de modelo nas configurações:
- Nome do modelo: deepseek-r1:14b
- Endereço do servidor: preencha o endereço da rede pública do Gradio
- Chave de API: deixar em branco

Dicas de otimização de desempenho

Deseja que seu assistente de IA responda mais rápido? Experimente estes parâmetros de otimização:

Perguntas frequentes

Se você encontrar uma porta ocupada:

O download do modelo foi interrompido:

Memória insuficiente

Dicas

As instâncias de GPU gratuitas entrarão automaticamente em repouso às 2h todas as manhãs. Recomenda-se evitar esse período de tempo
O endereço de penetração da intranet expirará após 72 horas. Lembre-se de verificá-lo regularmente
Você pode controlar a duração da resposta ajustando o parâmetro -max-tokens para equilibrar a velocidade e a integridade
Se perceber que a resposta está ficando mais lenta, tente reiniciar o serviço

Nesse ponto, seu próprio assistente de IA está pronto para ser usado. Ele não é apenas estável e confiável, mas também está totalmente sob seu controle. Seja para escrever diariamente, programar ou analisar dados, você terá um assistente capaz para apoiá-lo.

Lembre-se de manter seu endereço de acesso seguro e, se tiver alguma dúvida sobre o processo de implantação, sinta-se à vontade para discuti-la na seção de comentários. Desejo a todos vocês um ano novo em que possam alcançar novos patamares com a ajuda da IA!

Publicações semelhantes

Sem categoria

Um guia abrangente para o DeepSeek, uma técnica de uso que 90% das pessoas não conhecem (recomendado para ser colocado nos favoritos)

Porjanus-ai 29 de janeiro de 202529 de janeiro de 2025

Um guia completo para o DeepSeek, uma técnica de uso que 90% das pessoas não conhecem (recomendado para bookmarking) Desde que o DeepSeek-V3 foi lançado há um mês, venho atualizando artigos e vídeos relacionados ao DeepSeek porque acho que é uma empresa muito incrível. Até que ontem, a história foi finalmente testemunhada, chegando ao topo da Apple App Store dos EUA,...

Sem categoria

Qual é a qualidade do Janus-Pro do DeepSeek?

Porjanus-ai fevereiro 4, 2025fevereiro 4, 2025

Na véspera do Festival da Primavera, o modelo DeepSeek-R1 foi lançado. Com sua arquitetura de RL pura, ele aprendeu com as grandes inovações do CoT e supera o ChatGPT em matemática, código e raciocínio lógico. Além disso, seus pesos de modelo de código aberto, baixos custos de treinamento e preços baratos de API tornaram o DeepSeek um sucesso em toda a Internet, mesmo...

Sem categoria

A Deepseek lançou outro combo: acaba de lançar um modelo multimodal Janus Pro que supera o DALL-E3

Porjanus-ai 28 de janeiro de 202528 de janeiro de 2025

e a era da IA chegou silenciosamente. Provavelmente ninguém esperava que, neste Ano Novo Chinês, o assunto mais quente não seria mais a tradicional batalha de envelopes vermelhos da Internet, que fez parceria com o Festival de Gala da Primavera, mas as empresas de IA. Com a aproximação do Festival da Primavera, as principais empresas-modelo não relaxaram nem um pouco, atualizando uma onda...

Sem categoria

A explicação completa: do DeepSeek Janus ao Janus-Pro!

Porjanus-ai 30 de janeiro de 202530 de janeiro de 2025

Mensagem para levar para casa: O Janus é um modelo simples, unificado e extensível de compreensão e geração multimodal que dissocia a compreensão multimodal e a codificação visual gerada, atenuando os possíveis conflitos entre as duas tarefas. Ele pode ser ampliado para incorporar outras modalidades de entrada no futuro. O Janus-Pro se baseia nesse fundamento, otimizando a estratégia de treinamento (incluindo o aumento da...

Sem categoria

Destilei o conhecimento da capacidade de raciocínio do DeepSeek-R1 para o Qwen2, e os resultados foram realmente explosivos!!!

Porjanus-ai 29 de janeiro de 202529 de janeiro de 2025

Ⅰ. O que é destilação de conhecimento? A destilação de conhecimento é uma técnica de compressão de modelos usada para transferir conhecimento de um modelo grande e complexo (o modelo do professor) para um modelo pequeno (o modelo do aluno). O princípio básico é que o modelo do professor ensina o modelo do aluno prevendo resultados (como distribuições de probabilidade ou processos de inferência), e o modelo do aluno ensina o modelo do professor...

Sem categoria

gerador de imagens deepseek

Porwd.gstar@gmail.com 28 de janeiro de 202528 de janeiro de 2025

Gerador de imagens DeepSeek: Um avanço revolucionário na criação de imagens com IA Introdução O cenário da inteligência artificial testemunhou uma transformação notável com o surgimento da tecnologia de geração de imagens de ponta da DeepSeek. O gerador de imagens DeepSeek, especialmente por meio de sua série Janus Pro, estabeleceu-se como uma solução revolucionária no campo competitivo da criação de imagens com tecnologia de IA. Esse...

como executar o deepseek r1 localmente

Etapa 1: Trabalho preparatório

Etapa 2: Criar um espaço de trabalho

Etapa 3: Implementação do modelo

Etapa 4: Configurar a penetração na intranet

Etapa 5: Defina a reinicialização automática (opcional, mas recomendada)

Etapa 6: Configuração

Dicas de otimização de desempenho

Um guia abrangente para o DeepSeek, uma técnica de uso que 90% das pessoas não conhecem (recomendado para ser colocado nos favoritos)

Qual é a qualidade do Janus-Pro do DeepSeek?

A Deepseek lançou outro combo: acaba de lançar um modelo multimodal Janus Pro que supera o DALL-E3

A explicação completa: do DeepSeek Janus ao Janus-Pro!

Destilei o conhecimento da capacidade de raciocínio do DeepSeek-R1 para o Qwen2, e os resultados foram realmente explosivos!!!

gerador de imagens deepseek

Deixe um comentário Cancelar resposta

Recursos

Amigos