Comment exécuter deepseek r1 localement

DeepSeek-r1 a suscité une vive discussion au sein de la communauté internationale en raison de ses performances exceptionnelles. Cependant, avec l'augmentation du nombre d'utilisateurs et les cyberattaques dans des zones inconnues, les services officiels sont souvent débordés. Aujourd'hui, je vais vous apprendre à construire un assistant IA dédié, qui ne tombe jamais en panne, à un coût nul.

Pourquoi choisir le déploiement privé ? Quels sont les avantages du déploiement privé ? En plus de la stabilité du service, le déploiement privé nous donne également un contrôle total sur la sécurité des données et nous permet d'ajuster librement les paramètres et d'étendre les fonctions selon les besoins. Les ressources GPU gratuites actuellement fournies par Tencent Cloud (équivalent au niveau RTX 4080, 10 000 minutes par mois, service cloud de mémoire graphique 16G) sont plus que suffisantes, nous permettant de profiter d'une expérience AI fluide sans avoir à investir dans du matériel. Les étapes détaillées du déploiement sont les suivantes :

Table des matières

Étape 1 : Travaux préparatoires

Visiter Tencent Cloud Studio

pour terminer l'enregistrement et la vérification du nom réel. Cette étape est cruciale, car seuls les utilisateurs ayant un nom réel peuvent recevoir des ressources GPU gratuites.

Vous pouvez également choisir des ressources fournies par d'autres fournisseurs de services en nuage. Cet article utilise Tencent Cloud comme exemple. Des ressources GPU gratuites sont désormais disponibles

Étape 2 : Créer un espace de travail

Rechercher "Ollama"dans l'interface de sélection du modèle d'espace de travail et sélectionnez le type de base (version gratuite) pour créer un espace de travail. Attendez 2 à 5 minutes pour que l'initialisation soit terminée.

Étape 3 : Déploiement du modèle

Créez un nouveau terminal dans l'espace de travail et exécutez les commandes suivantes dans l'ordre :

Remarque : le téléchargement du modèle prend environ 10 à 15 minutes, en fonction de l'état du réseau. Une fois le téléchargement terminé, vous pouvez parler directement à l'IA dans le terminal.

Étape 4 : Configuration de la pénétration de l'intranet

Pour permettre à d'autres appareils d'accéder à votre assistant d'intelligence artificielle, vous devez configurer la pénétration de l'intranet :

Vérifier le port d'exécution d'Ollama

Commencer la pénétration de l'intranet

Note : 6399 est un exemple de numéro de port, veuillez le remplacer en fonction du résultat de l'étape précédente.

Après l'exécution, vous obtiendrez une adresse d'accès au réseau public au format :

Étape 5 : Définir le redémarrage automatique (facultatif mais recommandé)

Afin de maintenir un fonctionnement stable du service, il est recommandé d'ajouter un script de redémarrage automatique :

Étape 6 : Configuration

CherryStudio est utilisé comme exemple. Pour une introduction détaillée,

Télécharger et installer CherryStudio
Ajouter une nouvelle configuration de modèle dans les paramètres :
- Nom du modèle : deepseek-r1:14b
- Adresse du serveur : indiquez l'adresse de votre réseau public gradio
- Clé API : laisser vide

Conseils pour l'optimisation des performances

Vous voulez que votre assistant IA réponde plus rapidement ? Essayez ces paramètres d'optimisation :

Questions fréquemment posées

Si vous constatez qu'un port est occupé :

Le téléchargement du modèle a été interrompu :

Mémoire insuffisante

Conseils

Les instances GPU libres se mettront automatiquement en veille à 2 heures du matin tous les matins. Il est recommandé d'éviter cette période
L'adresse de pénétration de l'intranet expirera après 72 heures. Pensez à la vérifier régulièrement
Vous pouvez contrôler la longueur de la réponse en ajustant le paramètre -max-tokens pour équilibrer la rapidité et l'exhaustivité.
Si vous constatez que la réponse ralentit, vous pouvez essayer de redémarrer le service

À ce stade, votre propre assistant d'IA est prêt à fonctionner. Il est non seulement stable et fiable, mais aussi entièrement sous votre contrôle. Qu'il s'agisse de rédaction quotidienne, de programmation ou d'analyse de données, vous disposerez d'un assistant compétent pour vous aider.

N'oubliez pas de conserver votre adresse d'accès en lieu sûr, et si vous avez des questions sur le processus de déploiement, n'hésitez pas à en parler dans la section des commentaires. Je vous souhaite à tous une nouvelle année au cours de laquelle vous pourrez atteindre de nouveaux sommets avec l'aide de l'IA !

A lire également

Non classé

Explosion ! Le cadeau de DeepSeek pour le Nouvel An chinois - une explication détaillée du modèle multimodal Janus-Pro

Parjanus-ai 28 janvier 202528 janvier 2025

Explosion ! Le dernier modèle Janus-Pro de DeepSeek relie directement les "cerveaux gauche et droit" de l'IA multimodale ! Ce tueur à deux visages, qui peut simultanément comprendre des images et du texte et générer des images, réécrit les règles de l'industrie grâce à son propre cadre de développement. Il ne s'agit pas...

Non classé

Comment installer et utiliser DeepSeek R1 sur votre ordinateur local

Parjanus-ai 30 janvier 202530 janvier 2025

DeepSeek R1, un nouveau modèle de langage d'IA open-source développé par l'entreprise chinoise d'IA DeepSeek, est très populaire en ce moment. Certains utilisateurs affirment qu'il est comparable, voire supérieur, au modèle o1 d'OpenAI en termes de capacités d'inférence. DeepSeek est actuellement gratuit, ce qui est une bonne nouvelle pour les utilisateurs, mais soulève également quelques questions. Comment...

Non classé

Quelle est la qualité du Janus-Pro de DeepSeek ?

Parjanus-ai 4 février 20254 février 2025

À la veille de la fête du printemps, le modèle DeepSeek-R1 a été publié. Avec son architecture RL pure, il a appris des grandes innovations de CoT et surpasse ChatGPT en mathématiques, en code et en raisonnement logique. En outre, ses poids de modèle en source ouverte, ses faibles coûts d'entraînement et ses prix d'API bon marché ont fait de DeepSeek un succès sur Internet, même...

Non classé

Deepseek a sorti un autre combo : il vient de sortir un modèle multimodal Janus Pro qui surpasse DALL-E3

Parjanus-ai 28 janvier 202528 janvier 2025

et l'ère de l'IA est tranquillement arrivée. Personne ne s'attendait probablement à ce que le sujet le plus brûlant de ce Nouvel An chinois ne soit plus la traditionnelle bataille de l'enveloppe rouge d'Internet, qui s'est associée au gala de la fête du printemps, mais les entreprises d'IA. À l'approche de la fête du printemps, les grandes entreprises de modélisation n'ont pas relâché leurs efforts, mettant à jour une vague...

Non classé

La nouvelle star de la génération d'images multimodales : Janus-4o ? Partager : GPT-4o-Image établit une nouvelle norme pour les jeux de données, en alignant la génération d'images sur GPT-4o.

Parjanus-ai 6 juillet 20256 juillet 2025

ShareGPT-4o-Image est un jeu de données de génération d'images à grande échelle et de haute qualité, toutes générées grâce aux capacités de GPT-4o. Ce jeu de données vise à combiner les avantages des modèles multimodaux open source avec les atouts de GPT-4o pour la création de contenu visuel. Il comprend 45 000 échantillons de conversion de texte en image et 46 000 échantillons d'image en texte, ce qui en fait une ressource pratique pour améliorer les modèles multimodaux dans le domaine de l'image…

Non classé

Grokipedia d'Elon Musk : l'avenir du partage des connaissances et un concurrent de Wikipédia

Parjanus-ai 28 octobre 202528 octobre 2025

Introduction : Révolutionner le partage des connaissances. Elon Musk est connu pour remettre en question l’ordre établi dans de nombreux secteurs, des voitures électriques avec Tesla à l’exploration spatiale avec SpaceX. Aujourd’hui, il s’attaque à la transformation du monde du partage des connaissances avec son dernier projet, Grokipedia. Le 27 octobre, heure locale, Elon Musk a présenté un nouvel outil de partage des connaissances…

comment faire fonctionner deepseek r1 localement

Étape 1 : Travaux préparatoires

Étape 2 : Créer un espace de travail

Étape 3 : Déploiement du modèle

Étape 4 : Configuration de la pénétration de l'intranet

Étape 5 : Définir le redémarrage automatique (facultatif mais recommandé)

Étape 6 : Configuration

Conseils pour l'optimisation des performances

Explosion ! Le cadeau de DeepSeek pour le Nouvel An chinois - une explication détaillée du modèle multimodal Janus-Pro

Comment installer et utiliser DeepSeek R1 sur votre ordinateur local

Quelle est la qualité du Janus-Pro de DeepSeek ?

Deepseek a sorti un autre combo : il vient de sortir un modèle multimodal Janus Pro qui surpasse DALL-E3

La nouvelle star de la génération d'images multimodales : Janus-4o ? Partager : GPT-4o-Image établit une nouvelle norme pour les jeux de données, en alignant la génération d'images sur GPT-4o.

Grokipedia d'Elon Musk : l'avenir du partage des connaissances et un concurrent de Wikipédia

Laisser un commentaire Annuler la réponse

Ressources

Amis