DeepSeek-r1 a suscité une vive discussion au sein de la communauté internationale en raison de ses performances exceptionnelles. Cependant, avec l'augmentation du nombre d'utilisateurs et les cyberattaques dans des zones inconnues, les services officiels sont souvent débordés. Aujourd'hui, je vais vous apprendre à construire un assistant IA dédié, qui ne tombe jamais en panne, à un coût nul.
Pourquoi choisir le déploiement privé ? Quels sont les avantages du déploiement privé ? En plus de la stabilité du service, le déploiement privé nous donne également un contrôle total sur la sécurité des données et nous permet d'ajuster librement les paramètres et d'étendre les fonctions selon les besoins. Les ressources GPU gratuites actuellement fournies par Tencent Cloud (équivalent au niveau RTX 4080, 10 000 minutes par mois, service cloud de mémoire graphique 16G) sont plus que suffisantes, nous permettant de profiter d'une expérience AI fluide sans avoir à investir dans du matériel. Les étapes détaillées du déploiement sont les suivantes :
Étape 1 : Travaux préparatoires
Visiter Tencent Cloud Studio
pour terminer l'enregistrement et la vérification du nom réel. Cette étape est cruciale, car seuls les utilisateurs ayant un nom réel peuvent recevoir des ressources GPU gratuites.
Vous pouvez également choisir des ressources fournies par d'autres fournisseurs de services en nuage. Cet article utilise Tencent Cloud comme exemple. Des ressources GPU gratuites sont désormais disponibles
Étape 2 : Créer un espace de travail
Rechercher "Ollama"dans l'interface de sélection du modèle d'espace de travail et sélectionnez le type de base (version gratuite) pour créer un espace de travail. Attendez 2 à 5 minutes pour que l'initialisation soit terminée.
Étape 3 : Déploiement du modèle
Créez un nouveau terminal dans l'espace de travail et exécutez les commandes suivantes dans l'ordre :
Remarque : le téléchargement du modèle prend environ 10 à 15 minutes, en fonction de l'état du réseau. Une fois le téléchargement terminé, vous pouvez parler directement à l'IA dans le terminal.
Étape 4 : Configuration de la pénétration de l'intranet
Pour permettre à d'autres appareils d'accéder à votre assistant d'intelligence artificielle, vous devez configurer la pénétration de l'intranet :
- Vérifier le port d'exécution d'Ollama
- Commencer la pénétration de l'intranet
Note : 6399 est un exemple de numéro de port, veuillez le remplacer en fonction du résultat de l'étape précédente.
Après l'exécution, vous obtiendrez une adresse d'accès au réseau public au format :

Étape 5 : Définir le redémarrage automatique (facultatif mais recommandé)
Afin de maintenir un fonctionnement stable du service, il est recommandé d'ajouter un script de redémarrage automatique :
Étape 6 : Configuration
CherryStudio est utilisé comme exemple. Pour une introduction détaillée,
- Télécharger et installer CherryStudio
- Ajouter une nouvelle configuration de modèle dans les paramètres :
- Nom du modèle : deepseek-r1:14b
- Adresse du serveur : indiquez l'adresse de votre réseau public gradio
- Clé API : laisser vide
Conseils pour l'optimisation des performances
Vous voulez que votre assistant IA réponde plus rapidement ? Essayez ces paramètres d'optimisation :
Questions fréquemment posées
Si vous constatez qu'un port est occupé :
Le téléchargement du modèle a été interrompu :
Mémoire insuffisante
Conseils
- Les instances GPU libres se mettront automatiquement en veille à 2 heures du matin tous les matins. Il est recommandé d'éviter cette période
- L'adresse de pénétration de l'intranet expirera après 72 heures. Pensez à la vérifier régulièrement
- Vous pouvez contrôler la longueur de la réponse en ajustant le paramètre -max-tokens pour équilibrer la rapidité et l'exhaustivité.
- Si vous constatez que la réponse ralentit, vous pouvez essayer de redémarrer le service
À ce stade, votre propre assistant d'IA est prêt à fonctionner. Il est non seulement stable et fiable, mais aussi entièrement sous votre contrôle. Qu'il s'agisse de rédaction quotidienne, de programmation ou d'analyse de données, vous disposerez d'un assistant compétent pour vous aider.
N'oubliez pas de conserver votre adresse d'accès en lieu sûr, et si vous avez des questions sur le processus de déploiement, n'hésitez pas à en parler dans la section des commentaires. Je vous souhaite à tous une nouvelle année au cours de laquelle vous pourrez atteindre de nouveaux sommets avec l'aide de l'IA !