DeepSeek-r1 ha provocado un acalorado debate en la comunidad mundial debido a su extraordinario rendimiento. Sin embargo, a medida que aumenta el número de usuarios, y con los ciberataques en algunas zonas desconocidas, los servicios oficiales se ven a menudo desbordados. Hoy, te enseñaré cómo construir un asistente de IA dedicado y que nunca se caiga, a coste cero.

¿Por qué elegir la implantación privada? ¿Cuáles son las ventajas de la implantación privada? Además de la estabilidad del servicio, el despliegue privado también nos proporciona un control total sobre la seguridad de los datos, y nos permite ajustar libremente los parámetros y ampliar las funciones según sea necesario. Los recursos de GPU gratuitos que proporciona actualmente Tencent Cloud (equivalentes al nivel RTX 4080, 10 000 minutos al mes, servicio en la nube de memoria gráfica de 16 G) son más que suficientes, lo que nos permite disfrutar de una experiencia de IA fluida sin tener que invertir en hardware. Los pasos detallados del despliegue son los siguientes:

Etapa 1: Trabajos preparatorios

Visite Tencent Cloud Studio

para completar el registro y la verificación del nombre real. Este paso es crucial, ya que solo los usuarios con nombre real pueden recibir recursos gratuitos de la GPU.

También puedes elegir recursos proporcionados por otros proveedores de servicios en la nube. Este artículo utiliza Tencent Cloud como ejemplo. Ya están disponibles recursos de GPU gratuitos

Paso 2: Crear un espacio de trabajo

Buscar "Ollama" en la interfaz de selección de plantillas de espacios de trabajo y seleccione el tipo básico (versión gratuita) para crear un espacio de trabajo. Espere de 2 a 5 minutos a que se complete la inicialización.

Paso 3: Despliegue del modelo

Crea un nuevo terminal en el espacio de trabajo y ejecuta los siguientes comandos en secuencia:

Nota: La descarga del modelo tarda unos 10-15 minutos, dependiendo de las condiciones de la red. Una vez finalizada la descarga, puedes hablar directamente con AI en el terminal.

Paso 4: Configurar la penetración en la Intranet

Para permitir que otros dispositivos accedan a tu asistente de IA, debes configurar la penetración en la intranet:

  1. Compruebe el puerto en ejecución de Ollama
  1. Iniciar la penetración de la intranet

Nota: 6399 es un número de puerto de ejemplo, sustitúyalo según el resultado del paso anterior.

Después de la ejecución, obtendrá una dirección de acceso a la red pública en el formato:

Paso 5: Configurar el reinicio automático (opcional pero recomendado)

Para mantener un funcionamiento estable del servicio, se recomienda añadir un script de reinicio automático:

Paso 6: Configuración

CherryStudio se utiliza como ejemplo. Para una introducción detallada,

  • Descargar e instalar CherryStudio
  • Añade una nueva configuración de modelo en los ajustes:
    • Nombre del modelo: deepseek-r1:14b
    • Dirección del servidor: introduzca la dirección de su red pública gradio
    • Clave API: dejar en blanco

Consejos para optimizar el rendimiento

¿Quieres que tu asistente IA responda más rápido? Prueba estos parámetros de optimización:

Preguntas más frecuentes

Si encuentra un puerto ocupado:

Modelo de descarga interrumpida:

Memoria insuficiente

Consejos

  • Las instancias de GPU libres entrarán automáticamente en reposo a las 2 de la madrugada cada mañana. Se recomienda evitar este periodo de tiempo
  • La dirección de penetración en la intranet caducará a las 72 horas. Recuerde comprobarla regularmente
  • Puede controlar la longitud de la respuesta ajustando el parámetro -max-tokens para equilibrar la velocidad y la exhaustividad.
  • Si ves que la respuesta se ralentiza, puedes probar a reiniciar el servicio

En este punto, su propio asistente de IA está listo para funcionar. No sólo es estable y fiable, sino que también está completamente bajo tu control. Ya se trate de la escritura diaria, la programación o el análisis de datos, tendrás un asistente capaz de apoyarte.

Recuerda mantener a salvo tu dirección de acceso y, si tienes alguna pregunta sobre el proceso de despliegue, no dudes en plantearla en la sección de comentarios. ¡Os deseo a todos un nuevo año en el que podáis alcanzar nuevas cotas con la ayuda de la IA!

Entradas Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *