como ejecutar deepseek r1 localmente

DeepSeek-r1 ha provocado un acalorado debate en la comunidad mundial debido a su extraordinario rendimiento. Sin embargo, a medida que aumenta el número de usuarios, y con los ciberataques en algunas zonas desconocidas, los servicios oficiales se ven a menudo desbordados. Hoy, te enseñaré cómo construir un asistente de IA dedicado y que nunca se caiga, a coste cero.

¿Por qué elegir la implantación privada? ¿Cuáles son las ventajas de la implantación privada? Además de la estabilidad del servicio, el despliegue privado también nos proporciona un control total sobre la seguridad de los datos, y nos permite ajustar libremente los parámetros y ampliar las funciones según sea necesario. Los recursos de GPU gratuitos que proporciona actualmente Tencent Cloud (equivalentes al nivel RTX 4080, 10 000 minutos al mes, servicio en la nube de memoria gráfica de 16 G) son más que suficientes, lo que nos permite disfrutar de una experiencia de IA fluida sin tener que invertir en hardware. Los pasos detallados del despliegue son los siguientes:

Índice

Etapa 1: Trabajos preparatorios

Visite Tencent Cloud Studio

para completar el registro y la verificación del nombre real. Este paso es crucial, ya que solo los usuarios con nombre real pueden recibir recursos gratuitos de la GPU.

También puedes elegir recursos proporcionados por otros proveedores de servicios en la nube. Este artículo utiliza Tencent Cloud como ejemplo. Ya están disponibles recursos de GPU gratuitos

Paso 2: Crear un espacio de trabajo

Buscar "Ollama" en la interfaz de selección de plantillas de espacios de trabajo y seleccione el tipo básico (versión gratuita) para crear un espacio de trabajo. Espere de 2 a 5 minutos a que se complete la inicialización.

Paso 3: Despliegue del modelo

Crea un nuevo terminal en el espacio de trabajo y ejecuta los siguientes comandos en secuencia:

Nota: La descarga del modelo tarda unos 10-15 minutos, dependiendo de las condiciones de la red. Una vez finalizada la descarga, puedes hablar directamente con AI en el terminal.

Paso 4: Configurar la penetración en la Intranet

Para permitir que otros dispositivos accedan a tu asistente de IA, debes configurar la penetración en la intranet:

Compruebe el puerto en ejecución de Ollama

Iniciar la penetración de la intranet

Nota: 6399 es un número de puerto de ejemplo, sustitúyalo según el resultado del paso anterior.

Después de la ejecución, obtendrá una dirección de acceso a la red pública en el formato:

Paso 5: Configurar el reinicio automático (opcional pero recomendado)

Para mantener un funcionamiento estable del servicio, se recomienda añadir un script de reinicio automático:

Paso 6: Configuración

CherryStudio se utiliza como ejemplo. Para una introducción detallada,

Descargar e instalar CherryStudio
Añade una nueva configuración de modelo en los ajustes:
- Nombre del modelo: deepseek-r1:14b
- Dirección del servidor: introduzca la dirección de su red pública gradio
- Clave API: dejar en blanco

Consejos para optimizar el rendimiento

¿Quieres que tu asistente IA responda más rápido? Prueba estos parámetros de optimización:

Preguntas más frecuentes

Si encuentra un puerto ocupado:

Modelo de descarga interrumpida:

Memoria insuficiente

Consejos

Las instancias de GPU libres entrarán automáticamente en reposo a las 2 de la madrugada cada mañana. Se recomienda evitar este periodo de tiempo
La dirección de penetración en la intranet caducará a las 72 horas. Recuerde comprobarla regularmente
Puede controlar la longitud de la respuesta ajustando el parámetro -max-tokens para equilibrar la velocidad y la exhaustividad.
Si ves que la respuesta se ralentiza, puedes probar a reiniciar el servicio

En este punto, su propio asistente de IA está listo para funcionar. No sólo es estable y fiable, sino que también está completamente bajo tu control. Ya se trate de la escritura diaria, la programación o el análisis de datos, tendrás un asistente capaz de apoyarte.

Recuerda mantener a salvo tu dirección de acceso y, si tienes alguna pregunta sobre el proceso de despliegue, no dudes en plantearla en la sección de comentarios. ¡Os deseo a todos un nuevo año en el que podáis alcanzar nuevas cotas con la ayuda de la IA!

Sin categoría

Janus Pro DeepSeek: Profundiza en la tecnología y la aplicación del último modelo de IA | Explora el poder innovador que hay detrás de él

Porjanus-ai 29 de enero de 202529 de enero de 2025

El modelo de código abierto de bajo coste y alto rendimiento de deepseek se ha vuelto viral. Un gran número de nuevos usuarios se han registrado en la web de deepseek, lo que ha provocado repetidas caídas del sitio. Con el rápido desarrollo de la tecnología de inteligencia artificial, los grandes modelos lingüísticos (LLM) están cambiando todos los aspectos de nuestro trabajo y nuestras vidas. Pero también se han...

Sin categoría

¡Explosión! El regalo de Año Nuevo chino de DeepSeek: una explicación detallada del modelo multimodal Janus-Pro

Porjanus-ai 28 de enero de 202528 de enero de 2025

¡Explosión! Regalo de Año Nuevo chino de DeepSeek: explicación detallada del modelo multimodal Janus-Pro El último modelo Janus-Pro de DeepSeek conecta directamente los "cerebros izquierdo y derecho" de la IA multimodal. Este asesino de dos caras, capaz de comprender y generar simultáneamente imágenes y texto, está reescribiendo las reglas del sector con su marco de desarrollo propio. Esto no es...

Sin categoría

El cursor es compatible con DeepSeek R1, y las nuevas versiones actualizan varias funciones

Porjanus-ai 29 de enero de 202529 de enero de 2025

Actualmente, existen demasiadas herramientas de programación de IA: Windsurf, Trae (The Real AI Engineer), Cursor y Copilot. Entre ellas, Cursor es la más avanzada y también la más cara. Ya he pagado por Cursor y siempre presto atención a las últimas características para obtener el mejor valor por mi dinero. Con la llegada de...

Sin categoría

Lanzamiento nocturno DeepSeek redefine la generación y comprensión de imágenes mediante IA con el debut del innovador modelo integral Janus-Pro.

Porwd.gstar@gmail.com 28 de enero de 202528 de enero de 2025

Principales características🔹 Arquitectura de transformador unificada: Un único modelo gestiona tanto la comprensión como la generación de imágenes, eliminando la necesidad de sistemas separados.🔹 Escalable y de código abierto: Disponible en versiones de parámetros 1B y 7B (con licencia MIT), optimizadas para diversas aplicaciones y uso comercial.🔹 Rendimiento de última generación: Supera a DALL-E 3 de OpenAI y a Stable Diffusion en pruebas comparativas como GenEval y DPG-Bench.🔹 Despliegue simplificado: La arquitectura simplificada reduce los costes de formación/inferencia manteniendo la flexibilidad. Enlaces de modelos...

Sin categoría

¿Cómo de bueno es el Janus-Pro de DeepSeek?

Porjanus-ai 4 de febrero de 20254 de febrero de 2025

En vísperas del Festival de Primavera, se lanzó el modelo DeepSeek-R1. Con su arquitectura RL pura, ha aprendido de las grandes innovaciones de CoT, y supera a ChatGPT en matemáticas, código y razonamiento lógico. Además, los pesos de su modelo de código abierto, los bajos costes de formación y los precios baratos de la API han hecho de DeepSeek un éxito en Internet, incluso...

Sin categoría

Detalles del documento DeepSeek V3: Cómo eludir el monopolio de CUDA

Porjanus-ai 29 de enero de 202529 de enero de 2025

Detalles del documento DeepSeek V3: Cómo saltarse el monopolio de CUDA Los dos modelos de DeepSeek publicados recientemente, DeepSeek-V3 y DeepSeek-R1, consiguen un rendimiento comparable al de modelos similares de OpenAI a un coste mucho menor. Según informan medios extranjeros, en sólo dos meses entrenaron un modelo de lenguaje MoE con 671.000 millones de parámetros en un clúster de 2.048...

cómo ejecutar deepseek r1 localmente

Etapa 1: Trabajos preparatorios

Paso 2: Crear un espacio de trabajo

Paso 3: Despliegue del modelo

Paso 4: Configurar la penetración en la Intranet

Paso 5: Configurar el reinicio automático (opcional pero recomendado)

Paso 6: Configuración

Consejos para optimizar el rendimiento

Janus Pro DeepSeek: Profundiza en la tecnología y la aplicación del último modelo de IA | Explora el poder innovador que hay detrás de él

¡Explosión! El regalo de Año Nuevo chino de DeepSeek: una explicación detallada del modelo multimodal Janus-Pro

El cursor es compatible con DeepSeek R1, y las nuevas versiones actualizan varias funciones

Lanzamiento nocturno DeepSeek redefine la generación y comprensión de imágenes mediante IA con el debut del innovador modelo integral Janus-Pro.

¿Cómo de bueno es el Janus-Pro de DeepSeek?

Detalles del documento DeepSeek V3: Cómo eludir el monopolio de CUDA

Deja una respuesta Cancelar la respuesta

Recursos

Amigos

Etapa 1: Trabajos preparatorios

Paso 2: Crear un espacio de trabajo

Paso 3: Despliegue del modelo

Paso 4: Configurar la penetración en la Intranet

Paso 5: Configurar el reinicio automático (opcional pero recomendado)

Paso 6: Configuración

Consejos para optimizar el rendimiento

Entradas Similares

Deja una respuesta Cancelar la respuesta

Recursos

Amigos