DeepSeek-r1 는 뛰어난 성능으로 글로벌 커뮤니티에서 열띤 토론을 불러일으켰습니다. 하지만 사용자 수가 급증하고 일부 알려지지 않은 영역에서 사이버 공격이 발생하면서 공식 서비스가 종종 과부하가 걸리기도 합니다. 오늘은 제로 비용으로 다운되지 않는 전용 AI 비서를 구축하는 방법을 알려드리겠습니다.

비공개 배포를 선택하는 이유는 무엇인가요? 비공개 배포의 이점은 무엇인가요? 프라이빗 배포는 서비스 안정성 외에도 데이터 보안을 완벽하게 제어할 수 있고 필요에 따라 자유롭게 매개변수를 조정하고 기능을 확장할 수 있습니다. 현재 텐센트 클라우드에서 제공하는 무료 GPU 리소스(RTX 4080 수준, 월 10,000분, 16G 그래픽 메모리 클라우드 서비스)는 충분하기 때문에 하드웨어에 투자할 필요 없이 원활한 AI 경험을 즐길 수 있습니다. 자세한 배포 단계는 다음과 같습니다:

1단계: 준비 작업

방문 텐센트 클라우드 스튜디오

를 클릭해 등록 및 실명 인증을 완료하세요. 실명 사용자만 무료 GPU 리소스를 받을 수 있으므로 이 단계는 매우 중요합니다.

다른 클라우드 서비스 제공업체에서 제공하는 리소스를 선택할 수도 있습니다. 이 글에서는 텐센트 클라우드를 예로 들어 설명합니다. 이제 무료 GPU 리소스를 사용할 수 있습니다.

2단계: 작업 공간 만들기

검색 "Ollama'을 클릭하고 기본 유형(무료 버전)을 선택하여 워크스페이스를 만듭니다. 초기화가 완료될 때까지 2~5분 정도 기다립니다.

3단계: 모델 배포

작업 공간에 새 터미널을 만들고 다음 명령을 순서대로 실행합니다:

참고: 네트워크 상태에 따라 모델을 다운로드하는 데 약 10~15분이 소요됩니다. 다운로드가 완료되면 단말기에서 AI와 직접 대화할 수 있습니다.

4단계: 인트라넷 침투 구성하기

다른 기기에서 AI 어시스턴트에 액세스할 수 있도록 하려면 인트라넷 침투를 구성해야 합니다:

  1. 올라마 실행 포트 확인
  1. 인트라넷 보급 시작

참고: 6399는 예시 포트 번호이므로 이전 단계의 결과에 따라 교체하세요.

실행 후 공용 네트워크 액세스 주소가 형식으로 표시됩니다:

5단계: 자동 재시작 설정(선택 사항이지만 권장)

안정적인 서비스 운영을 위해 자동 재시작 스크립트를 추가하는 것이 좋습니다:

6단계: 구성

CherryStudio를 예로 들어 설명합니다. 자세한 소개를 보려면 여기를 클릭하세요,

  • CherryStudio 다운로드 및 설치
  • 설정에서 새 모델 구성을 추가합니다:
    • 모델명: deepseek-r1:14b
    • 서버 주소: 그라디오 공용 네트워크 주소를 입력합니다.
    • API 키: 비워두기

성능 최적화 팁

AI 어시스턴트가 더 빠르게 응답하기를 원하시나요? 다음 최적화 매개변수를 사용해 보세요:

자주 묻는 질문

점유 중인 포트가 있는 경우:

모델 다운로드가 중단되었습니다:

메모리 부족

  • 무료 GPU 인스턴스는 매일 새벽 2시에 자동으로 절전 모드로 전환됩니다. 이 시간대를 피하는 것이 좋습니다.
  • 인트라넷 침투 주소는 72시간 후에 만료됩니다. 정기적으로 확인하는 것을 잊지 마세요.
  • 최대 토큰 매개변수를 조정하여 응답 길이를 제어하여 속도와 완전성의 균형을 맞출 수 있습니다.
  • 응답 속도가 느려지는 경우 서비스를 다시 시작해 보세요.

이제 나만의 AI 비서가 준비되었습니다. 안정적이고 신뢰할 수 있을 뿐만 아니라 완전히 제어할 수 있습니다. 일상적인 글쓰기, 프로그래밍, 데이터 분석 등 어떤 작업을 하든 유능한 비서가 여러분을 도와줄 것입니다.

액세스 주소를 안전하게 보관하고, 배포 과정에 대해 궁금한 점이 있으면 언제든지 댓글 섹션에 문의해 주세요. 인공지능의 도움으로 더 높은 곳에 도달할 수 있는 새해를 맞이하시길 기원합니다!

유사한 게시물

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다