DeepSeek-r1 har skabt en ophedet diskussion i verdenssamfundet på grund af sin fremragende ydeevne. Men i takt med at antallet af brugere stiger, og med cyberangreb i nogle ukendte områder, bliver de officielle tjenester ofte overvældet. I dag vil jeg lære dig, hvordan du bygger en dedikeret AI-assistent, der aldrig går ned, uden omkostninger.

Hvorfor vælge privat udrulning? Hvad er fordelene ved privat udrulning? Ud over servicestabilitet giver privat udrulning os også fuld kontrol over datasikkerheden og giver os mulighed for frit at justere parametre og udvide funktioner efter behov. De gratis GPU-ressourcer, der i øjeblikket leveres af Tencent Cloud (svarende til RTX 4080-niveau, 10.000 minutter pr. måned, 16G grafikhukommelses-cloudtjeneste) er mere end nok, så vi kan nyde en jævn AI-oplevelse uden at skulle investere i hardware. De detaljerede udrulningstrin er som følger:

Trin 1: Forberedende arbejde

Besøg Tencent Cloud Studio

for at fuldføre registreringen og verifikationen af det rigtige navn. Dette trin er afgørende, da kun brugere med rigtige navne kan modtage gratis GPU-ressourcer.

Du kan også vælge ressourcer fra andre udbydere af skytjenester. Denne artikel bruger Tencent Cloud som eksempel. Gratis GPU-ressourcer er nu tilgængelige

Trin 2: Opret et arbejdsområde

Søg efter "Ollama" i grænsefladen til valg af arbejdsområdeskabelon, og vælg den grundlæggende type (gratis version) for at oprette et arbejdsområde. Vent 2-5 minutter på, at initialiseringen er færdig.

Trin 3: Implementering af modellen

Opret en ny terminal i arbejdsområdet, og udfør følgende kommandoer i rækkefølge:

Bemærk: Det tager ca. 10-15 minutter at downloade modellen, afhængigt af netværkstilstanden. Når downloadingen er færdig, kan du tale direkte med AI i terminalen.

Trin 4: Konfigurer intranetindtrængning

For at andre enheder kan få adgang til din AI-assistent, skal du konfigurere intranetpenetration:

  1. Tjek den kørende Ollama-port
  1. Start penetration af intranet

Bemærk: 6399 er et eksempel på et portnummer, udskift det i henhold til resultatet af det foregående trin.

Efter udførelsen får du en offentlig netværksadresse i formatet:

Trin 5: Indstil automatisk genstart (valgfrit, men anbefalet)

For at opretholde en stabil drift af tjenesten anbefales det at tilføje et automatisk genstartsscript:

Trin 6: Konfiguration

CherryStudio bruges som eksempel. For en detaljeret introduktion,

  • Download og installer CherryStudio
  • Tilføj en ny modelkonfiguration i indstillingerne:
    • Modelnavn: deepseek-r1:14b
    • Serveradresse: udfyld din offentlige gradio-netværksadresse
    • API-nøgle: lad den være tom

Tips til optimering af ydeevne

Vil du have din AI-assistent til at reagere hurtigere? Prøv disse optimeringsparametre:

Ofte stillede spørgsmål

Hvis du oplever, at en port er optaget:

Download af model afbrudt:

Utilstrækkelig hukommelse

Tips

  • Gratis GPU-instanser går automatisk i dvale kl. 2 hver morgen. Det anbefales at undgå dette tidsrum
  • Intranet-penetrationsadressen udløber efter 72 timer. Husk at tjekke den regelmæssigt
  • Du kan styre længden af svaret ved at justere parameteren -max-tokens for at afbalancere hastighed og fuldstændighed
  • Hvis du oplever, at svaret bliver langsommere, kan du prøve at genstarte tjenesten

På dette tidspunkt er din egen AI-assistent klar til brug. Den er ikke kun stabil og pålidelig, men også helt under din kontrol. Uanset om det drejer sig om daglig skrivning, programmering eller dataanalyse, har du en dygtig assistent til at støtte dig.

Husk at holde din adgangsadresse sikker, og hvis du har spørgsmål om implementeringsprocessen, er du velkommen til at diskutere dem i kommentarfeltet. Jeg ønsker jer alle et nyt år, hvor I kan nå nye højder med hjælp fra AI!

Lignende indlæg

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *