Vad är DeepSeek?

februari 3, 2025

DeepSeek är ett kinesiskt artificiellt intelligensföretag (AI) som specialiserar sig på utveckling av AI med öppen källkod för stora språkmodeller (LLM). Företaget grundades i juli 2023 av Liang Wenfeng och har sitt huvudkontor i Hangzhou, Zhejiang-provinsen. DeepSeek finansieras av den kinesiska hedgefonden High-Flyer.

Vilka är DeepSeeks fördelar?

Kostnadseffektivitet – DeepSeeks modeller, såsom DeepSeek-R1, har utvecklats till en bråkdel av kostnaden jämfört med andra modeller med samma prestanda. Till exempel tränades DeepSeek-R1 för cirka 6 miljoner dollar, vilket är avsevärt lägre än de 100 miljoner dollar som rapporterats ha spenderats på att träna OpenAI:s GPT-4.

Open Source – Genom att göra sina modeller öppna för allmänheten ger DeepSeek utvecklare världen över möjlighet att använda, modifiera och vidareutveckla AI-teknologin, vilket främjar innovation och samarbete.

Prestanda – DeepSeeks modeller har visat sig prestera i nivå med ledande AI-modeller. DeepSeek-R1 ger svar jämförbara med andra avancerade språkmodeller, såsom OpenAI:s GPT-4o och o1.

Varför och hur utmanas AI-industrin av den här modellen?

DeepSeeks lansering innebär en förändring av AI-industrin genom att utmana de etablerade aktörerna. Företagets förmåga att utveckla högpresterande modeller till en lägre kostnad har lett till effekter som påverkar tex USAs ekonomi genom kraftiga nedgångar i teknikbolags aktiekurser.

DeepSeek sägs lösa ett av de stora problemen vi står inför, då deras modell rapporteras att använda mycket mindre elektricitet, 50–75% mindre jämfört med Meta and Nvidias modeller. Vilket är en av de stora utmaningarna med AI, att det kräver 10 gånger mer elektricitet att ställa en fråga till ChatGPT än att Googla svaret. Därav att tex Meta nu kommer att bygga egna kärnkraftverk.

Dock har det framkommit att siffrorna för DeepSeeks energiförbrukning kan vara missvisande, eftersom mätningen av DeepSeeks energiförbrukning sägs vara utfört på en mindre modell. Och att träningen av DeepSeek modellen kräver mindre energi är motsvarande LLMs med samma kapacitet – men att det inte stämmer avseende bearbeta och att svara på prompts. Därav vill jag personligen se mer konkret data idag än vad som finns tillgängligt på internet.

Frågan är om vi tittar på ägandestrukturen för det här företaget (allt i Kina ägs till syvende och sist av CCP…). Innebär detta en förändring i det globala AI-landskapet? Självklart är metodikerna något som innebär stora framsteg – men igen, jag vill se konkret data från oberoende aktörer som svarar på alla mina frågetecken. Aktörer som inte kommer från USA eller Kina.

Vad är riskerna med att använda DeepSeek?

Ägandestruktur – som jag nämnde ovan, allt Kina ägs av CCP, oavsett om det frontas av företagsnamn. Det är värt att ta i beaktning.

Datasäkerhet och integritet – som med alla AI-modeller finns det oro kring datasäkerhet och integritet, särskilt eftersom DeepSeek är baserat i Kina. Användare och organisationer måste noga överväga riskerna med databehandling och eventuell åtkomst av tredje part.

Etiska och juridiska överväganden – DeepSeeks metoder, särskilt deras användning av så kallade ”distillations”-tekniker, har väckt debatt kring legalitet och etik. Det finns misstankar om att företaget kan ha använt proprietära modeller från aktörer som OpenAI utan tillstånd, vilket väcker frågor om rättigheterna kring deras metoder. Vilket är ironiskt, eftersom OpenAI har en mängd stämningar mot sig baserat på att använda material utan upphovsrätt för att träna sina modeller.

Har något land eller institution förbjudit DeepSeek?

Italien förbjöd DeepSeek för några dagar sedan pga av orsaker kopplat till etik och integritet, dock kan förbudet säkerligen lyftas. Om DeepSeek kan svara på och justera det som lyfts, precis som för OpenAI när ChatGPT introducerades på Italienska marknaden.

Sammanfattning

DeepSeek representerar ett stort steg framåt i utveckling inom AI-industrin och erbjuder kostnadseffektiva, högpresterande modeller med öppen källkod. Även om det finns fördelar, ska behöver vi överväga risker och etiska implikationer. Vi ska också ta med oss att det som är så magiskt med att jobba med det digitala mediumet är att utveckligen alltid går framåt. Gissningsvis kommer vi se hur de här träningsmetoderna och tillämpningen av teknologin kommer att påverka de större aktörerna och kommande modeller.

Allt eftersom jag lär mig, läser på och hör om DeepSeek kommer jag att uppdatera den här artikeln.

Kontakta oss

Nimble & co

Vad är DeepSeek?

Vilka är DeepSeeks fördelar?

Varför och hur utmanas AI-industrin av den här modellen?

Vad är riskerna med att använda DeepSeek?

Har något land eller institution förbjudit DeepSeek?

Sammanfattning

Nimble & co

Nyhetsbrev

Kontakt

Ta del av tips och kunskap

Kontakta oss

Nimble & co

Vad är DeepSeek?

Vilka är DeepSeeks fördelar?

Varför och hur utmanas AI-industrin av den här modellen?

Vad är riskerna med att använda DeepSeek?

Har något land eller institution förbjudit DeepSeek?

Sammanfattning

Previous Entry

Sociala medietrender 2025

Next Entry

Operator – OpenAIs nya AI-agent för alla