A DeepSeek egy kínai mesterséges intelligencia vállalat, amelyet 2023-ban alapítottak Hangzhou-ban, Zhejiang tartományban. A cég nyílt forráskódú nagy nyelvi modelleket fejleszt, és az utóbbi időben jelentős figyelmet keltett az AI iparágban.
Megrengette az AI-világot a DeepSeek, érdemes azonban óvatosan kezelni az új mesterséges intelligenciát
A DeepSeek legújabb modellje, a DeepSeek-R1, hasonló képességekkel rendelkezik, mint az OpenAI o1 (ChatGPT) modellje, de lényegesen alacsonyabb költséggel működik. A modell fejlesztése körülbelül 5,6 millió dollárba került, és hozzávetőlegesen 2000 Nvidia H800 chipet használtak a képzéshez. A DeepSeek-R1 alkalmazás gyorsan az Apple App Store ingyenes alkalmazásainak élére került, megelőzve a ChatGPT-t. Ez azért is válhatott vonzóvá a felhasználóknak, mert az OpenAI által működtetett ChatGPT-ben az o1-hez és az o1-minihez korlátozott a hozzáférés a prémium csomagban is, aminek előfizetői díja 24 dollár havonta.
A DeepSeek sikere aggodalmat keltett az amerikai technológiai iparban, mivel felmerült a kérdés, hogy az Egyesült Államok elveszítheti vezető szerepét az AI területén. A vállalat nyílt forráskódú megközelítése és alacsony működési költségei új megközelítéseket és stratégiákat ösztönözhetnek az AI fejlesztésében világszerte. Fontos megjegyezni, hogy a DeepSeek modelljei kerülik az érzékeny politikai témákat, tükrözve Kína hivatalos álláspontját olyan kérdésekben, mint például Tajvan.
A DeepSeek több jelentős modellt is bemutatott:
- DeepSeek-V2 (2024 május): Ez a sorozat négy modellt tartalmazott, köztük két alapmodellt és két chatbotot. Az újítások között szerepelt a többfejű látens figyelem (MLA) és a szakértők keveréke (MoE) mechanizmusok alkalmazása, amelyek javították a modell hatékonyságát és teljesítményét.
- DeepSeek-Coder-V2 (2024 június): Ezeket a modelleket kifejezetten kódolási feladatokra optimalizálták, és különböző adatforrásokból származó utasításokkal finomhangolták őket.
- DeepSeek-V3 (2024 december): Ez a modell továbbfejlesztette az előző verziókat, nagyobb adathalmazon képezték, és javították a matematikai és programozási feladatokban nyújtott teljesítményét.
- DeepSeek-R1 (2025 január): Ez a modell különösen a logikai következtetésekre, matematikai érvelésre és valós idejű problémamegoldásra összpontosított. A benchmark tesztek szerint teljesítménye felülmúlta az OpenAI o1 modelljét olyan területeken, mint a matematika és a programozás.
A News&Media Holdin mesterséges intelligenciával foglalkozó menedzsere, Filip Kadlečík felhívta a figyelmet az úttörő alkalmazás árnyoldalára is.
Az AI-alapú technológiák alkalmazásakor mindig elővigyázatosnak kell lennünk. Az AI-asszisztens DeepSeek, pontosabban a DeepSeek-R1 nyelvi modell sikere megrázta a globális piacokat, ugyanis hétfőn az Apple App Store legnépszerűbb alkalmazásává vált, megelőzve a ChatGPT-t. Ez azt jelzi, hogy a felhasználók óriási érdeklődést mutatnak iránta. A DeepSeek azonban nemcsak népszerű, hanem a jelek szerint rendkívül fejlett is: bizonyos tesztek szerint egyes területeken felülmúlja az egész meglévő iparági konkurenciát. Ráadásul ezt alacsonyabb számítási teljesítménnyel éri el, ami részben hozzájárult az Nvidia részvényárfolyamának drámai csökkenéséhez
- olvasható a megjegyzésében.
Miért fontos erről beszélni?
A legfontosabb szempont, hogy a DeepSeek egy kínai alkalmazás, és ennek megfelelő óvatossággal kell kezelni. Bár a projekt mögött a High-Flyer nevű fedezeti alap áll – tehát nem közvetlenül egy állami kezdeményezésről van szó –, ez nem zárja ki annak lehetőségét, hogy a kínai kormány hozzáférést szerezzen a DeepSeek szerverein tárolt adatokhoz.
A DeepSeek jelenleg talán nem tűnik közvetlen fenyegetésnek, és a szakember nem állítja, hogy pusztán azért kellene elutasítani, mert egy kínai fejlesztés. Ugyanakkor elengedhetetlen, hogy kellő óvatossággal közelítsünk hozzá, és ne vállaljunk felesleges kockázatot.
Mit kell átgondolni, mielőtt a DeepSeek használata mellett döntene?
- Biztonsági kockázatok
- Kiberbiztonsági szakértők komoly biztonsági réseket azonosítottak a DeepSeek R1 modellben.
- A tesztek kimutatták, hogy a modell képes illegális vagy veszélyes információkat generálni, például rosszindulatú szoftverek (malware) készítésére vagy dezinformációs kampányok támogatására vonatkozó útmutatásokat adni.
- A Kela kiberbiztonsági elemzőcég szerint a DeepSeek R1 képes hihető forgatókönyveket generálni, amelyeket félrevezető információk terjesztésére lehet felhasználni.
- Cenzúra és etikai kérdések
- A DeepSeek autocenzúrával működik bizonyos témákban, különösen a kínai kormány által érzékenynek minősített kérdésekben (pl. Tienanmen tér eseményei).
- Ez a gyakorlat kérdéseket vet fel a technológia átláthatóságával és etikus alkalmazásával kapcsolatban.
- Adatvédelem
- Felmerült az aggodalom, hogy a DeepSeek a felhasználói adatokat olyan módon dolgozza fel és oszthatja meg, amely nem felel meg a nyugati adatvédelmi elvárásoknak.
- Ausztrália tudományos és technológiai minisztere is figyelmeztetett a lehetséges adatvédelmi problémákra, és óvatosságra intette a felhasználókat az alkalmazás letöltése előtt.
A Reuters beszámolója szerint a 2023-ban alapított DeepSeek célja, hogy nyílt forráskódú nagy nyelvi modelleket fejlesszen, amelyek elősegítik az általános mesterséges intelligencia fejlődését és globális hozzáférhetőségét. A vállalat szerint modelljeik nemcsak költséghatékonyak, hanem teljesítményükben is felülmúlják az amerikai versenytársakat. A DeepSeek sikere megingatta a befektetők bizalmát a mesterséges intelligencia szektorban, különösen az olyan vállalatok esetében, amelyek jelentős összegeket fektetnek be fejlett chipekbe és infrastruktúrába. Ugyanakkor a DeepSeek innovatív megközelítése és költséghatékonysága új lehetőségeket nyithat meg az ilyen típusú alkalmazások terén, és ösztönözheti a versenyt az iparágban. A DeepSeek-R1, amelyet múlt héten adtak ki, a DeepSeek hivatalos WeChat-bejegyzése szerint 20-50-szer olcsóbb, mint az OpenAI o1 modellje, feladattól függően.
Hogyan viszonyul ehhez Peking?
A DeepSeek sikere már Kína legmagasabb politikai köreiben is visszhangot keltett.
2025. január 20-án, a DeepSeek-R1 nyilvános megjelenésének napján a vállalat alapítója, Liang Wenfeng részt vett egy zártkörű üzleti és szakértői szimpóziumon, amelyet Li Qiang, Kína miniszterelnöke szervezett
– jelentette a Hszinhua állami hírügynökség.
Liang jelenléte ezen az eseményen azt jelezheti, hogy a DeepSeek sikerének stratégiai jelentősége lehet Peking számára. Az ország célja, hogy leküzdje Washington exportkorlátozásait, és önellátóvá váljon a mesterséges intelligencia és más stratégiai iparágak területén. Egy hasonló szimpóziumon tavaly a Baidu vezérigazgatója, Robin Li is részt vett.
Az OpenAI ChatGPT modelljének 2022 végi megjelenése pánikot keltett a kínai technológiai vállalatok körében, akik gyorsan elkezdtek saját mesterséges intelligencia-alapú chatbotokat fejleszteni. Az első kínai ChatGPT-alternatíva, amelyet a keresőóriás Baidu készített, azonban csalódást okozott a kínai közönség számára, mivel világossá vált az amerikai és kínai MI-technológiák közötti szakadék.
Összegzés
A fentiek fényében elmondható, hogy a DeepSeek potenciális biztonsági kockázatot jelenthet, különösen az adatvédelem és az etikai kérdések terén. Mielőtt bárki elkezdené használni, alaposan mérlegelnie kell a lehetséges következményeket és kockázatokat. Mindemellett megjelenése új irányokat és versenyt hozott a mesterséges intelligencia piacára, és jelentős hatással volt a globális technológiai szektorra.
Támogassa az ujszo.com-ot
A támogatásoknak köszönhetöen számos projektet tudtunk indítani az utóbbi években, cikkeink pedig továbbra is ingyenesen olvashatóak. Támogass minket, hogy továbbra is függetlenek maradhassunk!
Kérjük a kommentelőket, hogy tartózkodjanak az olyan kommentek megírásától, melyek mások személyiségi jogait sérthetik.