รู้จัก DeepSeek บริษัท AI จากจีนผู้สั่นสะเทือนตลาด AI โลก ทำไมถึงพัฒนา AI เจ๋งๆได้ทั้งๆที่จีนโดนคว่ำบาตรจากสหรัฐ

  • 36
  •  
  •  
  •  
  •  

DeepSeek บริษัท Start-Up จากประเทศจีน เป็นชื่อที่แทบจะไม่เคยมีใครได้ยินมาก่อนจนกระทั่ง DeepSeek กลายเป็นข่าวดังไปทั่วโลกในช่วงไม่กี่วันที่ผ่านมา จากการเปิดตัวโมเดล AI ตัวล่าสุดอย่าง DeepSeek-R1 ที่มีจุดเด่นเรื่องประสิทธิภาพเทียบเท่าคู่แข่งแต่มีราคาค่าบริการถูกกว่าคู่แข่งในตลาดเป็นสิบเท่าตัว ความโด่งดังของ DeepSeek ทำให้หุ้นเทคโนโลยีในตลาดหุ้นสหรัฐร่วงลงพร้อมๆกันโดยเฉพาะหุ้น NVIDIA บริษัทชิปยักษ์ใหญ่ของสหรัฐที่ร่วงลงอย่างรุนแรงถึง 16%

บทความนี้เราจะมาทำความรู้จัก DeepSeek กันให้มากขึ้นว่าพวกเขาคือใคร? และทำไมจึงสร้างแรงสั่นสะเทือนกับตลาด AI อย่างรุนแรง? และที่สำคัญก็คือ ทำไม DeepSeek ถึงสามารถพัฒนาโมเดล AI จนมีความสามารถเทียบเท่า AI จากสหรัฐได้ ทั้งๆที่บริษัทจากประเทศจีนจะเจอกับมาตรการคว่ำบาตรทางการค้าของสหรัฐจนไม่สามารถใช้ชิพคุณภาพสูงจากสหรัฐอเมริกาได้? Marketing Oops! รวบรวมมาสรุปในโพสต์นี้แล้ว

DeepSeek คือใคร?

https://chat.deepseek.com/

DeepSeek เป็นบริษัทเทคที่มีสำนักงานใหญ่ในเมืองหางโจว ประเทศจีน เป็นผู้พัฒนา AI แบบเดียวกันกับ ChatGPT ของ Open AI สามารถเข้าไปลองเล่นดูได้ที่ https://chat.deepseek.com/

บริษัท DeepSeek ก่อตั้งขึ้นในเดือนพฤษภาคม 2023 โดย Liang Wenfeng บุคลสำคัญในวงการ Hedge Fund และ AI ของประเทศจีน โดยบริษัท DeepSeek เป็นบริษัทที่ได้รับเงินทุนสนับสนุนโดยตรงจาก “High-Flyer” ซึ่งเป็นบริษัท Hedge Fund จีนที่คุณ Wenfeng ก่อตั้งขึ้น จุดนี้เองทำให้ DeepSeek มีข้อได้เปรียบเรื่องการพัฒนา AI โดยไม่ต้องมีแรงกดดันจากนักลงทุนภายนอกเนื่องจาก เจ้าของ DeepSeek และผู้จัดการ Hedge Fund เป็นคนเดียวกัน

Liang Wenfeng ผู้ก่อตั้งและ CEO บริษัท DeepSeek

อีกจุดแข็งของ DeepSeek ก็คือ การคัดเลือก Talent หรือคัดเลือกคนเก่งๆ เข้ามาร่วมงานกับบริษัท โดย DeepSeek จะตัดเลือกคนจากมหาวิทยาลัยหัวกะทิของประเทศจีน วิธีการของ DeepSeek คือจะไม่สนใจประสบการณ์การทำงานแต่เน้นไปที่ทักษะการทำงานล้วนๆ นั่นทำให้องค์กรนี้มีแต่คนรุ่นใหม่ไฟแรงที่ทักษะสูงและมีมุมมองใหม่ๆเกี่ยวกับการพัฒนา AI และที่สำคัญก็คือการพัฒนา AI ขึ้นมาโดยมีพื้นฐานความเข้าใจภาษาจีนและวัฒนธรรมจีนเป็นอย่างดี

เส้นทางสู่ผู้สั่นสะเทือนวงการ

เส้นทางของ DeepSeek เริ่มต้นขึ้นในเดือนพฤศจิกายน 2023 ด้วยการเปิดตัว “DeepSeek Coder” โมเดลเอไอแบบ open-source โมเดลที่เชี่ยวชาญ “งานเขียนโค้ดคอมพิวเตอร์” โดยเฉพาะหลังจากนั้น DeepSeek ก็ปล่อย “DeepSeek LLM” โมเดลภาษาขนาดใหญ่ (Large Language Model:LLM) ขนาด 67B พารามิเตอร์ที่สามารถสื่อสารด้วยภาษามนุษย์ได้อย่างเป็นธรรมชาติออกมา

จากนั้น DeepSeek ปล่อย “DeepSeek-V2” ในเดือน พฤษภาคม 2024 โมเดลเอไอที่มีประสิทธิภาพสูงและมีราคาไม่แพง ซึ่งโมเดลนี้กลายเป็นจุดเริ่มต้นของ “สงครามราคา​ AI จีน” ที่ทำเอาหลายบริษัทใหญ่ในจีนอย่าง ByteDance, Tencent, Baidu รวมถึง Alibaba ต้องลดราคา AI ของตัวเองลงมาเลยทีเดียว

จากนั้น DeepSeek ก็เปิดตัว DeepSeek Coder ตัวอัพเกรดอย่าง “DeepSeek Coder-V2” ตามมาด้วยโมเดลล่าสุดอย่าง “DeepSeek-V3” และ “DeepSeek-R1” ที่เปิดตัวในเดือนมกราคม 2025 ที่ผ่านมา

DeepSeek R1 โมเดลเอไอผู้ท้าชิง OpenAI-o1

DeepSeek R1 คือโมเดล LLM รุ่นใหม่ล่าสุดจาก DeepSeek ถูกออกแบบมาให้มีความสามารถในการ “วิเคราะห์เชิงเหตุผล” และการ “แก้ปัญหาที่ซับซ้อน” ได้สามารถคิดวิเคราะห์และแก้โจทย์ยากๆ ได้อย่างเป็นขั้นเป็นตอน จุดเด่นของ DeepSeek R1 คือการใช้สถาปัตยกรรมแบบผสมผสาน (hybrid architecture) และวิธีการให้เหตุผลแบบ “chain of thought” ซึ่งคล้ายกับการทำงานของ GPT แต่ DeepSeek R1 มีความโดดเด่นในเรื่องของประสิทธิภาพและมีราคาที่ถูกกว่าเพราะใช้ต้นทุนน้อยกว่า

เมื่อต้นทุนของ DeepSeek R1 ต่ำกว่าคู่แข่งนั่นทำให้ราคาของการเชื่อม AI สำหรับโมเดล DeepSeek R1 นั้นเรียกได้ว่าถูกที่สุดในตลาดก็ว่าได้เพราะมีราคาเพียง 0.55 ดอลลาร์สหรัฐต่อ 1 ล้าน input tokens และ 2.19 ดอลลาร์สหรัฐ ต่อ 1 ล้าน output tokens เปรียบเทียบกับราคาเชื่อม API ของ OpenAI ซึ่งเป็นขุมพลังของ ChatGPT จะมีค่าใช้จ่าย 15 ดอลลาร์และ 60 ดอลลาร์สำหรับ input และ output token ในปริมาณเท่ากันตามลำดับ เรียกว่าราคาต่างกันลิบลับ

ราคา DeepSeek-R1

ด้วยราคาเท่านี้นั่นทำให้ DeepSeek R1 ดึงดูดลูกค้าได้มากกว่าอธิบายง่ายๆก็คือเหมือนการได้ “รถสปอร์ต” ที่ทั้งแรงและประหยัดน้ำมันในคันเดียว นี่ยังไม่นับรวมถึง การที่ Deepseek เปิดให้บุคคลทั่วไปใช้งานโมเดล AI บางรุ่นได้ฟรี สามารถดาวน์โหลดไปใช้เองได้เลย ไม่ต้องพึ่งพาเซอร์เวอร์ของคนอื่นในการเก็บข้อมูล เหมาะสำหรับคนที่ต้องการความเป็นส่วนตัวสูง

ทำไม DeepSeek มีต้นทุนต่ำแถมไม่ต้องพึ่งชิปสหรัฐ

การพัฒนาโมเดล AI จำเป็นต้องใช้ Chip ประมวลผลประสิทธิภาพสูงมาใช้เป็นจำนวนมาก แต่คำถามก็คือ ทั้งๆที่สหรัฐคว่ำบาตรทางการค้ากับจีนไม่ให้บริษัทจีนเข้าถึง Chip ประสิทธิภาพสูงของสหรัฐได้แล้วทำไม DeepSeek จึงสามารถพัฒนาโมเดลเอไอมีประสิทธิภาพเทียบเท่าโมเดลจากบริษัทยักษ์ใหญ่ได้

เรื่องนี้มีอยู่หลายเหตุผล โดยเฉพาะการพัฒนาโมเดล AI โดยใช้เทคนิคต่างๆที่ลดต้นทุนได้เช่น เทคนิค Reinforcement Learning (RL) การฝึก AI ด้วยแรงจูงใจเช่นการให้รางวัลเมื่อทำถูกและลงโทษเมื่อทำผิดแบบเดียวกับการฝึกฝนผ่านประสบการณ์ของมนุษย์

เทคนิค Mixture-of-Experts Architecture (MoE) คือการแบ่ง AI เป็นผู้เชี่ยวชาญหลายๆ ด้าน เหมือนทีมแพทย์ที่มีทั้งหมอหัวใจ หมอสมอง แล้วเรียกมาตอบสนองแล้วแต่ปัญหา การใช้เทคนิค Multi-Head Latent Attention (MLA) คือการทำให้ AI โฟกัสสิ่งสำคัญได้หลายจุดพร้อมกัน เหมือนเราดูหนัง ฟังเพลง อ่านไลน์ ได้พร้อมๆกัน

รวมถึงเทคนิค Distillation เพื่อถ่ายทอดความรู้จากโมเดลขนาดใหญ่ไปยังโมเดลขนาดเล็ก ทำให้สามารถสร้างโมเดล AI ที่มีประสิทธิภาพโดยใช้ทรัพยากรน้อยลงได้

นอกจากนี้ DeepSeek ยังใช้การร่วมมือกับพันธมิตรอย่าง AMD ซึ่งเป็นผู้ให้บริการโซลูชั่นคอมพิวเตอร์ประสิทธิภาพสูง  โดยใช้ AMD Instinct GPUs และซอฟต์แวร์ ROCM (เทคโนโลยีที่ไม่ได้อยู่ภายใต้ข้อจำกัดการส่งออกของสหรัฐฯ ที่ควบคุมการขายชิประดับสูงไปยังจีน) ในการพัฒนาโมเดล AI  ความร่วมมือนี้ช่วยให้ DeepSeek เข้าถึงฮาร์ดแวร์และซอฟต์แวร์ที่จำเป็นในการพัฒนา AI โดยไม่ต้องพึ่งพาชิประดับสูงจากสหรัฐฯ

ความท้าทายที่ DeepSeek ต้องเจอ

เครดิตสำหรับบทความข่าว: Mojahid Mottakin / Shutterstock.com

แม้ DeepSeek จะเป็นบริษัท AI ที่มีศักยภาพสูง แต่ก็ต้องเผชิญกับความท้าทายมากมายในตลาด AI โลกที่มีการแข่งขันอย่างดุเดือด หนึ่งในความท้าทายที่สำคัญคือ “ข้อจำกัดด้านการประมวลผล” แม้ว่า DeepSeek จะแสดงให้เห็นถึงประสิทธิภาพในการใช้ทรัพยากรที่มีอยู่ แต่การเข้าถึงเทคโนโลยีชิปประมวลผลขั้นสูงจะช่วยให้ DeepSeek สามารถพัฒนาโมเดล AI ได้เร็วและมีประสิทธิภาพมากยิ่งขึ้นได้ 

อีกเรื่องคือ “การสร้างความน่าเชื่อถือ” เพราะการจะก้าวขึ้นมาเป็นที่ยอมรับในระดับเดียวกับ OpenAI หรือ Google นั้น  DeepSeek จำเป็นต้องพิสูจน์ตัวเองอย่างต่อเนื่อง  ทั้งในด้านประสิทธิภาพของโมเดล AI  ความน่าเชื่อถือของบริการ  และการสร้างความสัมพันธ์ที่ดีกับลูกค้า โดยเฉพาะอย่างยิ่งการเป็นบริษัทเทคโนโลยีจากจีนที่ไม่ค่อยจะมีชื่อเสียงในแง่บวกมากนัก โดยเฉพาะเรื่องการ “เซ็นเซอร์” จากรัฐบาลจีน และยังไม่นับการแข่งขันที่ดุเดือดในตลาด AI ที่พัฒนาไปอย่างรวดเร็วในปัจจุบัน

การปรากฏตัวของ DeepSeek ในฐานะผู้เล่นใหม่ที่เข้ามา Disrupt ตลาด AI ของโลกสามารถพัฒนาโมเดล AI อย่าง DeepSeek R1 โมเดลให้มีประสิทธิภาพเทียบเท่ากับบริษัทยักษ์ใหญ่ในสหรัฐอเมริกาครั้งนี้นับว่าเป็นสิ่งที่น่าจับตามองเป็นอย่างยิ่ง ไม่เฉพาะความสำเร็จของบริษัทจีนบริษัทหนึ่งเท่านั้น แต่นับเป็นความสำเร็จครั้งสำคัญของรัฐบาลจีนเองด้วย ที่สามารถพัฒนา AI โดยไม่ต้องพึ่งพาเทคโนโลยีจากสหรัฐฯ ท่ามกลางการแข่งขันของ 2 มหาอำนาจ เปรียบได้กับ “มวยรอง” ที่ฝึกฝนตัวเองจนสามารถสู้กับ “แชมป์โลก” ได้อย่างสมศักดิ์ศรีก็ว่าได้

ที่มา: Forbes, Global Times, Business Today


  • 36
  •  
  •  
  •  
  •