Deepseek R1 modeli dünya yapay zekası sadece ucuz olması ve state-of-the-art performansı ile insanları etkilemedi. Bunun yanında modelleriyle birlikte paylaştıkları araştırma makaleleri OpenAI o1/o3 gibi düşünebilen yapay zeka modellerinin düşük maaliyetle nasıl yapılabileceğini herkese ücretsiz olarak gösterdi.
Bugün Deepseek R1’a giden yolda Çin^den çıkan yapay zeka şirketi önce Deepseek V3’ü, ardından R1-Zero modellerini geliştirdi. Deepseek R1’ın başarısını anlamak için şirketin bu gelişim sürecindeki kritik teknolojileri anlamalıyız.
Bu videoda Deepseek’in başarıya giden yolda kullandığı mixture of expertise(MoE) mimarisini, veri seti olmadan reinforcement learning ile düşünebilme yeteneğinin nasıl kazandırıldığını ve damıtma yöntemiyle küçük dil modellerinin nasıl R1 gibi iyi performans gösterebileceğini konuşacağız. Hem de hepsi sadece 5 dakikada.
İçindekiler
00:00 Deepseek Nasıl Çalışır?
00:08 Deepseek V3 Mimarisi: Mixture of Expertise
01:16 Düşünebilen Yapay Zeka Nedir? (Chain of Thought)
02:10 Deepseek R1-Zero Nasıl Çalışır?
02:21 Reinforcement Learning Nedir?
02:44 Aha Moment: Veri Seti Olmadan Düşünebilen Yapay Zeka
03:29 Deepseek R1-Zero’nun Sorunu Ne?
04:05 R1’dan LLama ve Qwen’e Distillation(Damıtma)