Yandex, yeni dil eğitim aracı YaFSDP'yi tanıttı

Yandex, yeni dil eğitim aracı YaFSDP’yi tanıttı

Küresel teknoloji şirketi Yandex, büyük dil modellerinin (Large Language Model-LLM) eğitimi için yeni ve açık kaynaklı yöntemi YaFSDP'yi tanıttı.

Techno Tester tarafından yayınlandı

12 Haziran 2024, 15:45 yayınlandı 3 Aralık 2024, 20:54 güncellendi

2.312

Küresel teknoloji şirketi Yandex, YaFSDP’yi dünya çapındaki (Large Language Model-LLM) geliştiricilerinin ve yapay zeka meraklılarının kullanımına açtı. LLM’lerin eğitimi zaman alıcı ve yoğun kaynak gerektiren bir süreç oluyor. Kendi LLM’lerini geliştirmek isteyen makine öğrenimi mühendisleri ve şirketler, bu modellerin eğitimi için önemli miktarda zaman ve GPU kaynağı, dolayısıyla da para harcamak zorunda kalıyor. Model ne kadar büyükse, eğitimi için gereken zaman ve masraf da o kadar artıyor. Yandex YaFSDP, GPU iletişimindeki verimsizliği ortadan kaldırarak GPU etkileşimlerini kesintisiz hale getiriyor ve eğitimin yalnızca gerektiği kadar işlem belleği kullanmasını sağlıyor.

Verimliliğin artmasına katkıda bulunmak heyecan veriyor

Yandex’te kıdemli geliştirici olarak görev yapan ve YaFSDP’nin arkasındaki ekibin parçası olan Mikhail Khruschev, “Şu anda YaFSDP’nin çok yönlülüğünü genişletmek için çeşitli model mimarileri ve parametre boyutları üzerinde aktif olarak deneyler yapıyoruz. LLM eğitimindeki gelişmelerimizi küresel ML topluluğuyla paylaşmaktan, dünya genelindeki araştırmacılar ve geliştiriciler için erişilebilirliğin ve verimliliğin artmasına katkıda bulunmaktan heyecan duyuyoruz” dedi.