Yapay zeka iş yüklerinin geleneksel uygulama iş yüklerinden farklı gereksinimleri vardır. Dinamiktirler ve bilgi işlem ve bellek gereksinimleri açısından büyük farklılıklar gösterebilirler. Ray Autoscaler’a yaptığımız katkı sayesinde artık açık kaynaklı bir yapay zeka iş yükü planlama projesi olan Ray‘in ve veri merkezlerini global olarak yönetmek ve düzenlemek için güvenilir bir platform olan vSphere‘in güçlü yanlarını bir araya getirebilirler. Bu yazımda bir vSphere clusterında Ray clusterının nasıl kurulacağını kısaca göstereceğim.
vSphere giriş yaptıktan sonra bir debian linux vm makina oluşturuyoruz.
Resim-1
Terminal konsolu açtıktan sonra aşağıdaki komutları sırası ile çalıştırıyoruz.
conda activate python310
cd /home/holuser/ray-on-vsphere/modules/module-1
ray up vsphere_hol.yaml -y –no-config-cache
Resim-2
Verdiğimiz connection bilgisi ile yeni bir browser sayfa açıp ip adresi:8265 olarak giriş yapıyoruz, burada https olarak dener iseniz sayfa gelmeyecektir, çünkü sertifika basılmamıştır. Bu sebeple http olarak gitmenizi tavsiye ederim. Ray sayfamızda jobs,serve,cluster durumlarını hepsini tek bir alandan görebiliriz.
Resim-3
Oluşturduğumuz cluster’ları bu alanda görebilir cpu ve memory durumlarını optimize edebiliriz.
Resim-4
Ayrıca jobs çalıştırmak için tekrar terminalimize geri dönüyoruz ve aşağıdaki komutları çalıştırdığımızda jobs panelinden görebileceğiz.
cd /home/holuser/ray-on-vsphere/modules/module-2
ray job submit –working-dir . — python hello_world.py
Resim-5