Şimdi Ara

Single ve Double Precision

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
1 Misafir - 1 Masaüstü
5 sn
5
Cevap
0
Favori
2.098
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
0 oy
Öne Çıkar
Sayfa: 1
Giriş
Mesaj
  • Single ve Double Precision hakkında bilgi verir misiniz ? Neden GIGAFLOP Double Precision'da Single Precision'a göre çok düşüyor ? Nedir bu SP ve DP ???



  • Soruya gel
    Üni bırakalı çok oldu, zaten konuyu bilmiyorum şöyle biraz sallama olarak yorum yapayım, belki fikir verir.

    Single denilen 32 bit verileri, 32 basamaklı verileri kullanıyor diyelim, double denilen 64 bit, 64 basamaklı verileri (binary denilen zırvaya dayanıyor muhabbet- 10101110110110101101).
    Şimdi 0.23452345234634563456237456923754239745234590374859275
    gibi bir veri üzerinden işlem yapmak mı kolaydır
    yoksa 0.66 gibi bir sayı üzerinden işlem yapmak mı?

    Daha az veri daha hızlı işlenir, doğal olarak daha çok veri yavaş hesaplanır ama daha kesin sonuç verir.

    Double daha çok cache, bellek, bandwith denen zırvaları kullanır single'a göre.
  • Ekran kartı ve GPU için sorduğundan dolayı, GPU'da grafik işlemlerini 32bit şekilde işleyen yapılar var. 64 bit içinde ya özel bir 64 bit devresi var, veya 32bit yapılar kendi aralarında gruplanıp 64 bit'i emüle ederler,(devre dediğim şeyler stream processor, cuda core, shader vs. hepsi için ortak anlamda kullandım).

    Oyun için 64 bit kullanılmaz, hesap kitap işleri için kullanılır. 3d de çizim tasarım vs. için gerçekten ihtiyaç varsa kullanılır.

    32bit devre sayısı daima 64 bit devre sayısından daha fazladır, esasen bu yüzden SP performansı DP'den daha yüksektir. Atıyorum 16 tane 32bit devreye karşı 1 tane 64 bit devre içerirse bu durumda DP performansı 1/16 SP performansı olur, Nvidia da olduğu gibi.

    İlave olarak Nvidia için bu süper bi pazarlama stratejisine dönüşür, DP ihtiyacı için farklı kartlar satmasına imkan verir. Tesla için DP= 1/2 SP performansı verip GTX480 için mesela 1/8 SP olması gibi. Şimdiki Keplerde bu 1/24 oranında. Nvidia herşeyini 32bit e vermiş durumda. Bi matris çarpımında 32 bit için gtx680 , 480 580 tesla 2070'in üstünde performans gösterirken, 64 bit için hepsinden çok çok daha kötü performans gösterir. Kepler Tesla için ise her 3 tane fp32 cuda core için 1 tane fp64 cuda core olacak. Böylece binlerce dolara satabilecek kartı. 2010'dan beri Kepler kepler diyen bi sürü elemanın Keplerin çıkması ile nasıl hayal kırıklığına uğradığını bilemezsin. Tek avuntulu yanları güç tüketiminin uygun olması, 2 gpu'lu kart ile (gtx690) 580'in üstünde tesla 2070 civarında performans vermesi. K10 zaten fp32 performansı düşünülere çıkartıldı.

    İlave olarak kartın mimarisi hassasiyeti etkiler. Mesela Nvidia'nın Fermi ile MAD/MADD'den FMA'ya geçmesi gibi. Hesap yaparken FMA daha doğru sonuçlar üretir vs.

    Özel bi ihtiyaç olmadığı sürece DP performansı genelde önemsenmemesi gereken bişey, kararını çok fazla etkilememeli. Özel bi için istemiyorsan, 3d ile ilgilenmek istiyorsan AMD şimdilik daha iyi bi seçim. Özellikle de Autodesk'in programlarını kullanacaksan çok verim alırsın, alan herkez memnun.



    < Bu mesaj bu kişi tarafından değiştirildi Rubisco -- 9 Ağustos 2012; 11:26:44 >




  • quote:

    Orijinalden alıntı: Rubisco

    Ekran kartı ve GPU için sorduğundan dolayı, GPU'da grafik işlemlerini 32bit şekilde işleyen yapılar var. 64 bit içinde ya özel bir 64 bit devresi var, veya 32bit yapılar kendi aralarında gruplanıp 64 bit'i emüle ederler,(devre dediğim şeyler stream processor, cuda core, shader vs. hepsi için ortak anlamda kullandım).

    Oyun için 64 bit kullanılmaz, hesap kitap işleri için kullanılır. 3d de çizim tasarım vs. için gerçekten ihtiyaç varsa kullanılır.

    32bit devre sayısı daima 64 bit devre sayısından daha fazladır, esasen bu yüzden SP performansı DP'den daha yüksektir. Atıyorum 16 tane 32bit devreye karşı 1 tane 64 bit devre içerirse bu durumda DP performansı 1/16 SP performansı olur, Nvidia da olduğu gibi.

    İlave olarak Nvidia için bu süper bi pazarlama stratejisine dönüşür, DP ihtiyacı için farklı kartlar satmasına imkan verir. Tesla için DP= 1/2 SP performansı verip GTX480 için mesela 1/8 SP olması gibi. Şimdiki Keplerde bu 1/24 oranında. Nvidia herşeyini 32bit e vermiş durumda. Bi matris çarpımında 32 bit için gtx680 , 480 580 tesla 2070'in üstünde performans gösterirken, 64 bit için hepsinden çok çok daha kötü performans gösterir. Kepler Tesla için ise her 3 tane fp32 cuda core için 1 tane fp64 cuda core olacak. Böylece binlerce dolara satabilecek kartı. 2010'dan beri Kepler kepler diyen bi sürü elemanın Keplerin çıkması ile nasıl hayal kırıklığına uğradığını bilemezsin. Tek avuntulu yanları güç tüketiminin uygun olması, 2 gpu'lu kart ile (gtx690) 580'in üstünde tesla 2070 civarında performans vermesi. K10 zaten fp32 performansı düşünülere çıkartıldı.

    İlave olarak kartın mimarisi hassasiyeti etkiler. Mesela Nvidia'nın Fermi ile MAD/MADD'den FMA'ya geçmesi gibi. Hesap yaparken FMA daha doğru sonuçlar üretir vs.

    Özel bi ihtiyaç olmadığı sürece DP performansı genelde önemsenmemesi gereken bişey, kararını çok fazla etkilememeli. Özel bi için istemiyorsan, 3d ile ilgilenmek istiyorsan AMD şimdilik daha iyi bi seçim. Özellikle de Autodesk'in programlarını kullanacaksan çok verim alırsın, alan herkez memnun.

    Teşekkürler açıklayıcı cevabınız için. Anladım olayı. Mesela dün Quadro K5000 modelini piyasaya sürmüş nVidia (Kepler tabanlı). SP gücü 2.1 TFLOP iken DP gücü sadece 80 GFLOP. Quadro 4000'in ise (Fermi tabanlı) SP gücü 486 GFLOP, DP gücü 243 GFLOP. Mesela 3ds Max, AutoCAD tarzı programlara çizim,render yapacak, hiç oyun oynamayacak bir kişinin sizce SP gücüne mi DP gücüne mi bakması lazım ?

    EKLEME: Şimdi baktım da HD 7970'in SP gücü 3.79 TFLOP, DP gücü 947 GFLOP. Bu kartı almak çok daha mantıklı gibi geldi bu tip işler için.



    < Bu mesaj bu kişi tarafından değiştirildi _MaxPayne_ -- 9 Ağustos 2012; 11:40:16 >




  • Hiçbirine, ama fikir sahibi olmak için fp32 yani SP'ye. Daha sonra da mümkün mertebe google üstünde test sonuçları arayp karşılaştırmaya çalışıp kafada bişeyler oluşturmaya çalışmak lazım. Çünkü fp32 performansı mesela shader/stream processor/cuda core vs. den kaynaklanır. Sen tutup 10milyon poligondan bahsediyorsan bunun hiçbi önemi yok. Öncelikle kartın geometri setup unitesinin güçlü olması gerekli düzenlemeyi vs. yapması lazım. Quadro ile GTX'i ayıran yerlerden biri bu zaten, belli bi poligon sayısına kadar Quadro fark yaratabiliyor, ama çok çok yüksek seviyeler için bi Quadro 4000 de uyduruk bi kartın seviyesinde yerlerde sürünebilir(%100 emin değilim de mesla 25-30milyon poligon gibi).

    Bence farklı açılardan da bakmak lazım. Mesela öğrenme amacı mı güdüyorsun yoksa belli bi deneyimin var yarı pro olarak para kazanma peşine mi düşeceksin gibi. Eğer öğrenme aşamasında ise her türlü en orta kararlı bi sistem fiyat performans odaklı olması en doğrusu olur. Hem kendini geliştirirsin, hemde nelere ihtiyacın olduğunu görürsün, hemde daha büyük işler için ne kadar fiyat / zaman / performans ihtiyacın olduğunu anlarsın.

    Amatör olarak uğraşıp bana göre çok iyi işler yapanlar var hiçbirininde süper kartları yok mesela. Diğer taraftan da GTX serisi ile ekmek yiyenler de var. Konum olarak nerede durduğun neyi amaçladığın bence hepsinden önemli. Hani önceden bi yerde dediğim gibi , adam tasarımcı anlamaz bilmez, 3dsmax yerine Blender kullanıyor belli bi nedenden dolayı. Blender açık kaynak olduğundan şans eseri duyar, yeni compiler ile farklı ayarlarla derlediğinde kaynak kodunu %50 hızlanma var diye okur, onun peşine düşer. Tasarım dışında bilgisayarla çok alakası olmayan eleman araştırır öğrenir, Blenderı farklı compiler ile derleyip performans artışı elde edebilir hale gelir. Yani araştırıp öğrenmenin yeri yurdu sonu yok, hiç alakasız insan bile tutup compilerlar arasındaki performans farkının peşine düşebiliyor.

    O yüzden dediğim gibi baştaki amaç nedir, para kaznmak için mi yoksa amatör tarzı uğraşmak içinmidir, yoksa küçük bi firma var en uygun fiyatlı ne yapabiliriz gibi bi tür ön araştırma gibimidir hepsi için farklı yaklaşmak lazım.

    Alakasız örnek : Hep bu pro kartlar için 7/24 çalışma yüküne uygun olarak tasarlanıyorlar derler dimi? Oysa tüketici kartları için kimse 24 saat oyun oynamayacak o yüzden o tür 7/24 yük altında çalışmak için tasarlanmazlar derler. Bitcoin kasanların kartları 7/24/365 çalışıyor mesela %100 yükte (furmarktaki kadar ısınıyor yani). Öyle langır lungur kartları bozulmuyor kimsenin mesela.

    K5000 için, mesela 1/24 FP32 performansı var, bu kartın 1/2 fP32 performansı olan Quadro 5000 den çok daha kötü olacağı anlamına mı geliyor mesela? Çoğu durum için hayır. Ben GTX680 den tam detaylı olark ne farkı var bilmiyorum ama birileri alıp test edince görebiliriz ancak sanırm.




  • Yapay Zeka’dan İlgili Konular
    Daha Fazla Göster
    
Sayfa: 1
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.