Şimdi Ara

AMD Mantle Hakkında Her Şey (13. sayfa)

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
2 Misafir - 2 Masaüstü
5 sn
1.338
Cevap
19
Favori
63.607
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
5 oy
Öne Çıkar
Sayfa: önceki 1112131415
Sayfaya Git
Git
sonraki
Giriş
Mesaj
  • Tugrul_512bit kullanıcısına yanıt
    Yazdığın kısımlar doğru. CL Cuda versiyon CB bekleyecez, ama o da temel olarak CPU test eden bişey olmayacak. Kodlarken yine mimari yapıya uygun kodlanması. Ama sonuna kadar donanıma uydurmaya çalışacam diye kıvranman gerekmeyecek. Belli guideline'lar flan olacak, onlara uyduğun sürece o HSA altyapsının daha iyi optimize etme ihtimali yükselecek. Salt CL ile 1 sene çalışıp 100 birim perf alıyorsan, HSA ya uygun kodlama imkanları ve araçları ile mesela 2 ay çalışp 90 birim perf alacaksın. 1 ay daha çalışıp ince opt. kasıp belki 100 birim perf alacaksın. Aradaki esas belirleyici fark o. Eğer altyapıya uygun şekilde yazılmışsa (hem mimarinin yeteneklerine uygun, hemde bu HSA platformuna uygun), türlü türlü optimizasyon ile uğraşıp vakit kaybetmeyeceksin. Bu aynı zmanda esneklik sağlayacak. Guideline'lara uygun yazdığın zman, altyapı, farklı mimarilere uygun optimizasyon işinin büyük kısmını verimli şekilde yapacak. Sen yukardaki örnekte GCN için ayrı Vliw için ayrı kod yapıları hazırlamak zorundasın CL ile full optimize iş yapmak istiyorsan. Dahası, daha fazla kontrol lazım diyip AMD_IL üstünden de daha düşük seviyeli geliştirme peşine düşebilirsin. Ama bu ilave iş yükünün çok büyük boyutlarda artması demek. Bugün zaten böyle farklı mimarilere özel sonuna kadar optimize edilmiş üretelim peşinde değiller. CL / C vs. gbi yapıların temeldeki amacı 1 kod yaz uyumlu heryerde verimli çalışsın. Ama perf anlamında öyle olmuyor, o mimariye uygun yazılması gerekiyor. Kodda onu yapmak dert olduğundan, o işi compiler yükleniyor, otomatik olarak o mimariye en uygun kod yapısını kurmaya çalışıyor. Bugün compilerlar çok gelişmiş ama, ister CPU üstünde x86 asm de, ister GCN üstünde GPU ISA asm de, elle optimize ettiğin şeylerde hala compilerı yenebiliyorsun. Sana x86'da 20 satır kod için 2.5 güne patlıyor ama compilerın ürettiği asm çıktığınısı 2-4 kat yenebilen kod üretebiliyorsun. Ama bu basit bi rutin için 2.5-3 güne patlıyor. O zamanda işin içine işte optimize Librarayler giriyor. Agner Fog'un mesela x86 SSE/AVX/AVX2 için çok süper açık bi librarysi var. Bi sürü çok kullanılan fx asm optimize olarak yapılmış. Yada AMD'nin Bolt'u gibi, bi sürü temel kullanılan şeyler için hazır ortam var. Veya açık kaynak yaptığı cl için FFT / Blas libraryleri gibi.

    1 adım gerisine dönersek, adam gibi perf istiyorsan elle mimariye özel opt. peşine koşman lazım. HSA'da ise, bütün kurallara uyduğun takdirde yazdığın kodun, farkı mimarilere uydurulma çok iyi otomatik olarak opt. edilme şansını arttırıyor olacaksın. Sen max. oranda kurallara uymaya çalışcaksın, yine genel anlamda kulağa mantıkllı gelen optimize ana kod yapısı ile çalışacaksın. HSA altyapsı o üstünde çalıştığı mimariye göre opt. sini yapcak. 1 sene yerine 3 ayını alacak o zman. Her halükarsa HSAiL'e müdahele etme şansın var, yani HSA altyapısının olşturduğu sanal ISA kodunu ben biraz daha elle iyileştirebilirim deme imkanın da var. Dahasını istersen AMD_IL'ye de inersin AMD kart kullanan sistemlerde. Ama HSA'nın amacı, bu tarz low level olayn peşine gidilmesin, elle o alt seviyeli şeylerin peşinde koşulmaması.

    CB'yi CL/Cuda için mesela 1 senede yazabiliyorlar ise, HSA'ya uygun olarak 3-4 ayda yazacaklar, perf'i de %100 CL temelinde yazılmış durum ile aynı seviyelerde olcak. Artan zaman yüzünden belki daha iyi bişeyler bulunup hızlandırma imkanları da olabilecek.

    Başka kerneller çağırabilecek. CL 2.0 da unified desteği de var. Bundan en çok yararlanacak şey de APU tarzı yapı zaten. Elde de tek üyesi Kaveri var. Önceden yazdığın 12 core Xeon ile başedebilir mi, neyin ne kadar ihtiyaç duyulacağı ile ilgili. Cl 2.0 Kaveride ne sorun yaşar, coherency konsollardaki gibi beklenmedik ölçüde latency yüzünden baltalanır mı toplam perf'i düşürür mi bilemiyorum. Ama işin esas kısmı FMA ile yapılacağından, buna rağmen %55-60 teorik kapasitede çalışacağını varsaysan Kaveri'nin teorik olarak 12 core 3 ghz Xeon ile başedebilmesi gerekir dersin. Ama bunun paralleştirmeye uygun bu tarz GPU render gibi işlerde olduğunu unutmadan. Diğer taraftan, Luxmark üstünden bakarsan 3930k ile 7970 arasındaki farkın 2-3 kat mertebelerinde olduğunu hatrlıyorum ben. Complex sahne için 7970, Dual E5 2697 v2'den (IB, 12 core, turboyla 3.0 ghz de) %15-20 civarlarında daha hızlı doğru biliyorsm. Sahne karmaşıklığı azaldıkça fark %50 lere kadar çıkıyor. Kaveri için de belli ölçeklenmeler çıkartılabilir bunlardan.




  • gpu doğru kullanıldığında cpulardan çok daha kompleks ve performanslı yanlış anlamıyorsam.peki yazılımlarda cpu yükü azaltılıp gpuya ağırlık verilse daha verimli sistemler olmaz mı?sadece gpu olamıyor bir sebeple bunu anlıyorum ama mesela nispeten düşük bir işlemci çekirdeği işletim sistemi yan ve arabirimleri kontrol etse sistemin toplam işlem gücü gpular üzerine yıkılsa mesela(nihayi manada bakarsak apu tarzı bir yapı da olabilir)
    önümüzdeki engel ne burada intel mi yoksa teknolojik yetersizlik mi?(veya engel mi diyelim)
    nvidianın tesla ile yapmaya çalıştığı bumuydu onu da yanlış anlamadıysam ama nvidia cpu olayı halledip apu olayını halledebilse çoktan benzer yapılar görebilirdik sanki,şimdi amd deniyor bunu galiba.ne kadar başarılı olur orası da muamma.cpu üretcisi olması ile nvidiadan biraz daha avantajlı bu konuda ama intel iş yükünü cpudan alıp gpuya aktarma işine pek sıcak bakmaz tahminim malumunuz sebeplerden.tabi neredeyse cpu sektöründe tekel diyebileceğimizden bahsettiğim tarz bir yapının bilişim sektöründe kendisini kabul ettirmesi de bu anlamda zor.




  • Rubisco kullanıcısına yanıt
    bahsettiğiniz zincirleme döngü olayı bu gelişimi çok yavaşlattı
    karşılıklı kazanç olunca herkes ağırdan almaya başladı
    mantle ı gibi bir apu nun yaygınlaşmamasındaki bir amaç bence pc yenileme işinin aynı akıcılıkta devam etmesi
    amd de de şu an hem cpu tarafında hem de gpu tarafında arkadan gelen firma olarak bunu ortaya çıkarması da ben bu oyunu bozarım ve pazar payımı artırırım düşüncesi olarak görüyorum
  • ilkerinanç kullanıcısına yanıt
    sadece cpu nun yapabildiği aritmetik işlemlerde var. ya da gpu dan kat kat hızlı olabildiği işlemler diyelim. sadece gpu da herşeyin yapılmaması öyle gizli engeller değil sadece yani
  • ilkerinanç kullanıcısına yanıt
    Aslında APU'lar tam da bu ihtiyaca yönelik olarak hazırlanmıştı. Şimdi yeni geliştirilen HSA da APU'lara yönelik işin yazılım ayağını üstlenmekte. Artık bir program bu mimariyi kullanarak işin belli kısmını APU işlemcisinin içindeki CPU'ya belli kısmını ise GPU'ya yaptırabilecek. Güzel bir performans artışı söz konusu.
  • quote:

    Orijinalden alıntı: Zero Limit

    sadece cpu nun yapabildiği aritmetik işlemlerde var. ya da gpu dan kat kat hızlı olabildiği işlemler diyelim. sadece gpu da herşeyin yapılmaması öyle gizli engeller değil sadece yani

    Mesela branş konusu GPU için verimsiz olduğundan

    if(a[i] >= b[i]) { c[i]+=d[i];  }


    yerine

    c[i]+=d[i]* sgn( sgn(a[i]-b[i])+1 );



    şeklinde sırf işlem halinde yazılarak hızlandırılamaz mı(sgn fonksiyonunun sadece bit işlemleri yaparak çalıştığını varsayarsak(gene if kullanmadığını varsayarak, mesela işaret bitini al ve tüm bitlere dağıt(32 tane)))? GPU olayında hem ana bellek hem ara bellek çok daha hızlı. Yazmaç sayısı zaten en az 10 kat, arabelleğin adreslenebilmesi de avantaj olabilir.



    < Bu mesaj bu kişi tarafından değiştirildi Tugrul_512bit -- 9 Ocak 2014; 17:14:56 >
  • işin tekniğini bilmem ama kodlar gereği gibi yazıldığında zor olmaz gibi geldi bana.dediğim gibi tekniğini bilmem programcılık konusunda bilgim yok...
  • şuan mesela ben r9 270x aldım, ama gtx 760 daha performanslı , mantle geldiği zaman r9 270x'in performansı mı artacak ? eğer artacaksa gtx 660ti yada gtx 760 yerine bir r9 270x daha mı iyi olur mantle yüzünden ?
  • quote:

    Orijinalden alıntı: sigaram

    şuan mesela ben r9 270x aldım, ama gtx 760 daha performanslı , mantle geldiği zaman r9 270x'in performansı mı artacak ? eğer artacaksa gtx 660ti yada gtx 760 yerine bir r9 270x daha mı iyi olur mantle yüzünden ?

    üstün falan değil denk kartlar az farkla birbirlerini geçerler nvidia destekli oyunlarda 760 geçer amd desteklilerde 270x geçer. mantle destekli oyunlarda gtx770 performansı verecek 270x.
  • tizar kullanıcısına yanıt
    üstün tabi gtx 660 ti bile şuan için r9 270x e çoğu oyunda fark atıyor gtx 760 tabiki r9 270x den üstündür. cidden gtx 770 kadar performans vereceğinden çok emin değilim biraz abartı olmadımı 770 sonuçta bin liralık ekran kartıyla 600 liralık ekran kartı aynı performansımı verecek mantle sayesinde ?
  • quote:

    Orijinalden alıntı: sigaram

    üstün tabi gtx 660 ti bile şuan için r9 270x e çoğu oyunda fark atıyor gtx 760 tabiki r9 270x den üstündür. cidden gtx 770 kadar performans vereceğinden çok emin değilim biraz abartı olmadımı 770 sonuçta bin liralık ekran kartıyla 600 liralık ekran kartı aynı performansımı verecek mantle sayesinde ?

    mantlenin tek olayi gpuyu hizlandirmak degil.dusuk islemci kullanimi var mesela.daha guzel goruntu iddialari var.su sistem mantle ile bu kadarken nvidia'nin bu sistemine denktir diyebilmek icin veri yok elimizde su anda ama becerebilirlerse mantle'nin gozle gorulur bir farkinin olmasini bekliyorum ama beceremezlerse zaten ufaktan konsol alma yollari gorunur bize.konsol+pc ortak yaptik dedikleri bf4 ortada.bundan sonra yapacaklari oyunlar da pc'ye bu kadar uyumsuz olacaksa mantle de kurtarmazsa yandigimizin resmidir o yuzden ben su olaya nvidia'yi da yalandan da olsa katin cikan butun oyunlar desteklesin diyip duruyorum.




  • Arkadaşlar 14.1 sürücüsü ile ilgili bazı bilgiler paylaşılmış bu sürücüye Mantle desteği geliyor, çıkış tarihi 2014'ün ilk çeyreği olarak gösterilmiş. Umarım erken bir tarihte gelir.

    http://www.guru3d.com/news_story/amd_catalyst_14_1_beta_loaded_with_new_features.html


    Great performance improvements in Battlefield 4

    Thanks to AMD’s Mantle!

    Additional Frame Pacing Enhancements

    4K and Eyefinity support on non-XDMA hardware

    Dual graphics support

    AMD TrueAudio support in Catalyst


     AMD Mantle Hakkında Her Şey




  • ayri baslik acmak yerine ana basliginda bu bilgiyi paylastiginiz icin tesekkur ederim.
  • quote:

    Orijinalden alıntı: .45 ACP

    ayri baslik acmak yerine ana basliginda bu bilgiyi paylastiginiz icin tesekkur ederim.

    7870xt mantle teknolojisini destekliyor mu?
    İlla R9 serisinden mi olmalı kartlar?
  • Renal Tebüler Nekroz kullanıcısına yanıt
    7000 serisi yani GCN mimarisine sahip tüm kartlarda Mantle destekleniyor.

    Bu arada Dice, Battlefield 4 için bugün beklenmedik bir yama yayınlamış, normalde yamalar salı günü yayınlanıyordu. Bu durum yarın için bir sürpriz beklentisine yolaçtı, bakalım...
  • arkadaşlar hafta sonu şu POWERCOLOR R9 270 TURBODUO GDDR5 OC 2GB 256BIT AMD RADEON DX11.2 EKRAN KARTI alıcam
    linkhttp://www.vatanbilgisayar.com/powercolor-axr92702gbd5-tdheoc-r9-270-turboduo-gddr5-oc-2gb-256bit-amd-radeon-dx112-ekran-karti/productdetails.aspx?I_ID=71305

    ekran kartını alıcam 500 tl %30 ile 470 tl ye geliyor nasıl bir ekran kartı birde mantle bu ekran kartına gelicekmi yardımlarınızı bekliyorum şimdiden saolun hayirli günler




  • CES'te AMD standında Mantle ile ilgili hazırlanan demo sistemiyle ilgili videolar nete düşmeye başladı. Nordichardware'in haberine göre videoda görülen sistem R9 M290X'e sahip bir MSI GX70 dizüstü bilgisayar ve 5760 x 1080 çözünürlüklü bir Eyefinity monitör düzenlemesinde Battlefield 4'ün Mantle versiyonunu grafik ayarları "yüksek" halinde 30 fps civarı oynatabiliyor. Ancak 10 dakika içinde oyunun iki kez çöktüğünü de belirtiyorlar.

    (http://www.nordichardware.se/CES2014/vi-spelar-mantle-versionen-av-bf4-i-eyefinity-pa-en-laptop.html)





  • quote:

    Orijinalden alıntı: Ottoman_Enes_TR

    arkadaşlar hafta sonu şu POWERCOLOR R9 270 TURBODUO GDDR5 OC 2GB 256BIT AMD RADEON DX11.2 EKRAN KARTI alıcam
    linkhttp://www.vatanbilgisayar.com/powercolor-axr92702gbd5-tdheoc-r9-270-turboduo-gddr5-oc-2gb-256bit-amd-radeon-dx112-ekran-karti/productdetails.aspx?I_ID=71305

    ekran kartını alıcam 500 tl %30 ile 470 tl ye geliyor nasıl bir ekran kartı birde mantle bu ekran kartına gelicekmi yardımlarınızı bekliyorum şimdiden saolun hayirli günler

    %30 yapmayabilirler yaparlarsa alabilirsin 270x ile arasinda saat hizi farki var sadece yoksa cipset ayni.mantle o kartta da olacak tabi.


    Father Torque

    Bugfield.




  • Mantle yamasının neden hala yayınlanmadığı da böylece ortaya çıkmış oldu sanırım...
  • quote:

    Orijinalden alıntı: Father Torque

    Mantle yamasının neden hala yayınlanmadığı da böylece ortaya çıkmış oldu sanırım...

    e tabi yani dogru duzgun calismayan oyuna yama cikarsan ne olacak millet bu sefer diyecek mantle de geldi hala cokuyor.amd'nin elinde hazirdir su anda surucu icinde verecegi mantle patch'i diyelim ama esas olan bf4'e yapilacak olan yama.oyun delik desik olunca mantle yamasina sira gelmiyor.ilk olmanin zorluklari bunlar pc+konsol ortak yapilan oyuna ilk kez mantle yamasi yapiyorsun kolay degil bunu bir hallederlerse anlasilan motorlarla yapilan oyunlarda cok kolaylik olur mantle'yi eklemek o yuzden bekleyelim 7 ay filan degil asparagaslara gelmeyin demo filan yapiyor adamlar notebookla 5000 kusur cozunurlukte demek ki bu mantle icadi nispeten dusuk sistemlerde oyunu oynatabilecek bir sey.betasinda islemcilerimizin nasil yarildigini hatirlatirim.yeni cikacak pc+konsol oyunlarda mantle destekli oyunlar en azindan islemciyi somurmese bana yeter tabi biraz da fps artisi verse hayir demem.20 oyundan cok olsun bir kac motorla daha anlassinlar istiyorum.iste bunlar hep bf4'te mantle'nin nasil olacagina bagli eger iyi giderse daha cok oyun motoruyla anlasirlar.




  • 
Sayfa: önceki 1112131415
Sayfaya Git
Git
sonraki
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.