Şimdi Ara

ATI ve NVIDIA PARALEL İŞ HATLARI FARKI

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
2 Misafir - 2 Masaüstü
5 sn
25
Cevap
1
Favori
1.408
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
0 oy
Öne Çıkar
Sayfa: 12
Sayfaya Git
Git
sonraki
Giriş
Mesaj
  • Merhaba arkadaşlar;

    Bilindiği gibi Pixel iş hattı ve vertex iş hatları ortadan kalktığından beri her iki işide yapan paralel iş hatları havada uçuşuyor,

    Aklıma takılan soru,
    ATI nin 800 iş hatlı GDR5 remli HD4870 i ve
    NVIDIA nın 240 iş hatlı GDR3 remli GTX280'i ne bakarsak GTX280 hatrı sayılır bir biçimde önde...

    Nasıl oluyor da ATI nin paralel iş hatları bu kadar berbat veya bu iş hatlarını heder eden nedir. GTX nasıl neredeyse 4 de 1 iş hattıyla ciddi anlamda HD4870 i geride bırakabiliyor... Tamam aradaki fark GPU ya da bağlı ama yani bu ATI ile GTX in kullandıkları paralel iş hatları arasında uçurumlar var gibi. GTX in iş hatları çok daha becerikli gibi, bunu açıklayabilecek arkadaşlar var ise lütfen sizin açıklamalarınızı bekliyorum.

    Şimdiden teşekkürler...



    < Bu mesaj bu kişi tarafından değiştirildi Menow -- 1 Kasım 2008; 1:45:29 >



  • İki ekran kartının shader mimarisi birbirinden farklıdır. Nvidia nın shader hızı biraz fazladır. Ati kartlarda aslında 160*5 shader düzeni ile 800 eder.


    Shader güçleri tam karşılaştırılabilir değilsede, sadece shader testi yapıldığında Ati Hd4870 GTX280 kartını geride bırakmaktadır.



    Lakin bir grafik kartında sadece shader birimleri bulunmamaktadır. TMU ve ROP adlı birimlerde ekran kartlarının gücünde önemli bir etkendir.


    GTX280 hem TMU sayısı olarak hem de ROP sayısı olarak HD4870 e göre ezici bir üstünlük sağlamaktadır.


    Burada da bilgisayarın temel mantığı devreye girer. Bu birimlerden yetersiz olanı kart için darboğaz yaratacaktır.


    Shader ağırlıklı oyunlarda Ati, Dokuların ön plana çıktığı oyunlarda da Nvidia daha başarılı olacaktır.



    Velhasıl kısaca söyleyecek olursak hem shader birimlerinin yapısının farklılığı, hemde ekran kartında Unified shader birimlerinden farklı yapılarda bulunduğunu düşünürsek Shader sayıları ile yapılan bir karşılaştırma tamamen mantıksız olacaktır.


    64 shader birimine sahip 9600gt nin, Ati nin 320 shadera sahip kartlarını geçtiğini unutmayalım. Bu sizin orandan bile daha kötü kalıyor. Mesela HD3870 kartlarının başarısızlığı sadece 16 TMU ya sahip olması ve bunun ciddi bir darboğaz yaratması idi. Özellikle AF açılınca deli gibi performans kaybetmesinin nedeni bu kartların bu eksik birimlerdi.



    < Bu mesaj bu kişi tarafından değiştirildi Naga Sadow -- 1 Kasım 2008; 1:57:47 >




  • iş hattı yada shader birimi yani unified shader:

    Shader birimi ilk olarak dx8 ile birlikte kullanıma sunulmuştur. Kartlar ise Nvidia'da GF 3 serisi ve Ati tarafında 8500'dür. O dönemdeki kartlarda iki farklı türde shader birimi bulumaktaydı. Bunlar; pixel shader ve vertex shader'lardır. Görevleri farklı olduğu için isimleri ve sayılarıda farklı idi. Vertex shader'lar nesnelerin boyutlarını ve geometrilerini hesaplarken, pixel shader'lar doku kaplamaları ile ilgili görevleri üstleniyorlardı. Pixel shader'lara genel olarak daha fazla iş düştüğü için, kartlarda pixel shader sayısı fazla olurdu. Mesela ilk dx8 kartlarda 2 adet pixel sharder bulunurken, vertex shader sayısı 1'di.

    Shader mimarisi ATI tarafında x19xx (r580) serisi ile Nvidia tarafında ise GF 8800 (g80) serisi ile değişmiştir (Nvidia çok daha köklü ve bambaşka bir mimari sunmuştur).

    Teknolojik anlamda yenilikler ise her zaman devam etmiştir. DirectX api'sinin gelişimiyle shader birimleri gittikçe daha fazla esneyebilir hale gelmişlerdir. Kartların desteklediği ve en bilinen shader sürümleri şu şekildedir:

    dx8 ile sahder model 1.1

    dx8.1 ile shader model 1.3

    dx9 ile shader model 2.0

    dx9.c ile shader model 3.0 (hdr)

    dx10 ile shader model 4.0

    dx10.1 ile shader model 4.1

    (Bunlar dışında sm 1.2, 1.4, 2.0a, 2.0b gibi sürümlerde vardır ancak yenilik sunmamış ve pek ilgi çekmemişlerdir.)

    ATI x1xxx serisi ile dx9.c'ye tam destek vermeye başlamıştır. Mevcut durumda GeForce 7 ve Radeon x1xxx serisi başabaş bir performans sergilemekteydiler (x1xxx serisi kartlar 128bit hdr derinliği ile hem hdr hemde AA açılımına ayı anda izin veriyordu, GeForce 8 serisine kadar Nvidia'da bu destek yoktu!).

    ATI shader birimlerinin sayısını yükselterek, gelecekteki oyunlarda daha yüksek performas vermeyi hedefledi ve bunu x19xx (r580) serisini üreterek yaptı. Stream işlemci de bu seri ile birlikte ortaya çıktı. r580 gpu'sunda 16 adet shader iş hattı bulunuyordu ancak bu shader iş hatlarının her birinde 3 adet shader ünitesi bulunuyordu. Bu da pixel shader sayısını 48'e çıkarıyordu (x1800'de de 16 adet iş hattı bulunuyordu ancak her iş hattında 1 adet shader ünitesi bulunuyordu. Ayrıca hem x18xx hem de x19xx kartlarda Vertex shader sayısı 8'di). ATI, gerçekten dediği gibi shader birimlerinin yoğun olarak kullanıldığı oyularda öne geçmiş ve GeForce 7 serisi kartları ezmişti! Shader birimlerinin sayısal üstülüğü kesinlikle performansı yükseltmişti!

    Nvidia ise GeForce 8 serisi ile ilk dx10 (sm 4.0) sedtekli ekran kartlarını yapmaktan öte çok daha yeni bir mimari geliştirdi. Bunun adı: Unified shader'dı (Birleştirilmiş gölge işlemcisi). Bu mimaride pixel shader ve vertex shader birimleri tek bir birim olarak adlandırıldı ve boyutları küçültüldü. Bu birimler işlenecek bilgiye göre görev alıyorlardı ve hangi işlem yoğun ise shader birimleri ağırlıklı olarak o görevi üstleniyorlardı. Yani pixel shader yoğunluklu görüntüde birimler bu işi yapıyor, vertex shader yoğunluklu görüntülerde vertex shader görevlerini üstleniyorlardı. (Ayrıca dx10 ile birlikte bir de geometri shader birimleri eklendi kartlara. Bunlarda cisimlerin fiziksel ve geometriksel değişikliklerini işlemciye bağlı olmadan, kartların kendi başlarına yapacakları anlamına geliyordu.) Ayrıca nvidia unified shader'ları gpu'dan ayrı çalışan birimler haline getirdi ve kartların shader birimlerinin hızını gpu'nun 2 katından daha yüksek bir hıza çekti (Yani küçük ama etkili shader birimleri). Nvidia GeForce 8800gtx (g80) kartı ile 128 unified shader bulunduran ilk dx10 destekli kartını piyasaya çıkardığında bomba patladı. Eski oyunlardaki performası ATI'nin 48 adet pixel shader ve 8 adet vertex shader bulunduran (shader birimleri, gpu ile aynı hızda çalışan) x1950xtx kartından %50 hatta yüksek performans veriyordu (3dmark2006'da %85 fark atıyordu).

    ATI ise stream işlemci dediğimiz mimari ile devam etti ancak o da shader birimlerini birleştirdi ve küçülttü. Toplamda 320 adet stream işlemcisi bulunan hd2900xt, Nvidia'nın 128 unifeid shader birimi bulunan 8800gtx'inin gerisinde kalıyordu. Nvidia'nın shader birimleri farklı hatlara ayrılmadığı için boş kalmıyor ve gpu'dan çok daha hızlı çalıştıkları için daha yüksek performans veriyordu. Kartın performansındaki bir diğer etken de Nvidia'nın mimarisini destekleyen oyunların sayısal üstünlüğüdür! Birçok oyun Nvidia'nın oyun programına dahil olduğu için, Ati kartlar geride kalır hatta bazılarında crossfire desteği bile bulunmaz (Crysis gibi). Ancak Ati'nin mimarisini destekleyen ve tarafsız olan oyunlarda Ati kartlar durumu biraz eşitler hale gelir. Mesela Call of Jures oyunu Ati desteklidir ve Ati bariz bir şekilde öndedir bu oyunda. ..

    Sonuç olarak shader birimlerinin sayıları kadar hızları ve mimarileri de önemlidir. Ayrıca oyun firmalarının vereceği destek de performansı belirleyecek etkenlerden biridir...

    alıntıdır.



    < Bu mesaj bu kişi tarafından değiştirildi F.@.T.İ.H -- 1 Kasım 2008; 1:57:38 >




  • Arada büyük fark yok. Ati 800 paralel iş hattı kullanmasına rağmen 5x160 şeklinde olduğu için desteklemeyen oyunlarda 160 iş hattı kullanıyor. Destekleyen oyunlarda ise büyük bir performans farkı ortaya çıkıyor. Bütün iş yazılımda bitiyor.
  • Öncelikle hiç üşenmeden bu denli yazı yazan arkadaşlara Çok teşekkür ederim, kafamda daha bi güzel şekillendi olaylar...

    "sdurust" kardeşim, okuduğum bir çok yazıda ROP ve TMU nun ekran kartına dar boğaz yapma durumunun çok eskilerde kaldığı söyleniyordu, halen daha ROP ve TMU nun dar boğaz yaptığına eminmisin acaba? Eğer bu kesin ise artık ROP ve TMU ya çok daha tikkat edeceğim.

    Ayrıca arkadaşlar bu ATI nin iş hattına 5 er adet iş hattı entegre etmesi olayı gerçekten her oyunda kullanılamıyorsa iş pekte hoş değil... Ayrıca NVIDIA nın iş hattı konusunda gerçekten ATI ye göre frekans üstünlüğü oldukça bariz... Ama buna rağmen Ati, Nvidia dan iş hatlarını daha çok küçültebilmiş gibi, buda her firimanın birbirinden üstünlüklerini ortaya koyuyor. Yani ATI ile Nvidia bir araya gelse çok daha süper kartların piyasada olacağı bir kesin ...



    < Bu mesaj bu kişi tarafından değiştirildi Menow -- 1 Kasım 2008; 2:15:46 >




  • Ağzından yel alsın hocam bunların 2si bi araya gelirse varya biz oyun moyun oynayamayız 64bit kartı 250ytl ye satar bu şersizler:)) Tetris oynarız
  • quote:

    Orjinalden alıntı: Promity

    Ağzından yel alsın hocam bunların 2si bi araya gelirse varya biz oyun moyun oynayamayız 64bit kartı 250ytl ye satar bu şersizler:)) Tetris oynarız

    O konuda haklısın

    Ben sadece teknolojik anlamda demek istedim
  • İkiside tamamen farklı mesela gtx280'deki toplam 240sp'nin herbiri içinde 1'er tane hesaplama birimi mevcut buna shader diyoruz toplamdada 240 shader yapıyor 4870'deki toplam 160sp içinde'de 160 shader hesaplayıcısı var ama bu hesaplayıcılarında içinde ayrıca 5'er tane daha hesaplayıcı var mimariler işte burada tamamen ayrılıyor toplamda 160*5 olduğunda 800 ediyor nvidia'da farklı olarak shader gpu'dan bağımsız 2 kat daha hızlı çalışıyor yani shader olarakda güçsüz denemez ati'ninkiler ise gpu hızında çalışıyor sdurust arkadaşımızın'da söylediği gibi sadece shader denilen hesaplayıcılar değil tmu ve rop denilen birimlerde önem taşımaktadır tmu'ların fazla olması doku ağırlıklı oyunlarda mesela crysis gibi oyunlarda kendini belli eder ati'de aa'yı shaderların çözdüğü biliniyor bu 5 hesaplayıcı bu işi yapıyor ama bazıları hala tüm shader'lar kullanılmıyor diyor nvidia'da ise aa'yı rop çözüyor bu yüzden eskiye göre daha iyi aa performansı sunması için gtx280'de 32 rop var yani her iki kartda güçlü gtx280 biraz daha iyi denilebilir oyunlar nvidia destekli olmasa 4870 gtx280'den daha güçlü olurdu demek yanlış



    < Bu mesaj bu kişi tarafından değiştirildi Cpt. Miller -- 1 Kasım 2008; 14:59:14 >




  • Bildiğim kadar ile Ati'nin shaderlari hemen hemen hiç bir zaman 800 adet olarak çalışamıyor. Ama hiç bir zamanda 160 adede düşmüyor.
    Ortalama 400-500 shader birimi belki ancak sürekli aktif olarak çalışıyordur. İşte burada oyunun kodlanması devreye giriyor. Eğer oyun tüm shaderleri çalıştırabilicek şekilde kodlanırsa ati kartlar mevcut performansının belkide iki katına yakın performans verecekler. En azından ben öyle biliyorum. Ayrıca Rop sayısının o kadar da bir önemi yok. Eğer bir GPU ya 16 rop yetiyorsa 50 tane koymanın bir getirisi olmuyor. Tıpkı bellek band genişliği olayı gibi. Ancak TMU ve TFU birimlerinde sayı arttıkça performans lineer bir şekilde artar mı yoksa onlarda da Rop daki gibi bir durum söz konusu mudur bilemiyorum.
  • ATi ninkisi aslında gerçek 800 değil dostum.160 işlemci var x5 de çarpan var.NVIDIA da böyle bir sistem yok.ATi satış stratejisi olarak bunu böyle yazıyor fakat şu da var ki 800 shader ın aynı anda kullanımı teknik detayını bilemeyeceğim fakat çok yerde okudum ki imkansız.


    Denk olmamaları farklı mimariden kaynaklanıyor denebilir.
  • atinin ki biraz geforce fx gibi 4x2 = 8

    düsünebilirsin

    ama nvidia da 240x1 ve 2 kat hızlı 480x1 gücünde gibi.
  • Şimdi çok daha iyi anlıyorum arkadaşlar çok sağolun... Herkese teşekkürler...

    Öte yandan aa görevini Nvidia da nasıl ROP lar üsleniyor da ATI de paralel iş hatları. Yani ROP larda bir nevi iş hattı mıdır??? Ben ROP ların açıklamalarını okumuştum ama unuttum. Sorum saçma ise kusuruma bakmayınız...



    < Bu mesaj bu kişi tarafından değiştirildi Menow -- 1 Kasım 2008; 13:36:02 >
  • quote:

    Orjinalden alıntı: Menow

    Şimdi çok daha iyi anlıyorum arkadaşlar çok sağolun... Herkese teşekkürler...

    Öte yandan aa görevini Nvidia da nasıl ROP lar üsleniyor da ATI de paralel iş hatları. Yani ROP larda bir nevi iş hattı mıdır??? Ben ROP ların açıklamalarını okumuştum ama unuttum. Sorum saçma ise kusuruma bakmayınız...



    TMU ve ROP ların darboğaz yapma durumu hala mevcuttur.


    Özellikle HD3870 kartının bazı durumlarda özellikle de AF açıldığında rezil sonuçlar vermesinin tek nedeni 16 TMU idi. Bu darboğaz oluşturuyordu. Mesela 8800gt de 56 TMU var bu mantıkla düşün.


    Ha diyeceksin HD4800 serisinde de 40 TMU var yine 8800gt den bile geride sayı olarak. Evet geride 8800gt 56 TMU biriminbe sahip 8800gts ve 9800GTX+ 64 TMU birimine sahip.


    E peki HD4850 40 TMU ya rağmen neden bir sorun olmuyor. Oda basit shadera oranla makul bir rakam demek ki, darboğaz yaratmıyor.



    TMU hangi oyunlarda daha önemlidir. Bunu anlayabilirmiyiz;

    Evet bunun bir yolu mevcut bir oyunda dokuların kalitesi çok iyi ise (ki gözle anlaşılabilir) birde bunun üstüne AF gibi doku filtrelemeleri de kullanacaksan bu TMU lar devreye girer.

    Mesela HD4800 serisi AA konusunda çok başarılıdır fakat aynı başarıyı AF konusunda göstermezler. Tabi HD3800 rezaleti gibi değil yanlış anlaşılmasın.



    Nvidia iler ki oyunlarda Doku kalitesinin, Ati ise shader miktarının fazla olacağını8 düşünmüş ve kartlarında bunları uygulamıştır. Şu anda hangisi daha doğru yapmış anlayamayız net bir şekilde.


    ROP ise açılımı Render Operations Pipeline diğer adı da Render Output Unit'dir

    Modern 3D hızlandırıcılı kartlarda 3D rendering işlemlerinin son aşamasının olduğu birimdir. Doku Birimleri ve shader üniteleri tarafından oluşturulan pixel ve texel'ler ROP birimleri tarafından ramlare ve bufferlara gönderilir. Bu shaderlardan gelen parça parça pixel ve texellerin karıştırılması ve son görüntünün oluşturulması da ROP birimlerinin işidir.


    Yani ROP birimleri son derece önemli birimlerdir. Bu birimler yetersiz kalırsa shaderların hızlı olmasdı bir anlam ifade etmeyecektir.

    Daha da açıklayıcı olursam;

    Shader ve TMU birimlerini un yapan değirmen olarak varsayarsak, ROP birimleride Fırıncı olarak anılabilir.

    ROP birimleri olmadan Ekmek yiyemeyiz, eğer 10 değirmenimiz 1 tane fırınımız varsa. Bu değirmencilerinde un yapma hızı çok yüksek ise, yiyeceğimiz ekmek fırın sayımıza bağlanır. Fırıncının hızı çıkan ekmek miktarını belirleyen unsur olur. İşte buradsa ROP darboğazı söz konusu.

    Ama 3 değirmenimiz var, 1 fırınımız var diyelim, Bu durumda da değirmenlerden gelen bütün unlar fırıncı tarafından ekmek yapılır, hatta fırıncı daha yarı zamanında boş boş oturur. İşte bu durumda ekmek miktarı değirmenlere bağlanmıştır. Buda shader darboğazına örnekti.


    Umarım anlaşılır olmuştur. Hiç bir noktası alıntı değildir.



    < Bu mesaj bu kişi tarafından değiştirildi Naga Sadow -- 2 Kasım 2008; 21:11:07 >




  • sdurust

    Klavyeye basan parmaklarına sağlık arkadaşım
    , tıpkı benim insanlara anlattığım örnek şekliyle bana konuyu izah etmişsin ki süper anladım... Konu anlatım tarzlarımız çok benziyor, sanırım sen ne desen şak diye anlarım

    Bu nedenle sana 1 soru daha sormak istiyorum.

    MTU lar doku filitrelemede bize çok daha iyi görüntü kalitesi sunmak için çalışırken Shader'ların yaptığı şey tam olarak nedir??? Yani elbette genel anlamda biliyorum hatta yukarıda güzel açıklamalar da var bu konu hakkında işte eski iş hatları vertex ve pixel yerine her iki işide yapabilen paralel iş hatları v.s..(yanlış biliyorsam ve söylüyorsam kusurma bakmayınız ve düzeltiniz)

    MTU paralel iş hattının dokuyu filitrelemesinden sonra extra filitreleme yapan kısım mıdır?
    Keskinşiği yumuşatma görevlerinide yapan paralel iş hattı biriminden farklı bir birim var mıdır???

    Teşekkürler şimdiden... Yada soruları yanlış sorduysam onuda düzeltebilirsiniz



    < Bu mesaj bu kişi tarafından değiştirildi Menow -- 1 Kasım 2008; 15:56:14 >




  • quote:

    Ama 3 değirmenimiz var, 1 fırınımız var diyelim, Bu durumda da değirmenlerden gelen bütün unlar fırıncı tarafından ekmek yapılır, hatta fırıncı daha yarı zamanında boş boş oturur. İşte bu durumda ekmek miktarı değirmenlere bağlanmıştır. Buda shader darboğazına örnekti.


    Şöyle de denebilir;

    3 değirmene X kapasiteli bir fırın fazla geliyor. Yani gereksiz.
    Dolayısıyla daha düşük kapasiteli bir fırın tercih edilmeli. 24Rop 800 sahdere yetiyorsa 32 rop koymanın bir anlamı yok. Dolayısıyla ortada bir darboğaz yok gereksiz birim var demektir.
  • quote:

    Orjinalden alıntı: Menow

    sdurust

    Klavyeye basan parmaklarına sağlık arkadaşım
    , tıpkı benim insanlara anlattığım örnek şekliyle bana konuyu izah etmişsin ki süper anladım... Konu anlatım tarzlarımız çok benziyor, sanırım sen ne desen şak diye anlarım

    Bu nedenle sana 1 soru daha sormak istiyorum.

    MTU lar doku filitrelemede bize çok daha iyi görüntü kalitesi sunmak için çalışırken Shader'ların yaptığı şey tam olarak nedir??? Yani elbette genel anlamda biliyorum hatta yukarıda güzel açıklamalar da var bu konu hakkında işte eski iş hatları vertex ve pixel yerine her iki işide yapabilen paralel iş hatları v.s..(yanlış biliyorsam ve söylüyorsam kusurma bakmayınız ve düzeltiniz)

    MTU paralel iş hattının dokuyu filitrelemesinden sonra extra filitreleme yapan kısım mıdır?
    Keskinşiği yumuşatma görevlerinide yapan paralel iş hattı biriminden farklı bir birim var mıdır???

    Teşekkürler şimdiden... Yada soruları yanlış sorduysam onuda düzeltebilirsiniz




    Hocam Pixel ve vertex ne onu açıklayayım bildiğim kadarıyla.


    Vertex her şeyden önce oyunlarda ki gördüğümüz hacimleri sağlayan parçalar denir. Vertex Shader poligonları hesaplama gücüdür kaba tabirle.


    Vertex Shader vasıtası ile Poligonlar çizilir TMU aracılığı ile de bu poligonlar render işlemine tabi tutulur. ( Yani poligonların üstü kaplanır )

    Yani TMU nun temel görevi budur.


    Pixel Shader ise bir oyunda fazla hacim kaplamayan. Yada kaplasa bile karakter yapısı gereği modellenemeyen objeleri tek tek nokta nokta oluşturur.

    Mesela diyelim oyunda bir göl var. Bu göl gerçekçi görünmesi için Vertex+ TMU mantığı ile hazırlanmaz. Tek,tek pixellere bölünür ve hazırlanır, zira su sürekli hareket halinde olmalıdır. Ve bunu sağlamanın yolu Pixellerden geçeri.


    Işıklandırma efektleri, su efektleri, belki ağaçların yaprakları, otlar Pixel Shader tarafından hazırlanır.




    Yani kısaca şöyle diyebiliriz. Oyunlarda hareketsiz(tabi kendi içinde) ve hacim kaplayan nesneler poligon olarak vertex shader tarafından hazırlanır ve TMU tarafından kaplanır. (mesela karakterler, araçlar, binalar, mekanlar)

    Tamamiyle her noktası hareketli veya hacim kaplamayan nesneler pixel shaderlar tarafından hazırlanır.


    Ve Vertex Shader lardan gelen poligonlar, TMU lardan gelen kaplamalar, Pixel Shaderlardan gelen pixeller ROP üzerinde birleştirilir ve ekranımıza görüntü olarak gelir.


    AA, AF nerede yapılır sorusuna gelince.

    Mesela AF den sorumlu birimler kaplamaların hazırlandığı TMU lardır. Zaten AF aslında bir çeşit kaplama süzgecidir. Kaplamaların daha düzgün görünmesini sağlar. Mesela uzakta ki bir bina daha net ve güzel görünebilir. Güzel görünmesini sağlayan şey ise TMU da o uzak bina kaplandığı sırada süzgeçten geçirilmesidir.


    Ama iş AA'ya gelince orada durum değişebilir. AA yöntemine göre farklı durumlar ortaya çıkabilir. Geleneksel yöntemde AA işlemi ROPda görüntü oluşturulurken uygulanırdı. Ama şu anda Ati kartların Shaderlar aracılığı ile yaptığı söyleniyor. Hatta AA işlemlerini gerçekleştirebilmek için ayrı birim bile konabilir.

    Mesela Xbox360'da Ekran kartı çipinden ayrı olarak EdRam adlı bir çip daha vardır. Bu çipin en önemli görevlerinden biri AA işlemini ekran çipinin üstünden alıp yapmaktır..

    Nvidia'da ROP sayısının, Ati de ise shader sayısının AA başarımında daha fazla önemi olduğunu söylesek sanırım yanlış söylem olmaz.



    < Bu mesaj bu kişi tarafından değiştirildi Naga Sadow -- 1 Kasım 2008; 17:15:24 >




  • gpu-z de ben incelemiştim bu olayı nvidianın rop dalgası atiye göre çok fazla heralde bu shaderları çalıştıranlar rop denen dalgalar onlar az olunca bu fazla shaderlar yan gelip yatır bu mantık çok saçma değil ama değilmi
  • quote:

    Orjinalden alıntı: K0rkunc

    gpu-z de ben incelemiştim bu olayı nvidianın rop dalgası atiye göre çok fazla heralde bu shaderları çalıştıranlar rop denen dalgalar onlar az olunca bu fazla shaderlar yan gelip yatır bu mantık çok saçma değil ama değilmi



    Nasıl işlemcin darboğaz yaptığında ekran kartın gücünü gösteremez tam kapasite çalışamaz burada da aynı durum var. ("yani yan gelip yatar", tabiri budur. Burada da işlemci yüzünden ekran kartının tümü yan gelip yatıyor mesela.)


    Eğer Rop darboğaz yaparsa tabi ki Shader lar çalışamaz. Bir üstte ki mesajı okursan daha net anlarsın. Görüntü oluşturma işi bir süreçtir. Ve ROP lar bu süreçte shader lardan ayrı bir parçadır. Değirmen, Fırın olayı güzel bir açıklamadır.


    Ha Atide ROP sayısı az bu nedenle shaderlar çalışmıyor diyemem elbette. Sonuçta ROP sayısının az olması mesele değil, darboğaz yapıp yapmadığı önemli bir nokta.

    Mesela HD4870 de ROP GTX280 nin yarısı kadar ama daha hızlı çalıştığını varsayarsak, birde AA işlemiyle daha az yorulacağınıda göz önüne alırsak o kadar da az görünmez göze.

    Yine de ROP ların darboğaza neden olduğu durumlar elbette olacakır. Oyunun kendisi bile bu durumu etkiler çünki her oyun ekran kartlarının farklı birimlerini, farklı miktarlarda kullanır.



    Bu darboğaz olayını en net gördüğümüz kart yine yazıyorum HD3870 veya HD3850'dir. Darboğaz yapan kısım ROP lar değildir tabi ki. TMU birimleridir.

    Doku birimi önemsenmeyen oyunlarda, doku kalitesi düşük oyunlarda HD3870-- 9600gt yi rahatça geçmektedir.


    Ama doku kalitesi yüksek oyunlarda birde AF filtresini sona dayayıp kaliteyi iyice arttırdığımızda HD3870, 9600gt nin performansının yarısının bile altına düşmekte idi.


    Hayır aynı oyunda AF kapalı iken HD3870 rahatlıkla önde iken AF açıldığında 9600gt fark atabilmekteydi.

    Bunun nedeni TMU yetersizliğinden doku birimleri üstüne düşen işi yetiştirememekte, bu nedenle Shaderlar tam verimle çalışamayıp amiyane tabirle yan gelip yatmaktaydı.


    Komik ama maalesef durum böyle. Zaten Atinin HD4800 serisiyle başarımının artmasınıon tek nedeni 800 shadera çıkması değildi. TMU birimlerinin 16 dan 40 a çıkarılıp daha verimli bir hale getirilmesi HD4800 serisinin başarım sıçramasında daha etkili olmuştur.



    < Bu mesaj bu kişi tarafından değiştirildi Naga Sadow -- 1 Kasım 2008; 17:31:10 >




  • Gayet hoş, güzel şeyler yazılmış. Teşekkürler. Uzun süredir dolu konu görmüyorduk pek :)

    Ben de bir şeyler ekleyeyim:

    Öncelikle, 800 ALU - 240 ALU (ALU: Arithmetic Logic Unit, yani aritmetik işlem birimi veya aritmetik işlemci) olarak bakmamamız gerekiyor.

    Sadece saat hızı yüzünden de değil.

    Mevcut Radeon'da ALU hesap gücü şöyle hesaplanır:

    ALU sayısı*ALU saat hızı*2(MADD)


    Mevcut GeForce'de:

    ALU sayısı*ALU saat hızı*3(MADD + MUL)


    Aslına bakılırsa, MADD ile MUL'u bir tutmak da pek doğru sayılmaz. MUL'un işlem içinde tuttuğu yer daha az, denilenlere bakılırsa.

    Ama kesin bir şey söylemek de pek mümkün değil galiba, gene nVidia'nın ağzından konuşalım:



    HD 4870:

    800*750*2=1200,0 GFLOPs


    GTX 280:

    240*1296*3= 933,1 GFLOPs


    GTX 260:

    192*1242*3= 715,3 GFLOPs



    HD 4870 gene tokatladı, ama daha az tokatladı :)


    Bu, önemliydi. 4870 ALU'ları tam verimli(doku birimi etkenini katmadan düşünerek, "tam") kullanılsa bile, doku filtreleme - adresleme açısından teoride %60 civarı anlamlı* şekilde üstün (40*750 - 80*601,7) olan GTX 280'in bu yanı öne çıkarsa (ki çıkıyor yerine göre), işleri değiştirebilir. Kaldı ki, GTX 200 serisinin bile doku birimi gücü gerçekten olması gerektiği gibi mi, tam emin değiliz. GTX 200'de belli yerlerde yetersiz gelirse, 4870'in durumu daha da absürtleşebilir.


    * Anlamlı, evet. Yani, 4870'te örneğin 200 doku birimi, GTX 280'de 400 doku birimi olsaydı, bu bir avantaj olmayabilirdi. 200 doku birimi 4870'in diğer birimlerinin işini fazla fazla görebilirdi çünkü (rakamlar tamamen sallama, hiçbir dayanak olmadan, öylesine). 280 gene aynı düzeyde (40*750 - 80*601,7'de olduğu gibi) üstün olurdu teoride, ama bu pek bir anlam ifade etmezdi pratikte. Sınır çoktan geçilmiştir, zira. He iki taraf için de ALU'ya ve diğer özelliklere yüklenmeniz çoktan gerekmiş olurdu.
    Ancak, 40 gibi, tüm yeni(RV770'le gelen) doku birimi optimizelerine rağmen 4870'in diğer özellikleri için kritik kaldığı gayet belli bir rakam söz konusuysa, GTX 200 serisinin bir doku birimi avantajı ve az çok yeterli ALU gücü de varsa, işte o avantaj olur, 280 ve 260 için.
    200'lere avantaj olmasa, 4870'in yeterince iyi olmasını engeller.



    160 paralel işlemci konusunu da sanırım biraz açabiliriz:

    HD 4850 ve HD 4870'te, 10 tane SIMD işlemcisi mevcut. Her SIMD'de ise, 16 adet çekirdek mevcut.

    Bu 16 çekirdeğin her birinde ise, 5 adet ALU bulunuyor. Peki, 160 işlemci mantığı 16 çekirdek * 10 SIMD'den mi geliyor? Hımm... Aslında, hayır.


    Bu noktada, o her bir çekirdekte 5 adet bulunan ALU'nun nasıl olduğuna bakmamız gerekiyor gibi:


    Önce SIMD'lerden 2 tanesinin görüntüsünü koyacağım. Sonra 5 ALU'nun ayrıntılı görüntüsü:



    Bu iki tane gördüğünüz SIMD dizininden 10 tane var, RV770'te. Doku birimleri (texture unit) de buna bağlı olarak 10 grup hâlinde. Her doku birimi içinde 4 doku filtreleme(TFU), 4 doku adresleme(TAU) ve 16 doku örnekleme(TSU) ara birimi var. 40 - 40 - 160 oluyor, böylece (aman, 160'ın ALU mevzusuyla ilgisi yok. Doku örnekleme birimi sayısı anlamında, 160). (Şu doku örnekleme birimleri araştırılmalı aslında. Radeon'a özel bir birim mi acaba? ALU'lara bağlanma şeklinin sorun çıkarmaması için, meselâ?)


    1 çekirdek ve onun içindeki 5 ALU'nun yapısı:




    Sarı renkte olanlar ALU, oluyor.

    Şimdi bilmem dikkatinizi çekti mi: ALU'lardan bir tanesi kapsamlı, diğer dördü daha farklı.


    İşte, R600, RV670 ve RV770'in shader açısından ana meselesi herhâlde budur. 160x5'ten ziyade, 160 tane "baba" ALU ve 640 tane, verimlilik için optimizeye muhtaç olabilen "yavru" ALU bulunması.

    Uygulamanın optimizesini Radeon için bu kadar öne çıkaran şey de bu olsa gerek:

    Eğer uygulama o yöndeyse, 4 ALU yan gelip yatar(abarttık galiba), 1 tanesi, kapsamlı olan çalışır.

    E 1 tanesi çalışırsa, 1*16*10= 160 :) 160 tane 750 MHz hızında ALU. Bir de GeForce'nin MADD + MUL yapısıyla kıyaslayarak düşünün ve işin tehlikeli yanını görün. Ha ama tam 160 tane (yuh) olarak çalıştığı kadar tehlikeli oyun hiç olmayabilir(e yani, yuh artık. O nedir:), diğer 640'ının boş kalması RV770'te daha zor olabilir, RV670'te diğer 256'nın boş kalabilirliğine göre (SIMD'lerin bağlandığı ana dağıtıcı işlemciyle[Ultra - Threaded Dispatch Processor] ilgili ciddi gelişmeler var çünkü, RV770'te, RV670'e göre). Ancak, bazı eski uygulamalarda da gerçekten sıkıcı sonuçlar alınabilir.

    Gerçekten tam 800 olarak kullanmak mümkün olur mu bilinmez, ama uygulama iyi çalışırsa 160'tan çok çok daha fazlasının etkin kullanılacağı ortada, ki zaten kullanılmasa 4800'leri niye sevelim? Başarısız olurlardı o zaman :)


    GeForce'nin yapısına gelirsek:

    Onda şey gibi düşünün: GTX 280'deki 240 ALU'nun tamamı, Radeon'daki bahsettiğimiz "baba" ALU'dan :) Üstüne de MADD + MUL ve yüksek saat hızı.


    GeForce'de(GTX 280) şöyle düşünülebilir: Gene 10 tane işlemci, her işlemci içinde 24 tane çekirdek ve her çekirdekte 1 ALU:

     ATI ve NVIDIA PARALEL İŞ HATLARI FARKI



    Her biri tek ALU barındıran çekirdekler. Yani aslında, Core(çekirdek): ALU gibi oluyor, belki de zaten öyledir (o zaman doğrudan 10x24 almamız gerekir ki, Radeon'a göre önemli bir yapı farklılığı meydana gelir[zaten farklı, o ayrı]). Ama Core'nin içinde başka bileşenlerin durumunu bilmek lâzım, varsa eğer (GeForce'de Core: ALU mu, yoksa değil mi?):

     ATI ve NVIDIA PARALEL İŞ HATLARI FARKI



    Burada ilgi çekici bir şey de, doku filtreleme birimleri(TF)nin konumu. Radeon'da daha dışta, ayrıca bağlanmış görünüyor, bunda ana işlemci - modül içinde gözükmüş. Gerçekten böyleyse, belki GeForce'nin ayrıca bir avantajıdır bu. Gecikme açısından.

    Not: Şekillere bakarsak, GTX 200'de de üçlü bir gruplamayla 3x8=24 olduğunu görüyoruz, aslında. Ama her şeyde de şekil üzerinden konuşamıyoruz, duyduklarımız - bildiklerimiz de az çok öne çıkıyor. Şekiller, kolaylık olsun diye de farklı çizilebilir, çok güvenmemeli.
    Ama belki, GeForce'de de gruplama - 8 ALU'lu çekirdek olarak ele almalı, meseleyi sadece Radeon'da 5 ALU'nun 1+4 biçiminde olmasına indirgemeliyiz?


    Not2: GTX 260'ta 8 işlemci - modül, dolayısıyla 192 ALU ve 64 doku birimi var (8x24 ve 8x8).

    G80 ve G92'de, her ana işlem bölümünde 16 ALU ve gene 8 doku birimi vardır. GT200'de ise 24 - 8 şeklinde.



    Böyle bir şeyler işte. Hem MADD + MUL bakımından ve saat hızı bakımından bir avantaj, hem de optimizeye daha az ihtiyaç duyan bir yapı var GeForce'de.

    Öte yandan, Radeon'un yapısı iyi kullanılırsa, hele üstüne bir de doku birimlerinin pek sıkıntı yaratmayacağı türde bir grafik yapısı varsa, çok iyi, mükemmel işler çıkarabilir Radeon'lar.

    Ama ALU optimizesi tek başına yetmeyebilir işte, doku birimi sıkıntı yaratırsa. Yer yer yaratıyor da.



    Günümüz oyunlarının birçoğunda RV770'in ALU durumunun öyle kötü olmadığını, ama tam 800 gibi düşünmenin de doğru olmayabileceğini(olabilir de. Duruma bağlı) ve doku birimlerinin önemli kısıtlamasının kesinlikle göz önüne alınması gerektiğini sanıyorum (bkz. 3DMark 06: Perlin Noise, 3DMark 06 Pixel Shader AF kapalı, 3DMark 06 Pixel Shader 16x AF. Perlin Noise'den Pixel Shader'e geçişte AF açılmasa bile 4870'in durumunun Perlin'e göre kötüleşmesi (doku yükü var çünkü, Pixel Shader testinde), AF açınca daha da kötüleşmesi, 16x'te büyük kayıp yaşaması. 3DMark gibi bence ALU'larının gayet iyi kullanılacağı, zaten Perlin Noise'de 4800'lerin coştuğu bir uygulamada böyle gözlemler yapıyorsak, sadece ALU optimizesinin veya yapı değişikliğinin 4800'ü her durumda beklendiği gibi kurtarmayacağı az çok ortada. Doku biriminin günümüzde önemsiz olması için belli bir sayıda tutmak gerekir. Hayır önemlilik tek başına bir kavram değil ki, önce ihtiyacı karşılamanız gerekir. ALU'nun yanına az doku birimi koyunca gene önemli oluyor, siz önemlileştiriyorsunuz. Oyunların ihtiyacı değişebilir ama sizin de kartlarınız aynı kalmıyor ki kardeşim :)



    Eski oyunlarda 4800'lerin ALU sorunu yaşayabileceğine en güzel örnek ise, Anno 1701 1.01.

    Bu oyunda shader'ler GeForce için bir hayli öne çıkıyor. Bellek band genişliği sorunu var, dediğimiz 8800 GTS G92 bile, 9600 GT'yi 4x AA açılsa bile çok fena tokatlıyor bu oyunda (128 ALU sayesinde) (AA kapatıldığında fark biraz daha açılıyor, b. band genişliği daha az öne çıktığından). 9600 GT'de sadece paralel işlemciyi hız aşırtmanız, genel getirinin çok büyük bir kısmını tek başına sağlıyor. 8800 GTS G92'de de böyle.
    Tabii her sahnede hep aynı yürümez, ama pek çok durumda görülüyor bu.

    Şimdi GeForce'te ALU'nun böyle çok öne çıktığı bir durumda, ALU toplam gücü çok diye beklentiye gireceğimiz 4870 ne yapıyor? Her sahne için konuşmayacağım hemen, iyi oldukları da vardır; ama pek çok göze hitap eden ("eye candy" :) sahnede, düz 8800 GTS G92'den tokat yiyebiliyor düz 4870'imiz. AF kapalıyken falan hem de.

    Sebebi sizce de gayet açık, değil mi? Tam 160 olmasa da, belli ki ALU'ları bir hayli kötü biçimde kullanılıyor ki, 8800 GTS G92'den tokat yiyebiliyor.

    HD 3870 de aynı öyleydi. 9600 GT'den çok fena tokat yiyordu o oyunda. Shader'i yüzünden başarımı sınırlanmış 9600 GT'den tokat yiyordu.

    Bu eski oyundan örneği "4870 pis kaka" demek için vermedim tabii ki.

    Bahsettiğim, 5 ALU'dan 1'i meselesine uygulamalı bir örnek olsun diye verdim. Teorik test anlamında, yani. Bilhassa bu tür eski örneklerde böyle şeyler görülürse şaşırılmamalı.



    Shader'in öne çıktığı her durumda 4800 beklentileri karşılayacak diye bir şey söz konusu değil, kısacası. ALU'larının adam gibi kullanılabilmesi lâzım önce.


    Ama AMD şu doku birimlerine daha da iyi yüklenirse, güzel olacak (bu işler de çocuk oyuncağı ya, benim gibilerin lâf yapması kolay. Onların her şeyi bildiğininin, bizim bilgimizin az bir şey şey ve teorik olduğunun elbette farkındayım. Sadece üslûbum bu. Gidip de AMD'ye bir şey öğretmeye kalkacak değilim, azıcık bilgimle :).

    Böyle giderse, ALU optimizesi bekleneni vermeye yetmeyecek gibi, örneğe göre.


    Neyse ki, 4800'de gene iyi.


    3870 zamanı bazı doku birimleri rezaletleri yüzünden optimize(oyundaki kod optimizesi) lâfını ağzıma bile pek almıyordum, bazı uç örnekler (BioShock'taki birtakım AA başarımı sorunları, gibi) hariç ve Anno 1701 gibi durumlar dışında.

    AF yokken 8800 GTS G92'nin dibine yerleşebilen 3870 (örnek amaçlı söylüyorum), 16x AF açınca, 8800 GTS G92'nin çok gerisinde kalmış 9600 GT'den tokat yiyebiliyordu. Yani böyle örnekler bile çıkabiliyordu. Veya AF yokken 8800 GTS G92'yi biraz geçip, 16x AF açınca 9600 GT gibi oluyordu.

    Oblivion'daki açık mekânları ve Crysis'teki özellikle Paradise Lost'u unutmak zor (16x AF açınca 3870, 9600 GT'den iki kata yakın fark yiyordu bir sahnede. 16x AF açınca, 3870'in başarımı neredeyse yarı yarıya düşüyordu o sahnede). Paradise Lost, düz 4870'in AF yüzünden düz GTX 260'ı geçemediği, AF olmayınca geçtiği (280'inki gibi başarım verebilir) bir bölüme benzer(kaplamalar aşmış orada). Bir adam gibi test edemedik (aslında ettim de, GeForce'yi 180.43 ile denemeliyim. nVidia fanatikleri kızıyor sonra, "niye big bang 2 kullaamadın ulaa" diyerek, "hırr roaarr" tepkileriyle. nVidia "big bang 2" ismi verince bunlar da gaza geldi).




    ROP konusunda bir ilginçlik var yalnız.

    HD 4870, 750 MHz 16 ROP'a rağmen, en azından pixel fillrate açısından 576 MHz 28 ROP'lu GTX 260'tan pek geri olmayabilir.

    GTX 200 serisinde ROP Blend açısından devasa geliştirme yapılmıştı ve 28x576 - 32x601,7 ROP gücüyle açıklanamayacak kadar büyük fark atabiliyorlardı Pixel Fillrate olarak, G92 ve G80'lere (bellek band genişliğiyle ilgisi yok).


    HD 4800'de de, 3800'e göre ciddi gelişmeler var(iki katlık gelişmeler), ama daha çok FSAA tabanlı ROP geliştirmesi gibiydi bunlar.


    Ona rağmen, 06 pixel fillrate testinde AA ile ilgili bir şey olmamasına(bildiğim kadarıyla. Belki kendi içinde AA tabanlı gelişmeler de test ediliyordur) rağmen 4870 hayli başarılı görünüyor. 3870'ten o testte çok çok üstün ki, 3870 776 MHz 16 ROP'ludur. 4870 750 MHz 16 ROP'lu.


    Öte yandan, ROP deyince bir de Z Fillrate mevzusu var (Z fillrate değeri, Z Buffer veya Depth Buffer, yani görüntüye derinlik kazandırmakla ilgili bir arabellek değeri, gene çıkış kısmında). Tabii onu da iyi bir test etmeli. Z açısından 4800'de teorik anlamda 3800'e göre ciddi gelişme var, AA için. GTX 200'ün durumunu ise inşallah göreceğim.


    4800'ün pixel fillrate 06'daki başarımının bir açıklaması da, bellek denetçisi - ROP yerleşiminde 4800'de yapılan yeni konum düzenlemeleri - gecikme azaltmaları olabilir. L1 - L2 gibi önbellek geliştirmeleri de etkilemiş olabilir, kim bilir.

    Bakalım artık.

    ROP konusunda RV770 zayıf kalsa bile, mimarî fark yüzünden bu pek önemli olmayabilir. ROP GeForce'de ne kadar önemli, daha onu tam bilmiyoruz. Yüksek çözünürlük + yüksek AA'da öne çıktıkları söyleniyor zaten, GeForce'de. Ben pek emin olmasam da, böyle olduğundan.



    < Bu mesaj bu kişi tarafından değiştirildi Castle Bravo -- 2 Kasım 2008; 23:58:50 >




  • Tuğer seni bize Allah gönderdi sıkılmadan keyif alarak yazdığın(okurken anlaşılıyor ) yazın için çok teşekkürler...

    Hocam yazılarını okurken ciddi anlamda yeni şeyler öğrenmeye başladığımı hissettim. Ne zamandır beynim bu denli bilgi girdisini görmediğinden şaşırdır Bu konuşulanları kaba taslak okuyup geçiyordum, bir çoğunu aşırı teknik detaylardan dolayı anlayamıyordum. Dediklerinin %100 ünü anlamasam bile gerçekten ciddi anlmada bir çok şey öğrendim... sdurust arkadaşım da sağolsun ciddi ölçüde konuyu aklımda hakim kıldı...

    Sanırım bu güne kadar bu forumda açıtığım en güzel konuydu sizin sayenizde tabiki... Bütün herkese nacizane yardımlarından dolayı teşekkürler.

    Bizi ekran kartında basit kıyaslamalardan çok çok öteye taşıdınız veya en kötüsü taşımaya çalışıyorsunuz. Sanırım buna hepimizin ihtiyacı var, çünkü biz alıcılar aldığımız ve kullandığımız ürünleri ne kadar iyi bilirsek o denli amacımıza yönelik seçimler yapabiliriz, ve bizi aptal yerine koymaları zorlaşır...

    ŞU konu bahsi geçen konuları hepimizin bildiğini düşünsene ATI ve NVIDIA sanırım illallah ederdi...




  • 
Sayfa: 12
Sayfaya Git
Git
sonraki
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.