Şimdi Ara

## GeForce GTX 200 Serisinin Resmi Saat Hızları ##

Daha Fazla
Bu Konudaki Kullanıcılar: Daha Az
1 Misafir - 1 Masaüstü
5 sn
83
Cevap
0
Favori
8.852
Tıklama
Daha Fazla
İstatistik
  • Konu İstatistikleri Yükleniyor
0 oy
Öne Çıkar
Sayfa: 1
Giriş
Mesaj
  •  ## GeForce GTX 200 Serisinin Resmi Saat Hızları ##


    Nvidia'nın GeForce GTX 200 serisine yönelik olarak bellek miktarı, bellek veri yolu ve paralel işlem birimi sayısı gibi önemli ve doğrulanmış detayları geçtiğimiz hafta dünyada ilk defa sizler ile paylaşmış ve yaptığımız bu haber uluslararası alanda da ciddi ses getirmişti. Şimdiyse elimize yine Nvidia'nın yeni bir resmi dökümanı eşliğinde GeForce GTX 200 serisinin saat hızlarına yönelik bilgiler de geçti. Mevcut bilgilere göre Nvidia bellek veri yolu ve paralel işlem birimlerinin oluşturduğu farklardan ötürü özellikle saat hızlarını yakın tutmayı tercih etmiş gibi görünüyor. 18 Haziran'da anons edilecek olan GeForce GTX 200 serisinin teknik özelliklerini performansa nasıl yansıtacağını ise birlikte göreceğiz.







  • Bu haberden daha önce GTX 280 @ Folding@Home başlığında bahsetmiştik aslında: http://forum.donanimhaber.com/m_23433606/mpage_2/tm.htm

     ## GeForce GTX 200 Serisinin Resmi Saat Hızları ##


    Epey eski bir Nvidia sunumundan alıntı. Burada GPU'ların ALU genişliğinin artmasının performans ve güç tüketimi üzerinde olan etkilerinden bahsedilmiş. Şimdi olay şu:

    GPU'lar CPU'ların aksine "massively parallel architecture" dediğimiz mimarilerdir. Çok sayıda ALU birimi yığınsal işlemleri bir arada yaparlar. GPU'larda performans arttırımı en temel şekilde ya çalışma frekans arttırımı ya da ALU genişliğinin (yani her bir ALU kümesine düşen ALU birimi sayısının ve hatta bu kümelerin sayısının) arttırılmasıyla olabilir. Tabii bunların her ikisinin de arttırımı performansı daha da çok arttırır ama konu bu değil.

    Burada bahsedilen olay şu ki ALU genişliğinin arttırılıp bu yolla performansın arttırılması, ALU genişliği arttırılmadan frekans üzerinden performans arttırılmasına göre daha iyi bir performans/güç tüketimi (watt) oranı yakalıyor.

    Nvidia gpu yükünün çoğunu çeken ALU'ların hızının, genel çekirdek hızına olan oranını GTX 280 ve GTX 260'da düşürmüş (mesela G92'lere kıyasla).

    Bu bize yukarıda bahsettiğimiz olayın bir uygulamasını gösteriyor. Nvidia performans/watt oranını daha yukarılara taşımak için ALU genişliği artarken frekansı azaltıyor.

    Ama eğer bu doğrudan doğruya karşılaştırılabilir niteliklerde SP'ler (ALU'lardan oluşan işlem birimleri) üzerinde olsa kesinlikle sonuç çok iyi olmazdı. Düşünsenize G92'de 128 tane olan SP birimlerinin aynısını alıp G200'e 240 tane koyuyorsunuz ve de saat hızını düşünürüyorsunuz. Evet bu durumda da aynen yukarıdaki gibi bir ALU arttırımı/Saat hızı azaltımı yaşanıyor ve perf/watt oranı yükseltiyor ancak böyle bir durumda da performans arzu edilen seviyelerde olmayabilir.

    Hatırlanacağı üzere G80'de 128 tane SP birimi vardı ve bunlar da döngü başına bir MADD (Multiply&Add) ve de bir MUL (Multiply) işlemi yapılabiliyordu. Adı üstünde bu işlemler her bir SP başına bir döngüde toplam üç kayar nokta işlemi ediyor (bir MADD yani bir çarpma ve toplama işlemi ile bir MUL yani bir çarpma işlemi). Mimari sonradan incelendikçe G80 ve türevlerinde MADD işleminin yanında yapılan bu MUL işlemlerinin aslında MADD işlemini yapan ALU'ların olduğu SP birimlerine ait değil de, ayrıca işlem birimi kümeleri içinde bulunan Special Function-ALU ya da Interpolator adıyla geçen birimlerde üstlenildiği farkedildi. Burada ortaya çıkan ilginç bir diğer durum da şu ki bu ekstra MUL işleminin görevlendirilmesinde (gpu içindeki tüm birimleri elinden geldiğince her döngüde maksimuma yakın görevlendirmeye çalışır, görevlendirilmeyen birimler o döngüde boş kalır) ciddi bazı aksaklıklar olduğuydu. En verimli durumlarda bile en fazla iki döngüde bir MUL işlemi ve MADD işlemi bir arada görevlendirilebiliyordu. Diğer çoğu durumda ise sadece bir MADD işlemi yapılıyordu yani MUL pas geçiliyordu. En ilginç olan nokta ise şu ki bu en yüksek verimler hep 3B dışı uygulamalarda ulaşılıyordu, iş 3B olunca MUL bu kadar da (hatta hiç) kullanılamıyordu. Eğer Nvidia'nın sitesinden Tesla 870 serisine bakarsanız C üzerinden kullanılabilir olarak 430 GFlops'luk bir değer görürsünüz ki bu da tam 2.5*128*1.35 değeriyle elde ediliyor (2.5 değeri her döngüde kullanılan 2 Flopsluk bir MADD ve en fazla 2 döngüde 1 Flops olarak çıkabilen ya da bir başka deyişle bir döngüde en fazla 0.5 Flops olarak çıkabilen MUL için). Ancak konu oyunlar olunca bu değer bir anda 2*128*1.35 oluyor yani 345.6 GFlops. Görünen o ki oyunlar çok büyük bir oranla bu kadarını kullanıyor. Ancak hemen belirtmek istiyorum ki bu değerlere bakarak farklı mimarilerle güç karşılaştırması yapmak kolay değil.

    Şimdi olay şu ki Nvidia G200 gpusunda bu eksik MUL işlemini artık gpunun her türlü kullanmasını sağlıyor. Böylelikle SP işlem birimi başına düşen oyun performansı ALU performansına bağlı olarak %50 artıyor. Nvidia'nın sızdırılan o gpu özellikleri verilerinde söylemek istediği bu. Yani oyun performansı olarak gpu hem 240 işlem birimiyle eski nesle üstünlük kuruyor, hem de her bir işlem birimi eskiden olduğundan %50 daha iyi oyun performansı sunuyor. Bu bağlamda Nvidia belki de yukarıda bahsettiğimiz gibi eskiden verimli kullanamadığı MUL ALU'larını tekrar oyuna sokması sayesinde ve de 240 işlem birimine ulaşması sayesinde GTX 280 için 1300 MHz'den fazlasını istememiş olabilir. Yaklaşık 240 W'lık güç tüketimi sınırmalası hedefi içinde saat hızları yüksek ama mesela 192 SP'ye sahip bir çip yerinde belki de 240 SP birimine sahip ama şimdiki gibi 1.3 GHz hızda çalışan bir çipi yapmayı daha performanslı bulmuş olabilir. Elbette hızın daha fazla olması performansa katkı yapar ama ne derece gerek olduğunu ve 230-240W limiti içinde ne derece mümkün olduğunu ancak Nvidia bilebilir.

    Bu açıdan olaya bakarsak GTX 280'in 3B için olan ALU gücü 8800 Ultra'nın neredeyse iki buçuk katı kadar (2.4375 katı). GTX 260'ın 3B ALU gücü de 9800 GX2'den fazla (9800 GX2'yi çift gpulu olduğu için ortalama %70'lik bir verimle çalıştığını düşündüm bunu belirtirken ki böyle kabul etmek zorunda da değilsiniz, %100 olarak düşününce bu durumda da daha az oluyor GTX 260'ınki). Ayrıca tüm bunlar dışında G200 gpusunun her yerinde bir sürü yeni numaranın olacağına emin olabilirsiniz.

    Açıkçası Nvidia'nın shader / rop domain hızı oranları dediğim gibi kartların perf/watt oranlarını yükseltmek için bu şekilde düşünülerek düşük tutulmuş olabilir.

    G200 yieldlarına gelirsek Nvidia sizce 1.4 milyar transistörü tek bir gpuya koyarken yieldın nasıl olacağını düşünmemiş midir? Hem de son derece iyi bildiği ve iyice öğrenecek kadar zamandır üretim yaptığı 65 nm tekniğinde (Nvidia'nın ATi'ye göre yeni silikon üretim tekniklerine geçişte daha az agresif davranmasının sebeplerinden birisi budur). Ayrıca zaten kimse yieldların G94 yieldi gibi olmasını beklemez ki zaten. Nvidia geçenlerde 1. çeyrek finansal sonuçlarını uzmanlarla değerlendirmek için yaptığı toplantısında G92'nin yield problemi yaşadığını ancak durumun çözüldüğünü ve 2. çeyreğin sonunda duyurulacak yeni ürünlerin kar marjlarının çok daha yüksek olduğunu söylemişti. Zaten yieldın düşük olması da kar marjı açısından önemlidir. Yield düşükse az miktarda kullanılabilir/istenilen standartta gpu üretiyorsunuz demektir, birim gpu maliyeti artar ve kart başına kar marjı düşer. GTX 280 ve 260 da kar marjlarının oldukça iyi olacağını iddia etti uzmanlara Nvidia bu toplantıda ki GTX 260 450 dolara, GTX 280 ise söylentilere göre 600 dolardan daha yüksek bir fiyata satılacak.

    Son olarak Nvidia editör gününe gitmiş ve de şu an kartı almış inceleyen bir editör kartın performansının çok iyi olduğunu söylüyor. Hatta iddialı bir şekilde eğer GF8'in GF7'ye attığı farkın çok olduğunu düşünüyorsanız yeni Geforce'un eskilere attığı farkı görünce şok olacaksınız demiş. Ne derece doğru bilemiyorum tabii.

    Bu da editör gününden bir resim. Huang kartı gösteriyor.

     ## GeForce GTX 200 Serisinin Resmi Saat Hızları ##

    Sonuçlar ne olur bilemem ama iyi bir kart geliyor bence.



    < Bu mesaj bu kişi tarafından değiştirildi kobb -- 27 Mayıs 2008; 0:35:39 >




  • Annihilator yazı en azından yeni gpuyla ilgili bazı noktaları aydınlattıysa ne mutlu... Bu arada ben biryerlerden alıntı yapmam. Ancak şu kadarını da ekleyelim ki GPU resmi olarak duyurulana kadar hiçbirşey %100 garanti değil.

    GTX 280'in 600+ doları haketmesi konusuna gelecek olursak bence burada kriter 8800 GTX olmalı. 8800 GTX fiyatının hakkını veriyor muydu? Eğer bu soruya bir kişi evet diyorsa bence aynı durum GTX 280 için de geçerli olabilir.

    Eksik MUL işlemi konusuna gelirsek eğer bu konu oldukça karmaşık. İlk olarak Beyond3D'de duyduk bu durumu sonra da konu birçok platformda dallanıp budaklandı:http://www.beyond3d.com/content/reviews/1/11

    Ancak Nvidia'nın kartlarıyla ilgili birtakım konular gibi bu konu hakkında da hiçbir zaman tam olarak sizin dediğiniz gibi bir makale çıkmadı. Sadece konudan anlayan kişilerin deneyimleri ve yorumları... Ve bir de konu hakkında yeterli bilgisi olmayan bir sürü kişinin yorumları... SP ile bu Interpolator birimleri konusu bile başlı başına karışık. Şu var ki Nvidia sadece insanların bilmesini istediği kadarını söylüyor kartları hakkında. Geri kalan hiçbirşeyden bahsetmiyor ve bu konuda Ati gibi cömert davranmıyor. Şu kadarını söyleyebilirim ki Nvidia'nın kendi sunumlarında ve notlarında bile 8800 GTX için mesela bazı yerlerde grafik üzerinde yaklaşık 520 GFlops, bazı yerlerde yaklaşık 350 GFlops gösterildiğini gördüm. Ama olay şu ki GF 8 serisi (ve GF 9 kartları) vermeleri gereken performansı verdiler. Sentetik testlerde bile.

    quote:

    Zaten bir SP 3 birimden olusuyordu: integer scalar unit, flopt32 mad scalar ve flopt32 mul scalar............. Ha bi de, bunlar floating point oldugu icin ALU degil de FPU olmuyor mu?


    Bu birimler ALU oluyor çünkü zaten sizin de yukarıda belirttiğiniz gibi sadece floating point işlemleri değil integer işlemleri ve hatta special function işlemleri de yapıyorlar. Bazıları sayısal olarak çok göz önünde olduğu için bu işlem birimlerinin sadece kayar nokta hesapları yaptığını zannediyor ki aslında bu işlem birimleri daha pek çok işlem yapıyorlar.




  • quote:

    Orjinalden alıntı: kobb

    Annihilator yazı en azından yeni gpuyla ilgili bazı noktaları aydınlattıysa ne mutlu... Bu arada ben biryerlerden alıntı yapmam. Ancak şu kadarını da ekleyelim ki GPU resmi olarak duyurulana kadar hiçbirşey %100 garanti değil.

    GTX 280'in 600+ doları haketmesi konusuna gelecek olursak bence burada kriter 8800 GTX olmalı. 8800 GTX fiyatının hakkını veriyor muydu? Eğer bu soruya bir kişi evet diyorsa bence aynı durum GTX 280 için de geçerli olabilir.

    Eksik MUL işlemi konusuna gelirsek eğer bu konu oldukça karmaşık. İlk olarak Beyond3D'de duyduk bu durumu sonra da konu birçok platformda dallanıp budaklandı:http://www.beyond3d.com/content/reviews/1/11

    Ancak Nvidia'nın kartlarıyla ilgili birtakım konular gibi bu konu hakkında da hiçbir zaman tam olarak sizin dediğiniz gibi bir makale çıkmadı. Sadece konudan anlayan kişilerin deneyimleri ve yorumları... Ve bir de konu hakkında yeterli bilgisi olmayan bir sürü kişinin yorumları... SP ile bu Interpolator birimleri konusu bile başlı başına karışık. Şu var ki Nvidia sadece insanların bilmesini istediği kadarını söylüyor kartları hakkında. Geri kalan hiçbirşeyden bahsetmiyor ve bu konuda Ati gibi cömert davranmıyor. Şu kadarını söyleyebilirim ki Nvidia'nın kendi sunumlarında ve notlarında bile 8800 GTX için mesela bazı yerlerde grafik üzerinde yaklaşık 520 GFlops, bazı yerlerde yaklaşık 350 GFlops gösterildiğini gördüm. Ama olay şu ki GF 8 serisi (ve GF 9 kartları) vermeleri gereken performansı verdiler. Sentetik testlerde bile.

    quote:

    Zaten bir SP 3 birimden olusuyordu: integer scalar unit, flopt32 mad scalar ve flopt32 mul scalar............. Ha bi de, bunlar floating point oldugu icin ALU degil de FPU olmuyor mu?


    Bu birimler ALU oluyor çünkü zaten sizin de yukarıda belirttiğiniz gibi sadece floating point işlemleri değil integer işlemleri ve hatta special function işlemleri de yapıyorlar. Bazıları sayısal olarak çok göz önünde olduğu için bu işlem birimlerinin sadece kayar nokta hesapları yaptığını zannediyor ki aslında bu işlem birimleri daha pek çok işlem yapıyorlar.


    Anladım, sağol. Zaten senin cevabını beklemeyip "missing MUL" diye arattığımda direk Beyond3D'nin forumları çıktı, oradan baktım:)

    GTX 280'in 600 doları hakedip haketmeyeceği, doğal olarak piyasadaki rakiplerinin fiyatlarına ve performanslarına göre değişecektir. Demek istediğim, şu an $500 civarında 9800GX2 varken, insanlar eğer GTX 280 daha hızlı değilse $600+ verip de GTX 280 almayacaktır. Dolayısıyla en azından %10 daha hızlı olmalı.

    Biraz araştırıp edindiğim bilgilere göre, GPU'daki compiler'in (NVidia'da "thread process manager" oluyor bu, cluster'larin hangi shader'lari hangi thread uzerinde çalıştıracaklarono söyleyen şey) koddan çıkardığı instruction'larin %30 civarı multiply oluyormus. Yani buna gore, direk FLOP hesabi yaparsak elde edeceğimiz "GTX 280'in shader basina %50 daha hızlı olacağı (ADD+MUL=2 yerine ADD+MUL+MUL=3)" ancak teorik peak hızda olabiliyor; normalde işlemlerin çoğu add olduğu için 1 multiply daha ekleyince reel uygulamalarda SP başına %50 performans artışı görmek mümkün değil, %20 civarı olması lazım. Bu yaklaşım doğru mudur acaba?

    Bu arada evet, 8800GTX'in asıl maksimum işlem gücü 128 * 1437 * 2 = 365 GFLOPS oluyor. NVidia'nın SP blok şemalarında gösterdiği gibi MADD + MUL olsa 550 GFLOPS olurdu.

    Tabii örneğin 3870x2'nin teorik çıktısı 1000 GFLOP civarı, ama GTX 280'in 1300 * 240 * 3 = 936 GFLOP. Yani bu teorik işlem gücüyle karşılaştırma yapmak çok mantıklı değil. Ama bence benzer mimarilerde (aynı markanın benzer mimarilerinde yani) bu şekilde karşılaştırma yapmak çok kötü sonuç vermemeli.




  • saat hizlari birsey ifade etmiyor, artik olay mimaride bitiyor.
    bu arada fx bravo, koca koca donanimhaber yazmissin resimlere ki bazi siteler hic haber kaynagi vermeden alinti/calinti yapiyorlar, bunu engellemissin:
    http://www.theinquirer.net/gb/inquirer/news/2008/05/24/gtx260-280-revealed
    yalniz, inquirer'a gore gtx280 r700'den cok kotu olacakmis (inquirer'in yalancisiyim)
  • quote:

    Orjinalden alıntı: 865pe

    http://www.theinquirer.net/gb/inquirer/news/2008/05/26/deliberate-understatement-real


    şurayı bi açıklayan varmı


    kabaca demişki: yeni nesil ati ve nvidia ekran kartları önceki nesile göre % 50 performans artışıyla gelio ama 4870 in %50 artan sp, % 100 artan tmu ve % 10 artan çekirdek hızı ve % 80 daha fazla bellek bant genişliği ni düşünürsek 3870 e göre zaman zaman %100 daha fazla performans vereceğini anlamak için müneccim olmaya gerek olmadığını, Gtx 280 in 933 gflops hesap gücü olduğunu, 4870 in 1008 gflops kayar nokta hesap gucu olduğunu, gtx280 in 700 gibi daha agresif bi saat hızı yerine 600 mhz ile geldiiğini ve bunun sonucunda perfromansının düştüğü ve 4870 e daha fazla yaklaştığını, gtx280 in 4870 i geceğini ama bunun çok buyuk bi fark olmayacağını ve 4870 x2 nin yakında geleceğini ama buna karşın nvidianın 55 nm ye geçmeden önce 256 sp li daha yuksek saat hızlı bi ultra planının olabileceğini ve böyle bişi yapmanın nvidia için iyi olacağını çünkü artık rakabetin çok ciddi geceğini söylemiş



    < Bu mesaj bu kişi tarafından değiştirildi tobold -- 27 Mayıs 2008; 16:23:26 >




  • quote:

    Orjinalden alıntı: tobold

    quote:

    Orjinalden alıntı: 865pe

    http://www.theinquirer.net/gb/inquirer/news/2008/05/26/deliberate-understatement-real


    şurayı bi açıklayan varmı


    kabaca demişki: yeni nesil ati ve nvidia ekran kartları önceki nesile göre % 50 performans artışıyla gelio ama 4870 in %50 artan sp, % 100 artan tmu ve % 10 artan çekirdek hızı ve % 80 daha fazla bellek bant genişliği ni düşünürsek 3870 e göre zaman zaman %100 daha fazla performans vereceğini anlamak için müneccim olmaya gerek olmadığını, Gtx 280 in 933 gflops hesap gücü olduğunu, 4870 in 1008 gflops kayar nokta hesap gucu olduğunu, gtx280 in 700 gibi daha agresif bi saat hızı yerine 600 mhz ile geldiiğini ve bunun sonucunda perfromansının düştüğü ve 4870 e daha fazla yaklaştığını, gtx280 in 4870 i geceğini ama bunun çok buyuk bi fark olmayacağını ve 4870 x2 nin yakında geleceğini ama buna karşın nvidianın 55 nm ye geçmeden önce 256 sp li daha yuksek saat hızlı bi ultra planının olabileceğini ve böyle bişi yapmanın nvidia için iyi olacağını çünkü artık rakabetin çok ciddi geceğini söylemiş


    Ayrıca bu makalede NVIDIA'nın yeni saat hızlarıyla çıkabileceği de söylenmiş.Sürpriz bir çıkış yaparak
    daha yüksek saat hızlarıyla gelip Teraflop barajını aşabileceği belirtilmiş.




  • 
Sayfa: 1
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.