## GeForce GTX 200 Serisinin Resmi Saat Hızları ##

fx57 · 2008-05-26T21:02:00.0000000+03:00

Nvidia'nın GeForce GTX 200 serisine yönelik olarak bellek miktarı, bellek veri yolu ve paralel işlem birimi sayısı gibi önemli ve doğrulanmış detayları geçtiğimiz hafta dünyada ilk defa sizler ile paylaşmış ve yaptığımız bu haber uluslararası alanda da ciddi ses getirmişti. Şimdiyse elimize yine Nvidia'nın yeni bir resmi dökümanı eşliğinde GeForce GTX 200 serisinin saat hızlarına yönelik bilgiler de geçti. Mevcut bilgilere göre Nvidia bellek veri yolu ve paralel işlem birimlerinin oluşturduğu farklardan ötürü özellikle saat hızlarını yakın tutmayı tercih etmiş gibi görünüyor. 18 Haziran'da anons edilecek olan GeForce GTX 200 serisinin teknik özelliklerini performansa nasıl yansıtacağını ise birlikte göreceğiz.

Sıcak Fırsatlarda Tıklananlar

Editörün Seçtiği Fırsatlar

Taktikal Led USB ŞARJLI Ultra Güçlü Mini Boy El Feneri [Enerji Sınıfı A++] : Amazon.com.tr: Yapı Market https://www.amazon.com.tr/gp/product/B09J5C4JB9?psc=1 5 sa. önce paylaşıldı

New Balance 411 Lifestyle Erkek Günlük Ayakkabı - M411BB2 : Amazon.com.tr: Moda https://www.amazon.com.tr/dp/B0CJ5JR51K 7 sa. önce paylaşıldı

Logitech M705 Marathon Kablosuz Mouse, 2,4 GHz USB Alıcı, 1000 DPI, 5 Programlanabilir Tuş, 3 Yıl Pil Ömrü, PC, Mac, Dizüstü Bilgisayar ve Chromebook ile Uyumlu, Siyah : Logitech: Amazon.com.tr: Bilgisayar https://www.amazon.com.tr/dp/B003STDR1E 5 ay önce paylaşıldı

Daha Fazla

Bu Konudaki Kullanıcılar: Daha Az

1 Misafir - 1 Masaüstü

5 sn

83
Cevap

0
Favori

8.852
Tıklama

Daha Fazla
İstatistik

Konu İstatistikleri Yükleniyor

Konuya Özel

0 oy

Öne Çıkar

Cevapla

Sayfa: 1

Giriş

Mesaj

fx57

Yarbay

29231 Mesaj

Tüm Başarılarını Gör

tobold

Yüzbaşı

495 Mesaj

Tüm Başarılarını Gör

kobb

Yüzbaşı

911 Mesaj

Tüm Başarılarını Gör

Bu haberden daha önce GTX 280 @ Folding@Home başlığında bahsetmiştik aslında: http://forum.donanimhaber.com/m_23433606/mpage_2/tm.htm

## GeForce GTX 200 Serisinin Resmi Saat Hızları ##

Epey eski bir Nvidia sunumundan alıntı. Burada GPU'ların ALU genişliğinin artmasının performans ve güç tüketimi üzerinde olan etkilerinden bahsedilmiş. Şimdi olay şu:

GPU'lar CPU'ların aksine "massively parallel architecture" dediğimiz mimarilerdir. Çok sayıda ALU birimi yığınsal işlemleri bir arada yaparlar. GPU'larda performans arttırımı en temel şekilde ya çalışma frekans arttırımı ya da ALU genişliğinin (yani her bir ALU kümesine düşen ALU birimi sayısının ve hatta bu kümelerin sayısının) arttırılmasıyla olabilir. Tabii bunların her ikisinin de arttırımı performansı daha da çok arttırır ama konu bu değil.

Burada bahsedilen olay şu ki ALU genişliğinin arttırılıp bu yolla performansın arttırılması, ALU genişliği arttırılmadan frekans üzerinden performans arttırılmasına göre daha iyi bir performans/güç tüketimi (watt) oranı yakalıyor.

Nvidia gpu yükünün çoğunu çeken ALU'ların hızının, genel çekirdek hızına olan oranını GTX 280 ve GTX 260'da düşürmüş (mesela G92'lere kıyasla).

Bu bize yukarıda bahsettiğimiz olayın bir uygulamasını gösteriyor. Nvidia performans/watt oranını daha yukarılara taşımak için ALU genişliği artarken frekansı azaltıyor.

Ama eğer bu doğrudan doğruya karşılaştırılabilir niteliklerde SP'ler (ALU'lardan oluşan işlem birimleri) üzerinde olsa kesinlikle sonuç çok iyi olmazdı. Düşünsenize G92'de 128 tane olan SP birimlerinin aynısını alıp G200'e 240 tane koyuyorsunuz ve de saat hızını düşünürüyorsunuz. Evet bu durumda da aynen yukarıdaki gibi bir ALU arttırımı/Saat hızı azaltımı yaşanıyor ve perf/watt oranı yükseltiyor ancak böyle bir durumda da performans arzu edilen seviyelerde olmayabilir.

Hatırlanacağı üzere G80'de 128 tane SP birimi vardı ve bunlar da döngü başına bir MADD (Multiply&Add) ve de bir MUL (Multiply) işlemi yapılabiliyordu. Adı üstünde bu işlemler her bir SP başına bir döngüde toplam üç kayar nokta işlemi ediyor (bir MADD yani bir çarpma ve toplama işlemi ile bir MUL yani bir çarpma işlemi). Mimari sonradan incelendikçe G80 ve türevlerinde MADD işleminin yanında yapılan bu MUL işlemlerinin aslında MADD işlemini yapan ALU'ların olduğu SP birimlerine ait değil de, ayrıca işlem birimi kümeleri içinde bulunan Special Function-ALU ya da Interpolator adıyla geçen birimlerde üstlenildiği farkedildi. Burada ortaya çıkan ilginç bir diğer durum da şu ki bu ekstra MUL işleminin görevlendirilmesinde (gpu içindeki tüm birimleri elinden geldiğince her döngüde maksimuma yakın görevlendirmeye çalışır, görevlendirilmeyen birimler o döngüde boş kalır) ciddi bazı aksaklıklar olduğuydu. En verimli durumlarda bile en fazla iki döngüde bir MUL işlemi ve MADD işlemi bir arada görevlendirilebiliyordu. Diğer çoğu durumda ise sadece bir MADD işlemi yapılıyordu yani MUL pas geçiliyordu. En ilginç olan nokta ise şu ki bu en yüksek verimler hep 3B dışı uygulamalarda ulaşılıyordu, iş 3B olunca MUL bu kadar da (hatta hiç) kullanılamıyordu. Eğer Nvidia'nın sitesinden Tesla 870 serisine bakarsanız C üzerinden kullanılabilir olarak 430 GFlops'luk bir değer görürsünüz ki bu da tam 2.5*128*1.35 değeriyle elde ediliyor (2.5 değeri her döngüde kullanılan 2 Flopsluk bir MADD ve en fazla 2 döngüde 1 Flops olarak çıkabilen ya da bir başka deyişle bir döngüde en fazla 0.5 Flops olarak çıkabilen MUL için). Ancak konu oyunlar olunca bu değer bir anda 2*128*1.35 oluyor yani 345.6 GFlops. Görünen o ki oyunlar çok büyük bir oranla bu kadarını kullanıyor. Ancak hemen belirtmek istiyorum ki bu değerlere bakarak farklı mimarilerle güç karşılaştırması yapmak kolay değil.

Şimdi olay şu ki Nvidia G200 gpusunda bu eksik MUL işlemini artık gpunun her türlü kullanmasını sağlıyor. Böylelikle SP işlem birimi başına düşen oyun performansı ALU performansına bağlı olarak %50 artıyor. Nvidia'nın sızdırılan o gpu özellikleri verilerinde söylemek istediği bu. Yani oyun performansı olarak gpu hem 240 işlem birimiyle eski nesle üstünlük kuruyor, hem de her bir işlem birimi eskiden olduğundan %50 daha iyi oyun performansı sunuyor. Bu bağlamda Nvidia belki de yukarıda bahsettiğimiz gibi eskiden verimli kullanamadığı MUL ALU'larını tekrar oyuna sokması sayesinde ve de 240 işlem birimine ulaşması sayesinde GTX 280 için 1300 MHz'den fazlasını istememiş olabilir. Yaklaşık 240 W'lık güç tüketimi sınırmalası hedefi içinde saat hızları yüksek ama mesela 192 SP'ye sahip bir çip yerinde belki de 240 SP birimine sahip ama şimdiki gibi 1.3 GHz hızda çalışan bir çipi yapmayı daha performanslı bulmuş olabilir. Elbette hızın daha fazla olması performansa katkı yapar ama ne derece gerek olduğunu ve 230-240W limiti içinde ne derece mümkün olduğunu ancak Nvidia bilebilir.

Bu açıdan olaya bakarsak GTX 280'in 3B için olan ALU gücü 8800 Ultra'nın neredeyse iki buçuk katı kadar (2.4375 katı). GTX 260'ın 3B ALU gücü de 9800 GX2'den fazla (9800 GX2'yi çift gpulu olduğu için ortalama %70'lik bir verimle çalıştığını düşündüm bunu belirtirken ki böyle kabul etmek zorunda da değilsiniz, %100 olarak düşününce bu durumda da daha az oluyor GTX 260'ınki). Ayrıca tüm bunlar dışında G200 gpusunun her yerinde bir sürü yeni numaranın olacağına emin olabilirsiniz.

Açıkçası Nvidia'nın shader / rop domain hızı oranları dediğim gibi kartların perf/watt oranlarını yükseltmek için bu şekilde düşünülerek düşük tutulmuş olabilir.

G200 yieldlarına gelirsek Nvidia sizce 1.4 milyar transistörü tek bir gpuya koyarken yieldın nasıl olacağını düşünmemiş midir? Hem de son derece iyi bildiği ve iyice öğrenecek kadar zamandır üretim yaptığı 65 nm tekniğinde (Nvidia'nın ATi'ye göre yeni silikon üretim tekniklerine geçişte daha az agresif davranmasının sebeplerinden birisi budur). Ayrıca zaten kimse yieldların G94 yieldi gibi olmasını beklemez ki zaten. Nvidia geçenlerde 1. çeyrek finansal sonuçlarını uzmanlarla değerlendirmek için yaptığı toplantısında G92'nin yield problemi yaşadığını ancak durumun çözüldüğünü ve 2. çeyreğin sonunda duyurulacak yeni ürünlerin kar marjlarının çok daha yüksek olduğunu söylemişti. Zaten yieldın düşük olması da kar marjı açısından önemlidir. Yield düşükse az miktarda kullanılabilir/istenilen standartta gpu üretiyorsunuz demektir, birim gpu maliyeti artar ve kart başına kar marjı düşer. GTX 280 ve 260 da kar marjlarının oldukça iyi olacağını iddia etti uzmanlara Nvidia bu toplantıda ki GTX 260 450 dolara, GTX 280 ise söylentilere göre 600 dolardan daha yüksek bir fiyata satılacak.

Son olarak Nvidia editör gününe gitmiş ve de şu an kartı almış inceleyen bir editör kartın performansının çok iyi olduğunu söylüyor. Hatta iddialı bir şekilde eğer GF8'in GF7'ye attığı farkın çok olduğunu düşünüyorsanız yeni Geforce'un eskilere attığı farkı görünce şok olacaksınız demiş. Ne derece doğru bilemiyorum tabii.

Bu da editör gününden bir resim. Huang kartı gösteriyor.

Sonuçlar ne olur bilemem ama iyi bir kart geliyor bence.

< Bu mesaj bu kişi tarafından değiştirildi kobb -- 27 Mayıs 2008; 0:35:39 >

kobb

Yüzbaşı

911 Mesaj

Tüm Başarılarını Gör

Annihilator yazı en azından yeni gpuyla ilgili bazı noktaları aydınlattıysa ne mutlu... Bu arada ben biryerlerden alıntı yapmam.

Ancak şu kadarını da ekleyelim ki GPU resmi olarak duyurulana kadar hiçbirşey %100 garanti değil.

GTX 280'in 600+ doları haketmesi konusuna gelecek olursak bence burada kriter 8800 GTX olmalı. 8800 GTX fiyatının hakkını veriyor muydu? Eğer bu soruya bir kişi evet diyorsa bence aynı durum GTX 280 için de geçerli olabilir.

Eksik MUL işlemi konusuna gelirsek eğer bu konu oldukça karmaşık. İlk olarak Beyond3D'de duyduk bu durumu sonra da konu birçok platformda dallanıp budaklandı:http://www.beyond3d.com/content/reviews/1/11

Ancak Nvidia'nın kartlarıyla ilgili birtakım konular gibi bu konu hakkında da hiçbir zaman tam olarak sizin dediğiniz gibi bir makale çıkmadı. Sadece konudan anlayan kişilerin deneyimleri ve yorumları... Ve bir de konu hakkında yeterli bilgisi olmayan bir sürü kişinin yorumları... SP ile bu Interpolator birimleri konusu bile başlı başına karışık. Şu var ki Nvidia sadece insanların bilmesini istediği kadarını söylüyor kartları hakkında. Geri kalan hiçbirşeyden bahsetmiyor ve bu konuda Ati gibi cömert davranmıyor. Şu kadarını söyleyebilirim ki Nvidia'nın kendi sunumlarında ve notlarında bile 8800 GTX için mesela bazı yerlerde grafik üzerinde yaklaşık 520 GFlops, bazı yerlerde yaklaşık 350 GFlops gösterildiğini gördüm. Ama olay şu ki GF 8 serisi (ve GF 9 kartları) vermeleri gereken performansı verdiler. Sentetik testlerde bile.

quote:

Zaten bir SP 3 birimden olusuyordu: integer scalar unit, flopt32 mad scalar ve flopt32 mul scalar............. Ha bi de, bunlar floating point oldugu icin ALU degil de FPU olmuyor mu?

Bu birimler ALU oluyor çünkü zaten sizin de yukarıda belirttiğiniz gibi sadece floating point işlemleri değil integer işlemleri ve hatta special function işlemleri de yapıyorlar. Bazıları sayısal olarak çok göz önünde olduğu için bu işlem birimlerinin sadece kayar nokta hesapları yaptığını zannediyor ki aslında bu işlem birimleri daha pek çok işlem yapıyorlar.

annihilator

Yarbay

5286 Mesaj

Tüm Başarılarını Gör

quote:

Orjinalden alıntı: kobb

Annihilator yazı en azından yeni gpuyla ilgili bazı noktaları aydınlattıysa ne mutlu... Bu arada ben biryerlerden alıntı yapmam. Ancak şu kadarını da ekleyelim ki GPU resmi olarak duyurulana kadar hiçbirşey %100 garanti değil.

GTX 280'in 600+ doları haketmesi konusuna gelecek olursak bence burada kriter 8800 GTX olmalı. 8800 GTX fiyatının hakkını veriyor muydu? Eğer bu soruya bir kişi evet diyorsa bence aynı durum GTX 280 için de geçerli olabilir.

Eksik MUL işlemi konusuna gelirsek eğer bu konu oldukça karmaşık. İlk olarak Beyond3D'de duyduk bu durumu sonra da konu birçok platformda dallanıp budaklandı:http://www.beyond3d.com/content/reviews/1/11

Ancak Nvidia'nın kartlarıyla ilgili birtakım konular gibi bu konu hakkında da hiçbir zaman tam olarak sizin dediğiniz gibi bir makale çıkmadı. Sadece konudan anlayan kişilerin deneyimleri ve yorumları... Ve bir de konu hakkında yeterli bilgisi olmayan bir sürü kişinin yorumları... SP ile bu Interpolator birimleri konusu bile başlı başına karışık. Şu var ki Nvidia sadece insanların bilmesini istediği kadarını söylüyor kartları hakkında. Geri kalan hiçbirşeyden bahsetmiyor ve bu konuda Ati gibi cömert davranmıyor. Şu kadarını söyleyebilirim ki Nvidia'nın kendi sunumlarında ve notlarında bile 8800 GTX için mesela bazı yerlerde grafik üzerinde yaklaşık 520 GFlops, bazı yerlerde yaklaşık 350 GFlops gösterildiğini gördüm. Ama olay şu ki GF 8 serisi (ve GF 9 kartları) vermeleri gereken performansı verdiler. Sentetik testlerde bile.

quote:

Zaten bir SP 3 birimden olusuyordu: integer scalar unit, flopt32 mad scalar ve flopt32 mul scalar............. Ha bi de, bunlar floating point oldugu icin ALU degil de FPU olmuyor mu?

Bu birimler ALU oluyor çünkü zaten sizin de yukarıda belirttiğiniz gibi sadece floating point işlemleri değil integer işlemleri ve hatta special function işlemleri de yapıyorlar. Bazıları sayısal olarak çok göz önünde olduğu için bu işlem birimlerinin sadece kayar nokta hesapları yaptığını zannediyor ki aslında bu işlem birimleri daha pek çok işlem yapıyorlar.

Anladım, sağol. Zaten senin cevabını beklemeyip "missing MUL" diye arattığımda direk Beyond3D'nin forumları çıktı, oradan baktım:)

GTX 280'in 600 doları hakedip haketmeyeceği, doğal olarak piyasadaki rakiplerinin fiyatlarına ve performanslarına göre değişecektir. Demek istediğim, şu an $500 civarında 9800GX2 varken, insanlar eğer GTX 280 daha hızlı değilse $600+ verip de GTX 280 almayacaktır. Dolayısıyla en azından %10 daha hızlı olmalı.

Biraz araştırıp edindiğim bilgilere göre, GPU'daki compiler'in (NVidia'da "thread process manager" oluyor bu, cluster'larin hangi shader'lari hangi thread uzerinde çalıştıracaklarono söyleyen şey) koddan çıkardığı instruction'larin %30 civarı multiply oluyormus. Yani buna gore, direk FLOP hesabi yaparsak elde edeceğimiz "GTX 280'in shader basina %50 daha hızlı olacağı (ADD+MUL=2 yerine ADD+MUL+MUL=3)" ancak teorik peak hızda olabiliyor; normalde işlemlerin çoğu add olduğu için 1 multiply daha ekleyince reel uygulamalarda SP başına %50 performans artışı görmek mümkün değil, %20 civarı olması lazım. Bu yaklaşım doğru mudur acaba?

Bu arada evet, 8800GTX'in asıl maksimum işlem gücü 128 * 1437 * 2 = 365 GFLOPS oluyor. NVidia'nın SP blok şemalarında gösterdiği gibi MADD + MUL olsa 550 GFLOPS olurdu.

Tabii örneğin 3870x2'nin teorik çıktısı 1000 GFLOP civarı, ama GTX 280'in 1300 * 240 * 3 = 936 GFLOP. Yani bu teorik işlem gücüyle karşılaştırma yapmak çok mantıklı değil. Ama bence benzer mimarilerde (aynı markanın benzer mimarilerinde yani) bu şekilde karşılaştırma yapmak çok kötü sonuç vermemeli.

ozturert

Yarbay

7637 Mesaj

Tüm Başarılarını Gör

865pe

Yarbay

7303 Mesaj

Tüm Başarılarını Gör

tobold

Yüzbaşı

495 Mesaj

Tüm Başarılarını Gör

Sayfa: 1

Benzer içerikler

Ip işlemleri

Bu mesaj IP'si ile atılan mesajları ara Bu kullanıcının son IP'si ile atılan mesajları ara Bu mesaj IP'si ile kullanıcı ara Bu kullanıcının son IP'si ile kullanıcı ara

KAPAT X

%40
Kazan

%2,8
Kazan

%5
Kazan

%6,8
Kazan

%1,6
Kazan

%3,2
Kazan

%5,5
Kazan

%1,2
Kazan

%5
Kazan

%3,2
Kazan

%6,4
Kazan

%2
Kazan

Alışveriş Yaptıkça Para Kazan Harekete Geç »