S

Yarbay
09 Şubat 2006
Tarihinde Katıldı
Takip Ettikleri
7 üye
Görüntülenme
Toplam: 70 (Bu ay: 1)
Gönderileri
Intel iki yıl önce, AMD'nin dualcore teknolojisinin gerisinde kalmıştı, gerçek anlamda rekabet edebilecek bir ürünü yoktu. Ardından Conroe mimarisi geldi, Core 2 Duo ve Quad işlemciler. Bu hamle ile firma, Pentium 4 tipi mimari ile kaybettiği performans tacını geri alabildi.


O zamanlar Intel, 1990'da yaptıkları gibi, geçmişte çıkış yakaladıkları mimarilere geri dönüş yapacaklarını duyurdu. Planın ilk aşaması, Core 2 ürünlerin piyasaya sunulmasının 12 ay ardından, üretim teknolojisini bir sonraki aşamaya taşımak ve mevcut mimaride iyileştirmeler ile yeni revizyon ürünleri piyasaya sürmekti, bunu Penryn ile yaptılar. Ardından, 24 ay sonrasında tamamen yeni, Nehalem adlı bir mimariyi kullanıma sunacaklardı.



Conroe mimarisi yüksek performans ve makul güç tüketimi sundu. Herkesin kabul edeceği gibi, bu mimari geliştirilirken durum pek parlak değildi, Intel'in elinde üzerine koyarak rekabet gücünü arttıracağı bir mimari yoktu. Intel, Pentium 4'ün çıkmaz sokak olduğunu keşfedince, Intel gibi bir firma için bile kolay olmayan bir şekilde, acilen yeni bir mimari icad etmeleri gerekti.


İsrail, Haifa'daki, taşınabilir cihazların çiplerinin mimarisinden sorumlu mühendis ekibi, birden bütün Intel işlemcileri için yeni bir mimari tasarlamakla görevlendirildi. Onlar için zorlu bir görevdi çünkü Intel'in geleceğini omuzlamışlardı. Çok az vakitleri olduğunu ve büyük baskı altında çalışmak zorunda olduklarını göz önüne alırsak, başarıları dikkate değerdi. Bu da ekibin tasarımda neden bazı konularda fedakârlıkda bulunduğunu açıklıyor.


Conroe, Pentium M'nin ciddi anlamda yeniden yapılandırılmışı olmasına rağmen, bu mimari mobilite denince akla gelen bazı şeylere uymuyor. Mimari o kadar da modüler, yani isteğe göre üzerinde oynanabilir, varyasyonları değişik amaçlarda kullanılabilir değil. Neden derseniz, bu mimari Intel'in bütün ürün gamında kullanılmak durumunda kalındı, notebooklardan sunucu sistemlerine. Ama temel olarak, paketler ve soketler değişse de, çip hep aynıydı, sadece değişiklik yapılabilen alan L2 önbelleğiydi. Bu mimarinin çift çekirdekli olmak üzere geliştirildiği çok açıktı ve dört çekirdeğe geçiş için bir tür numara yapmaları gerekti, iki çift çekirdekli işlemcinin zarını, tek gövdede biraraya getirdiler. Ayrıca FSB'nin varlığı da bazı işlemcilerin tasarımında güçlük çıkardı, çünkü bu teknoloji bellek erişiminde bir darboğazdı. Son olarak, sunucularda standart çalışma modu olan macro-ops fusion, 64-bit ile çalışmadı.


İki yıl önceki şartlar göz önüne alınırsa, esgeçilen bu meseleler makul karşılanabilir, ama bugün rakibi AMD, Opteron işlemcileriyle kurumsal sistemlerde kendisini zorda bırakırken, artık bunları bahane olarak kullanamaz. Intel, Nehalem ile, şu ana kadar eksikliğini çektiği ve zayıf noktası olan modüler mimari konusundaki eksiğini gidermeye ihtiyaç duyuyor ki bu sayede üç büyük piyasadaki değişik ihtiyaçları karşılayabilsin: Taşınabilir cihazlar, masaüstü sistemler ve sunucular.



Nehalem, kısaca nasıl birşeydir?


Nehalem modüler yapıda olmak üzere tasarlandı. Intel mühendisleri, lego parçaları gibi kullanarak varyasyonlar yapabilecekleri bazı blok birimler tasarlamayı hedeflemişti.



(IA Core: Çekirdek, iGraphics: Entegre grafik işlem birimi, Cache: Önbellek, IMC: Entegre bellek denetleyicisi, QPI: Quickpath Interconnect)


Mimarinin amiral gemisi ürünleri, yüksek performanslı işistasyonları ve sunucularda kullanılacak. İlk bakışta AMD'nin Barcelona (K10) mimarisini hatırlatıyor. Doğal olarak dört çekirdekli (Yani az önce anlatıldığı gibi iki çift çekirdeklinin tek pakette sunumu değil), üç seviye önbelleği, entegre bellek denetleyicisi, çevre birimleri ile ve birden fazla işlemci kullanımında bunlarla noktadan noktaya yüksek performanslı iletişim sağlayacak arabağlantısı var. Bu, AMD'nin teknolojik seçimlerinin kötü olmadığı, yalnızca arzuladıklarını yeterince yerine getiremediği ve mevcut tasarımında tam anlamıyla kullanmaya muvaffak olamadığı anlamına geliyor.



Ama Intel, rakibinin yenilikçi fikirlerinden ilham almaktan fazlasını yaptı. Ellerindeki üretim teknolojisinin de avantajını kullanarak, 731 milyon transistörün yardımıyla, her çekirdeğin karakteristik özelliklerini geliştirirken yeni fonksiyonlar da eklediler. Meselâ, eşzamanlı çoklu-yürütme, Pentium 4 Northwood zamanında Hyper-Threading ismiyle ilk olarak ortaya çıkmıştı. Nehalem'de, dört çekirdek içeren iki zarın tek paket altında kullanımıyla, çekirdek başına 2 thread ile, 16 iş parçacığı eşzamanlı olarak işlenebilecek. İlk bakışta bu basit gibi görünse de, sonradan göreceğimiz gibi, bu bazı işhatlarında büyük etkiye sebep oluyor, birçok arabellek tekrar boyutlandırılmak zorunda bu tür çalışmanın performansı kötü etkilememesi için. Ayrıca Nehalem'e yeni SSE komutları eklendi. Mimari SSE 4.2'yi destekliyor, ki yine bunun bazı parçaları AMD'nin K10 mikromimarisinden ödünç (!) alınmışa benziyor.


Şimdi mimari hakkında kabaca bir fikir sahibisiniz, artık biraz daha detaya inme zamanı, işhattının ön-ucundaki, bellekteki komutları okuyup onları işlenmeye hazırlayan bölümle başlayalım.



Komutların okunması ve çözümlenmesi



Core'dan Core 2 mimarisine geçişten farklı olarak, Intel, Nehalem'in ön-ucunda pek bir değişiklik yapmadı. İlk Conroe ile ortaya çıkan aynı dört çözümleyiciye sahip, üç basit ve bir karmaşık. Hâlâ macro-ops fusion birleştirmesini yapabiliyor ve bu yüzden teorik olarak maksimum akış, her cycle için 4+1 x86 komutu.



İlk bakışta çok da devrimsel nitelikte değişiklik görünmüyor, ama şeytan ayrıntıda gizlidir demişler. Performansı arttırmak için, işlem birimlerinin adedini arttırmaya yönelmek, son derece verimsiz bir yol, size maliyetini hesaba katarsanız. Maliyeti yüksek ve her eklemeyle elde ettiğiniz kazanç giderek düşüyor. Bu yüzden, yeni çözümleyiciler eklemektense, mühendisler mevcut olanların etkinliğini arttırmaya yönelmiş.


İlk olarak, 64-bit modunda macro-ops fusion desteği eklenmiş, ki bu da Nehalem mimarisinin sunucular konusunda da hedefleri olduğunu açığa çıkarıyor. Ama mühendisler bununla yetinmemiş, Conroe mimarisi sınırlı sayıda komutları birleştirebilirken, Nehalem çok daha fazla çeşide izin veriyor, bu sayede daha sık macro-ops fusion kullanılabiliyor.


Conroe ile gelen bir diğer özellik de geliştirilmiş: Loop Stream Detector (Döngü akış algılayıcısı) . İsmin arkasında yatan kısaca şu, birtakım komutları tutan (Conroe'larda 18 x86 komutuydu) bir veri arabelleği var. Bir döngü algılandığında, işhattının bazı kısımlarını devredışı bırakıyor. Döngü, aynı komutların defalarca işlenmesi olduğundan, nerede işleneceğinin belirlenmesi veya döngünün her seferinde komutu L1 önbellekten alması gerekli değildir. Yani Loop Stream Detector, benzer durumlarda işhattında kısadevreler yapan küçük bir önbellek gibi çalışır. Bu yolla elde edilen kazanç iki türlüdür: Gereksiz görevleri tekrar yaptırmaktan kaçınarak güç tüketimini düşürür ve L1 komut önbelleğindeki yükü azaltarak performansı arttırır.



Nehalem mimarisi ile Intel, LSD'nin işlevselliğini geliştirdi. Arabellek eskisinden daha büyük, şimdi 28 komut tutabiliyor. Daha da fazlası, işhattındaki yeri de değiştirildi. Conroe'da, komut yakalama aşamasının hemen ardında yer alıyordu. Şimdi ise çözümleyicilerden sonra geliyor, bu şekilde işhattında daha fazla döngü tesbit edilip iptal edilerek, boşuna işlem yapma ihtimali daha da azaltılıyor. Nehalem'in LSD birimi artık x86 komutlarını tutamıyor, ama microops (x86 komutlarının daha küçük komutlara tercümesinden elde edilen komutcuklar) tutuyor. Bu bakımdan Pentium 4'ün önbellek izleme konseptine benziyor. Bu mimariden esintileri Nehalem'de görmek şaşırtıcı değil çünkü Nehalem'i tasarlama görevi verilen ekip, Pentium 4'ü yapan ekipti. Ama Pentium 4, tek çözümleyici kullanıyordu ve önbellek izlemesi o kadar verimli değildi veri ıskalama ihtimaline karşı, Nehalem'de ise dört çözümleyici var ve LSD de bu gibi durumlar için iyileştirmeler sağlıyor. Kısaca Pentium 4 ve Conroe'nun en iyi yönleri birleştirilerek kullanılmış.


Dallanma seçicileri


Önuçta yapılan son geliştirme dallanma seçicilerinde. Dallanma seçme algoritmalarının etkinliği, yüksek seviyede komut paralelliğinin gerektiği mimarilerde hayati öneme sahip. Dallanma ile paralellik kırılır, çünkü önceden işlenip de sonucunun alınması gereken bir komut beklenmelidir ki komutların işlenme akışı devam edebilsin. Dallanma seçimi ile, dallanma olup olmayacağı belirlenir, eğer olacaksa, devam etmekte olan işlemin çabucak bir sonraki hedefi seçilir. Bunu yapmak için karmaşık tekniklere gerek yoktur, tek gereken dalların dizilmesidir, Branch Target Buffer birimi dallardaki işlem durumlarının sonuçlarını depolar ve bir sonraki dallanmanın sonucunu belirler.


Intel, yeni dallanma seçicileri hakkında detay vermedi, ama bilindiği kadarıyla artık iki-seviyeli oldular. İlk seviyesi Conroe mimarisinden değiştirilmeden alınmış, ama daha fazla dallanma geçmişi tutabilen, erişimi daha yavaş yeni bir seviye eklenmiş. Intel'e göre, büyük hacimli kodlar kullanan belli uygulamalarda bu konfigürasyon dal seçiminin etkinliğini arttırıyor, veritabanları gibi, bu da yine Nehalem'in biraz da sunucu odaklı bir mimari olduğunu ortaya koyuyor. Diğer geliştirme ise Return Stack Buffer biriminde, bu birim çağrıldığında fonksiyonların geri dönüş adreslerini tutuyor. Bazı durumlarda bu arabellek taşabilir, bu da yanlış dal seçimlerine sebep olur. Bunun olma ihtimalini azaltmak için AMD, büyüklüğünü 24 girişe kadar arttırdı, Intel ise Nehalem'de bu arabellek için bir tür yeniden isimlendirme sistemi getirdi.


Hyper-Threading'in geri dönüşü



Yani, önuçta, arka uçta da olduğu gibi, pek de köklü değişiklikler olmamış. Son revizyon Core işlemcilerdekiyle tamamen aynı komut yürütme birimlerine sahip, ama burada da mühendisler bunları nasıl daha etkin kullanabilecekleri üzerinde çalışmış.



Nehalem ile Hyper-Threading muhteşem geri dönüşünü yapıyor. İlk olarak Intel'in NetBurst mimarisinde Northwood sürümünde ortaya çıkan HT, diğer ismiyle SMT, çekirdeğin işlem birimlerinin kullanımını arttırmak için iş parçacığı paralelliğini kullanarak, çekirdeğin uygulama seviyesinde çift görünmesi anlamına geliyor.


Paralel iş parçacıkları kullanabilmek için, bazı kaynakların çiftlenmesi gerekiyor, yazmaçlar (register) gibi. Diğer kaynaklar iki iş parçacığı tarafından ortak kullanılıyor, buna komut yeniden düzenleme arabelleği, yürütme birimleri ve önbellek de dahil. Basit bir gözlem SMT'nin kullanımına götürdü: İşlemciler genişledikçe (daha fazla yürütme birimi geldikçe) ve derinleştikçe (işhattındaki aşamaların artması) , her cycle da yeterince paralel işlem yaptırmak zorlaşır. Pentium 4 , 20'den fazla işhattı aşamasıyla çok derinken, Nehalem çok geniş. Üç bellek işlemi ve üç hesaplama işlemi yapabilecek altı yürütme birimi var. Eğer yürütme motoru, kullanabileceği yeterince paralel komut bulamazsa, işhattında baloncuklar (iş yapılmayan, boş cyle) oluşur.



Bunun üstesinden gelmek için, SMT çareyi komut paralelliğini tek yerine çift iş parçacığı izlemeyle arar, amaç mümkün olduğunca az kullanılmamış birim bırakmaktır. Bu yaklaşım, iki iş parçacığı birbirinden oldukça farklı görevler yürütürken aşırı derecede etkin olabilir. Diğer yandan dezavantaj olaraksa, mesela, yoğun hesaplama içine giren iki izlek, aynı hesaplama birimleri üzerindeki yükü arttıracaktır, misal, önbellekteki aynı yere ulaşmak için birbirleriyle rekabete girerler. Bu da istenmeyen, arzulanmayan, performansı kötü etkileyecek bir durumdur.



SMT'nin yürütülmesi




Yine de, SMT'nin performansa etkisi çoğu zaman olumlu yöndedir ve maliyeti kaynak olarak çok azdır, bu da, bu teknolojinin neden geri geldiğini açıklıyor. Ama programcılar Nehalem'e dikkat etmeli, çünkü bütün iş parçacıkları eşit oluşturulmuyor. Bu bulmacayı çözmelerine yardımcı olmak için, Intel işlemcinin tam topolojisinin isabetli bir şekilde kullanılması için bir yol sağlıyor (fiziksel ve mantıksal işlemcilerin sayısı) ve sonrasında programcılar işletim sisteminin atama mekanizmasını kullanarak her iş parçacığını bir işlemciye yollayabilir. Bu tür birşey, Xenon (Xbox 360'da kullanılan) işlemcisinin çalışma huyunu bilen programcılar için sorun olmamalı. Ama konsollardan farklı olarak, programcılar bilgisayarın işletim sisteminde daha düşük erişime sahip çünkü işletim sisteminin görev düzenleyicisi her zaman son sözü söyler.


SMT yürütme motoruna daha ağır yük bindirdiği için, Intel darboğazın önüne geçmek amacıyla bazı dahili tampon belleklerin boyutunu arttırdı. Bu yüzden, yürütülmekte olan bütün komutların izini sürerek onları yeniden düzenleyen arabellek, Core 2 'da 96 giriş iken, Nehalem'de 128'e yükseltildi. Bu arabellek, bir izleğin büsbütün tüm kaynakları tek başına tüketmemesi için sabit olarak bölümlenir, bu yüzden izlek başı 64 giriş olarak belirlenmiş durumda. Tek iş parçacığının işlendiği durumlarda ise bütün girişlere erişimi var, bu da Nehalem'in bu yüzden, özel durumlar sebebiyle selefi Core 2'dan performans olarak geri düşmeyeceği anlamına geliyor.


Ayrıca, komutları yürütme birimlerine atayan birimin de girişi 32'den 36'ya çıkarılmış. Ama yeniden düzenleme arabelleğinden farklı olarak, bölümlendirme burada sabit değil, o yüzden izlek, yerine getireceği işleve göre az veya çok giriş alabilir.


Yük ve tutma arabelleğinin de boyutu arttırılmış. Conroe'ya göre, birincisi 32'den 48'e, ikincisi ise 20'den 32'ye çıkarılmış giriş adedi olarak. Yine burada, izlekler arası bölümlendirme sabit.


Yine SMT'nin dönüşünün bir diğer sonucu olarak, Intel'e göre, iş parçacığı senkronizasyon komutlarının performansı arttı.


SSE 4.2 ve Güç tüketimi



Nehalem mimarisi ile, Intel zaten adedi fazla olan SSE komutsetlerine bir yenisini eklemeden edemedi. Nehalem SSE 4.2'yi destekliyor, Penryn'in desteklediği tüm (SSE 4.1) komutlarını destekliyor ve yedi tane daha ekliyor. Bunların çoğu karakter dizilimi manipülasyonunu sağlamak için, Intel'in dediğine göre XML dosyalarının işlenmesini hızlandırıyor.


Diğer iki komut ise, uygulamalara özel, birisi POPCNT, Barcelona ile ilk gez gelmişti, registerdaki sıfır olmayan bitlerin adedini saymak için kullanılıyor. Intel'e göre bu komut özellikle ses tanınması ve DNA dizilimi uygulamalarında kullanışlı. Son komut, CRC32 ise, hata algılama kodlarının hesaplamalarını ivmelendirmek için kullanılıyor.


Güç Tüketimi



Nehalem mimarisiyle, mühendisler güç tüketimini düşürmek adına geliştirdikleri tekniklerde daha da ileri gittiler. Şimdi işlemciye entegre bir mikrodenetleyici var, güç kontrol ünitesi, devamlı olarak sıcaklığı ve çekirdeklerin güç tüketimini izliyor ve kullanılmadıkları zaman onları tamamen kapatabiliyor. Bu teknoloji sayesinde, kullanılmayan çekirdeğin enerji tüketimi sıfıra yakın, Nehalem öncesinde sızıntı akımları yüzünden kayıplar vardı.



Intel yine güç yönetiminde yeni bir yöntem geliştirmiş, Turbo mod adlı. Meselâ işlemci standart TDP değerinin altında çalışırken, Turbo modu kullanımda olan çekirdeklerin frekansını arttırıyor, işlemciyi yine TDP sınırının altında tutarak.





Ayrıca, Atom gibi, Nehalem'in L1 ve L2 önbellekleri de, 6 yerine 8 transistör kullanıyor, bu da zardaki alanı büyütme pahasına güç tüketimini düşürüyor.





QPI (QuickPath Interconnect)



Core mimarisi kaydadeğer derecede etkin olmasına rağmen, bazı tasarım detayları ne kadar eskiye dayandığını gösteriyor, bunların ilki Front Side Bus (FSB) sistemi. İşlemcileri kuzey köprüsüne bağlayan bu veriyolu, zamanının modern ve en iyi mimarisiydi. Çoklu işlemci konfigürasyonlarında ise, yük sürekli arttığında bu mimarinin büyük hatası ortaya çıkıyordu. İşlemciler bu veriyolunu sadece belleğe erişmek için değil, ayrıca kendi önbelleklerindeki verilerin tutarlılığını kontrol etmek için paylaşmak zorundaydı.


Bu durumda, içeriye akış hareketleri veriyolunu doyum noktasına ulaştırabilir. Intel ise bu sorunu çözmek için, sürekli FSB hızını arttırma veya daha büyük önbellek kullanma yoluna gitti, ama şimdi işlemcilerinin bellekle ve dış bileşenlerle iletişimindeki bu sorunun altında yatan nedeni ortadan kaldırma zamanı.



Intel'in çözüm için seçtiği QPI aslında yeni bir şey değil, entegre bellek denetleyicisi noktadan noktaya çalışan son derece hızlı seri bir veriyoludur. Bu teknoloji 5 yıl önce AMD tarafından işlemcilerde kullanılmaya başladı ama aslında daha da eskiye dayanır. AMD ile başlayıp, şimdi Intel ile devam eden bu konsept, 10 yıl önce DEC'de (Digital Equipment Corporation - bir firma) Alpha 21364 (EV7) 'nin tasarımı sırasında ortaya çıkan birşeydi.


Teknik yönden bakarsak, QPI çift yönlüdür ve 20-bitlik iki köprüsü var, her biri bir yöne bakan, 16 bit data için ayrılmışken, diğer dört ise hata giderme kodları ve diğer protokollerin işlevleri için kullanılır. Bu da 6.4 GT/s, yani saniyede 6.4 milyar aktarım veya hem yazma hem okuma için kullanılabilen 12.8 GB/s bant genişliği anlamına geliyor. FSB ile karşılaştırırsak, Intel'in en son işlemcilerindeki FSB, 400 MHz frekansında çalışıyor ve adres aktarımları iki clock cyle'ı gerektiriyor (200 MT/s ) , veri transferleri de QDR (quad data rate) modunda olur, 1.6 GT/s bantgenişliği ile. 64-bit genişliğiyle, FSB de 12.8 GB/s bandgenişliğine sahip ama sadece okuma veya sadece yazmada kullanılabiliyor.


Bu yüzden, teorik olarak QPI yaklaşık iki katına kadar daha fazla bandgenişliğine sahip, sağlanan okuma ve yazma hızları dengeli. Sadece okuma veya sadece yazma hızı dikkate alınırsa, FSB ile özdeş olur. Ama FSB'nin hem belleğe erişimde, hem çevre birimlerine veya işlemciler arası her türlü veri aktarımında kullanıldığını aklınızdan çıkarmayın. Nehalem ile, bir QPI köprüsü tamamen çevre birimlerine veri aktarımı için ayrılmış, bellek ile olan aktarımlar ise entegre bellek denetleyicisi tarafından kontrol ediliyor ve çoklu-soket kullanımında işlemciler arası iletişimi ise başka bir QPI köprüsü sağlamakta. En kötü şartlarda bile, QPI köprüsü FSB'den kaydadeğer derecede yüksek performans göstermeli.



Gördüğünüz gibi, Nehalem esnek ve ölçeklenebilir bir mimari olmak için tasarlanmış ve bu yüzden hedeflenen piyasa alanına göre QPI köprülerinin adedi değişecektir, tek soketli kullanımda chipsete tek köprüden, dört soketli sunucu konfigürasyonlarında dört köprüye kadar. Bu sayede, gerçekten birbirine tamamen bağlı dört işlemcili sistemler elde edilebiliyor, bu da her işlemcinin bellekteki herhangi bir yere QPI köprüsünün tam hızıyla erişebileceği anlamına geliyor bütün işlemciler birbirine köprü ile bağlantılı olduğundan.



Intel, Nehalem ile entegre bellek denetleyicisi kullanmaya başlamasıyla, sadece bandgenişliği konusunda avantaj sağlamıyor, ayrıca belleklere erişim gecikmeleri de çok azalıyor, bu da bandgenişliği kadar önemli, çünkü her erişim yüzlerce cycle'a mâlolmakta. Entegre bellek denetleyicisi ile gecikmenin azaltılmasıyla masaüstü kullanımda kaydadeğer fayda sağlanırken, bu ölçeklenebilir mimarinin asıl yararı çoklu-soket sunucu konfigürasyonlarında görülecek. Geçmişte CPU eklendikçe bandgenişliği sabit kalırken, şimdi eklenen her işlemci ile bandgenişliği de artıyor, çünkü her işlemci kendi yerel bellek aralığına sahip.



Mucize denebilecek kadar büyük bir çözüm değil. NUMA (Non-Uniform Memory Access - Tek biçimli olmayan bellek erişimi) konfigürasyonu olarak adlandırılıyor, belleğe erişme maliyeti az veya çok olabilir, verinin bellekte nerede olduğuna bağlı olarak. Yerel belleğe erişim en düşük gecikmeye ve en yüksek bandgenişliğine sahipken, tersi durumda, uzaktaki belleğe erişim QPI köprüsünden geçişi gerektirir, bu da performansı düşürür.



Performansa etkisini öngörmek zor, çünkü uygulamaya ve işletim sistemine bağlı olarak değişken. Intel'in dediğine göre uzak belleğe erişim gecikme bazında performansı %70 azaltırken, bandgenişliğini de yarı yarıya azaltıyor, yerel bellek ile karşılaştırıldığında. Intel'e göre, QPI köprüsüyle uzak erişimle bile, gecikme önceki işlemcilerle kıyaslandığında, bellek denetleyicisinin kuzey köprüsünde olduğu durumlardan yine de daha düşük olacak. Tabii ki bunlar sunucu uygulamalarında gözönüne alınacak şeyler, zaten uzun zamandır NUMA konfigürasyonu akıllarındaydı.


Üç seviye önbellek düzeni



Conroe mimarisinin bellek düzeni son derece basitti ve Intel, L2 önbelleğin performansı üzerine yoğunlaşabiliyordu, bu da o mimaride genelde çift çekirdekli kullanımlar için en iyi çözümdü. Ama Nehalem ile, mühendisler sıfırdan başladı, rakip AMD ile aynı sonuca vardılar: Paylaşımlı L2 önbellek, doğal dört çekirdekli mimari için uygun değildi. Farklı çekirdeklerin, sık bir şekilde diğerlerinin kullanabileceği veriyi sildiği durumlar oluşabiliyordu, bu da muhakkak dahili veriyolunda ve gecikmeyi yeterince düşük tutarken bütün çekirdeklere yeteri kadar bandgenişliği dağıtımında sorunlara yol açar. Bu sorunu çözmek için mühendisler, her çekirdeğe kendine has seviye iki (L2) önbellek koydu. Tek bir çekirdeğe has olduğundan ve eskiye nazaran küçük (256KB) boyutta olmasından mühendisler onu gecikme bazında çok yüksek performanslı olacak şekilde tasarlayabildi, bildirildiğine göre Penryn'e nazaran kaydadeğer derecede geliştirildi, 15 cycle gecikme, yaklaşık 10 cycle seviyesine düşürüldü.



Ardından büyük , 8 MB'lık seviye 3 (L3) önbellek geliyor çekirdekler arası iletişimi sağlamak için. İlk bakışta, Nehalem'in bellek düzeneği Barcelona'yı hatırlatsa da, L3 önbelleğin işleyişi AMD'ninkinden çok farklı, bütün alt seviyeleri de kapsıyor. Bunun anlamı şu, eğer bir çekirdek, bir veriye ulaşmayı denerse ve onu L3'de bulamazsa, diğer çekirdeklerin kendine has önbelleklerine bakmasına gerek yok, o veri orada da olmayacak. Tersine, eğer varsa, önbellekteki her hatta atanmış bit (toplamda dört) , o verinin potansiyel olarak daha düşük seviyedeki diğer çekirdeklere ait önbelleklerde olup olmadığını belirtiyor (kesin olarak değil) ve varsa hangisinde olduğunu.



Bu teknik, çekirdeklere has önbelleklerin tutarlılığını sağlamakta etkin çünkü çekirdekler arasındaki veri takası ihtiyacını sınırlıyor. Dezavantajı ise, başka seviyelerde olan veriyi kendisinde de tutarak, bellek alanını zayi etmesi. Yine de, bu zayiat hafif kalır, çünkü bütün L2 ve L1 önbellekleri toplansa, 1.25MB ediyor maksimum, L3 ise 8 MB büyüklüğünde. Barcelona'da ise, L3 önbelleği, chipin geri kalanıyla aynı hızda çalışmıyor. Dolayısıyla, bu seviyeye erişimin gecikmesi değişken ama yaklaşık 40 cycle olmalı.


Nehalem'in yeni önbellek düzenindeki tek gerçek hayalkırıklığı ise L1 önbelleği. Komutsetlerinin olduğu önbelleğin bandgenişliği arttırılmamış, hâlâ cycle başına 16 byte, Barcelona'nın ise 32 byte. 64-bit komutlar, 32-bit olanlardan daha büyük olduğundan, bu durum sunucu odaklı bir mimaride darboğaz yapabilir, bilhassa Nehalem, Barcelona'dan bir tane daha fazla çözümleyiciye sahip olduğundan ve bu da önbelleğe çok daha fazla yük bindirdiğinden. Veri önbelleğinde ise, gecikme, Conroe'ya göre bir artışla 4 cycle'a çıkmış, daha yüksek clock frekansına çıkabilmek için. Ayrıca Intel mühendisleri mimarinin paralel işleyebilmesi için L1 veri önbelleğindeki gecikmeyi arttırmış.


TLB



Yıllardan beridir, işlemciler fiziksel adresler yerine sanal adreslerle çalışıyor. Avantajlarından birisi şu, bu yaklaşımla, bilgisayarın sahip olduğundan daha fazla bellek bir program için ayrılabilir, bu sayede o anda gereken veri bellekte tutulurken, geri kalanı harddiske yazılır. Bu da, her bellek erişiminde sanal adresin, fiziksel adrese dönüştürülmesi gerektiği anlamına geliyor ve bunu yapmak için de, ilgili tarafların kaydını tutacak devasa bir tablo gerekir. Sorun şu ki, bu tablo öylesine büyür ki, çip içinde tutulamaz, o yüzden bellekte (RAM) tutulur ve hatta tablonun bir kısmı belleğe de yazılmayıp, harddiskte tutulabilir.


Eğer bu dönüştürme işlemi, her bellek erişiminde gerekli olsaydı, erişimi çok yavaşlatırdı. Sonuç olarak, mühendisler fiziksel adresleme ilkesine geri döndüler, işlemci üzerine küçük bir önbellek eklediler, dönüştürmede ilgili tarafların son eriştiği adreslerin bir kısmını tutmak için. Bu bellek, Translation Lookaside Buffer (TLB) olarak bilinir. Intel, yeni mimarisindeki TLB işleyişini tamamen elden geçirdi. Şu ana kadar, Core 2 mimarisi, son derece küçük bir (16 girişlik) seviye 1 TLB kullanıyordu, çok hızlı yüklemeler içindi ve daha büyük (256 girişlik) seviye 2 TLB'si vardı, seviye 1 TLB'de ıskalananları tutuyordu ve depolama da yapıyordu.


Şimdi Nehalem'in ise gerçek iki seviyeli TLB'si var: İlk seviye TLB veri ve komutlar arasında paylaştırılmış. Seviye 1 veri TLB'si küçük (4K) sayfalar için 64, büyük sayfalar için (2M/4M) 32 giriş tutuyor, seviye 1 komut TLB'si ise küçük sayfalar için 128 (Core 2 ile aynı) , büyük sayfalar içinse 7 giriş tutmakta. İkinci seviye ise sadece küçük sayfalarla işlem yapan 512 giriş tutabilen tümleşik bir önbelleğe sahip. Bu geliştirmenin amacı, büyük veri kitleleri kullanan uygulamalarda performansı arttırmak. İki seviyeli dallanma seçicilerinin de getirilmesiyle, bu, mimarinin sunucu odaklı olduğuna dair bir diğer delil oluyor.


Bir an için SMT konusuna geri dönelim, TLB'yi de etkilediği için. Seviye 1 veri TLB'si ve seviye 2 TLB, iki izlek arasında dinamik olarak paylaştırılmış. Tersine, seviye 1 komut TLB'si küçük sayfalar için sabit olarak paylaştırılmış, oysa büyük sayfalar için olandan bir tane daha eklenmiş, küçük boyu göz önüne alındığında bu anlaşılabilir, bu sayede izlek başına yedi giriş oluyor.


Bellek erişimi ve ön-getirme



Core mimarisiyle, bellek erişimi performans anlamında bazı şartlara bağlıydı. İşlemci, önbellek boyu olan 64-bitlik hizalanmış bellek adreslerine erişim için iyileştirilmişti. Hizalanmamış veriye erişimin yavaş olması bir yana, hizalanmamış yükün yürütülmesi veya komutun tutulması, bellekteki verinin hizalanmasından bağımsız olarak, hizalanmış komutlara göre daha maliyetliydi. Çünkü bu komutlar çözümleyicilerin işlemesi için bazı microops üretir, bu da bu tip komutun verimini düşürür. Sonuç olarak, derleyiciler maliyeti azaltmak adına komutların sıralanışını değiştirerek bu tür komutlar üretmekten kaçındı.


Bu yüzden, bellek okumada iki önbellek hattındaki üst üste binmeler, 12 cycle'lık performans kaybına sebep oluyor, 10 cycle olan yazmaya nazaran. Intel mühendisleri bu erişimleri daha hızlı olmaları için geliştirdi. İlk olarak, verinin bellekte hizalandığı durumlarda hizalanmamış yükleme/tutma komutları kullanmanın performansa kötü etkisi yok. Diğer durumlar için ise, Intel bu erişimlerdeki performans kayıplarını Core mimarisine nazaran daha az olacak şekilde iyileştirmiş.


Daha etkin çalışan daha çok ön-getiriciler



Core mimarisinde, Intel özellikle donanımsal ön-getiricilerinden gurur duyuyordu. Bildiğiniz gibi, ön-getirme mekanizması, bellek erişim örgüsünü gözler ve sonraki cycle'larda hangi veriye ihtiyaç duyulacağını sezmeye çalışır. İşin püf noktası, veriyi önbelleğe geri döndürmektir, ki burada işlemcinin erişimi için daha hazırdır, yani işlemcinin ihtiyaç duymadığı anlarda bandgenişliğinden istifade ederek, bir sonraki hamleye hazırlık yapar.


Bu teknik pek çok masaüstü uygulamasında görülmeye değer sonuçlar ortaya çıkardı, ama sunucu dünyasında sonuç genelde performans kaybı oldu. Etkinliğini kaybetmesine sebep olan birçok şey var. İlk olarak, bellek erişimlerinin sunucu uygulamalarında öngörülmesi genelde çok daha zordur. Veritabanı erişimleri, meselâ lineer (doğrusal) değildir, bir veri nesnesi bellekte erişildiğinde, bitişiğindeki verinin bir sonraki hamlede çağrılması gerekli değildir. Bu da ön-getirme mekanizmasının etkinliğini kırıyor. Önceden dediğimiz gibi, zaten işlemciler arasında darboğaz vardı, ama ek olarak, bu aşamada ön-getiriciler ek yük getirdi. Bir mikroişlemci belleğe erişmiyorken, ön-getiriciler boşta olan belleği kullanmak için devreye girer. Ama, çoklu soket, yani bir diğer işlemci var ise, diğer işlemcinin ne yaptığını bilmenin imkânı yok. Bu da, diğer işlemci için, son derece önemli olan bandgenişliğinin, diğerinin ön-getirici mekanizması tarafından işgal edilmesi anlamına geliyor. Bu sorunu çözmek için ise, Intel'in öngetiricileri iptal etmekten daha iyi bir çözümü yoktu, kulağa pek çözüm gibi gelmese de.


Intel sorunun şimdi çözülmüş olduğunu söylüyor, ama yeni ön-getirici mekanizmanın algoritması hakkında hiçbir detay verilmemiş, tek denilen sunucu konfigürasyonlarında onları iptal etmenin gerekli olmayacağı. Intel hiçbirşey değiştirmeseydi bile, yeni bellek yönetiminin kazanımı ve sağlanan daha yüksek bandgenişliği ile ön-getiricilerin olumsuz etkisi belli bir seviyenin altında kalırdı.



Sonuç



Conroe sağlam temeller getirdi, Nehalem de onun üstüne ekledi. Aynı etkin mimariye sahipler, ama şimdi çok daha modüler ve ölçeklenebilir, bu da piyasadaki değişik alanlarda başarıyı getirmeli. Nehalem'in Core mimarisinin üstüne devrim yaptığı söylenemez, ama Intel platformu anlamında devrim sayılır, rakibi AMD karşısında tasarım anlamında yenilmesi zor bir hâle geldi bir kere daha ve teknolojilerin kullanımı anlamında rakibini geçti.



Hyper-Threading'in dönüşü önemli ve Penryn ile karşılaştırıldığında kaydadeğer performans artışı sağlamalı eş-frekanslarda. Ama en çok kazanç sağlanacak alanlar, belleğin darboğaz yaptığı alanlar olacaktır. Bu yazıyı okuduğunuzda, mühendislerin de buna odaklandığına hemfikir olmuşsunuzdur. Bellek erişiminin kritik olduğu yerlerde, entegre bellek denetleyicisinin eklenmesi en büyük kazançları sağlayacaktır şüphesiz ve okuduğunuz bir takım bazı diğer yenilikler var.


Bütün bu teorik değerlendirmelerden sonra, analiz için bir sonraki bakacağımız yer, bu yeniliklerin gerçek uygulamalarda uyandırdığı iştahtan bekleneni verip veremeyeceği.


Not: THG'den faydalanılmıştır, birebir tercüme değildir, metnin orjinali Fransızca olup, müellifi de muhtemelen İngilizce makalelerden derleyerek hazırlamıştır, sonra geriye İngilizceye tercüme edilmiş olup (bir ihtimal telif eden iki dilde birden yazdı), bu yazının hazırlanmasında en son aşaması baz alınmıştır. (İngilizce > Fransızca > İngilizce > Türkçe . Çeviri ile amatör olarak da olsa uğraşan az çok ne demek istediğimi anlar sanırım. Birebir tercüme olmamasının ana sebebi kullanılan anlatım sanatlarının dilimizde karşılığının olmaması, zorlamayla yapılsa bile monoton ve okumasının sıkıcı olmasıdır, bir diğer temel sebep ise mümkün olduğunda anlaşılabilir kılmaktır.)

Gerçekten çok vakit aldı, umarım yararlı olur. Metni beğendiğim için kırparak bir analiz yazısı yazmaya da kıyamadım. Karışıklaştığı yerlerde orjinal metne başvurabilir veya esgeçebilirsiniz, tekrar okumakla çözülmüyorsa. Hiç yoktan, konuda anlatılanları anahatları ile kavrayacağınızı düşünüyorum.

THG FR (Orjinal)
THG
İlk üç boyutlu işlemci yeni mimaride 1.4 Ghz'de çalışıyor


Rochester Küpü daha güçlü chip tasarımlarına yol gösteriyor

15 Eylül, 2008


Bilgisayar işlemcilerinde sıradaki büyük gelişme bugünün iki boyutlu chiplerinden üç boyutlu devrelere geçiş olacak gibi ve ilk üç boyutlu senkronizasyon devreler sistemi şu an Rochester Üniversitesinde 1.4 GHz'de çalışıyor.

Geçmişteki 3B chip denemelerinden farklı olarak, Rochester chipi basitçe birbirinin üzerine istiflenmiş bir grup sıradan işlemcilerden oluşmuyor. Dikey olarak birden çok işlemci tabakalarının içinden doğru, bütün kilit fonksiyonları işlemek için özel olarak iyileştirilmiş bir biçimde tasarlanmış ve üretilmiş, aynı sıradan chiplerin yatay olarak fonksiyonları iyileştirdikleri gibi.Bu, tasarım, senkronizasyon, güç dağıtımı, uzun mesafe sinyalleşmesi gibi işlerin üç boyutta ilk defa tamamen fonksiyonel olduğu anlamına geliyor.

“Onu küp olarak isimlendirdim şimdi, çünkü artık sadece bir chip değil” diyor Rochester Üniversitesi Elektrik ve Bilgisayar mühendisliği onursal profesörü ve işlemcinin tasarımında çalışanların fakülte idarecisi Eby Friedman. “Bu, gelecekte bilgi işlemin yapılması gerektiği yol olacak. Chipleri birbirine dayadığınızda, sıradan 2B chiplerle asla yapamayacağınız şeyler yapabilirler.”

Mühendislik öğrencisi Vasilis Pavlidis ile çalışan Friedman, entegre devre endüstrisindeki birçok kişinin nanometrik küçülmenin sınırları hakkında konuştuğunu, bir noktadan sonra daha fazla chipi yan yana paketlemenin imkansız olacağı ve bu yüzden geleceğin işlemcilerinin yeteneklerinin sınırlı olacağını söylüyor. Bir kısım entegre devre tasarımcılarının birgün üçüncü boyuta, tranistörleri üst üste istifleyerek, endüstriyel olarak toplu geçiş olmasını beklediğini de.

Fakat dikine genişleme birçok zorlukları da beraberinde getirecek ve Friedman kilit noktanın bütün tabakaların tek sistem gibi çalışacağı üç boyutlu bir chip tasarlamak olduğunu söyledi. Friedman'ın dediğine göre 3 boyutlu chipin bütün boyutlarını harmoni içinde çalıştırır hale getirmenin bütün birleşik devletlerin trafik kontrolü için kontrol sistemi planlayıp, ardından iki tane daha mislinden ilki üzerine koymak ve bir şekilde, herhangi bir seviyesindeki herhangi bir noktadan herhangi diğer bir seviyedeki hedefine ulaştırmak, ve bunu da milyonlarca diğer sürücüyü de eşzamanlı olarak koordine ederken yapmak gibi olduğunu söyledi.

Daha da karıştırmak için, sonradan eklenen iki tabakayı, Çin ve Hindistan gibi sürüş kurallarının ve yolların oldukça farklı olduğu ikisiyle değiştirin ve herhangi bir chipde çalışacak tek bir kontrol sistemi tasarlamanın zorluğu o zaman ortaya çıkar diyor Friedman.

Her tabaka, farklı fonksiyona sahip farklı bir işlemci olabileceğinden, MP3 dosyalarından audioya çevirmek veya dijital kamera için ışık algılama gibi, Friedman'ın dediğine göre 3B chip, temel olarak bütün bir entegre devre kartının ufacık bir pakete katlanıp koyulmasıdır. Dediğine göre iPod gibi şeylerin içindeki chipler, şu anki boylarının onda birine, on kat da hızlandırılarak küçültülebilir.

Hepsini mümkün kılan, Friedman ve öğrencilerinin tasarladığı mimari, sıradan işlemcilerin pekçok hünerini kullanıyor, ama ayrıca chipten chipe olabilecek farklı empedansları, farklı çalışma hızlarını, farklı güç gereksinimlerini de hesaba katıyor. Chipin üretimi de eşsiz. MIT'de üretildi, chipin tabakalarını ayıran yalıtıcılarına delinmiş milyonlarca deliği olmalı ki farklı tabakalardaki transistörler arasında sayısız bağlantılara izin verebilsin.

“Entegre devreleri artık daha da küçültemeyeceğimiz noktaya dayanacak mıyız? Yatay olarakk, evet.” diyor Friedman. “ Ama dikey olarak ölçeklendirmeye başlayacağız ve bu asla bitmeyecek. En azından, benim yaşam süremde. Onu da torunlarıma anlatırsınız.”

----------------------------------------------------------


Haberlere ilgili bir diğer yazı:

Tüm forumlar >> [Donanım / Hardware] >> Dahili Bileşenler >> Cpu >> Moore yasasının pabucu dama atıldı, yeni trend TSV
http://forum.donanimhaber.com/m_27116457/mpage_1/key_//tm.htm#27116457
11 Ekim 2008; 21:38:08

Kaynak:

D&R http://www.design-reuse.com/news/19080/3-d-processor.html


Not: Open Office 3 çıktı, siftahını bu yazıyla yaptım, yuppi
Moore yasasının pabucu dama atıldı, yeni trend TSV


Michael McManus, DIGITIMES, Taipei [Monday 15 September 2008]

Moore yasası ilerlemeye devam ederken, hızı yavaşladı. Şu an, yarıiletken endüstrisi 32nm’ye geçişte, fakat 16nm’ye geçiş 2019 yılına kadar beklenmiyor, bu şu anlama geliyor, yarıiletken endüstrisi için iki üretim süreci geçirme 11 yıl alacak. (Ara not: Moore yasasına göre, her iki yılda bir, aynı alana iki kat daha fazla transistör sığacak şekilde üretim teknolojisi gelişir.)

Hernasılsa, endüstrideki firmalar, Moore yasasının ötesinde, üretim verimi, nanometrik küçülme olmadan nasıl yapılabilir, gitgide daha çok yolunu arıyorlar ve şu an paketleme (elde edilen yarı iletken entegre devrenin kullanılacağı şekle getirildiği son işlem grubu) alanındaki firmalar inanıyorlar ki endüstrideki gelecek nesil büyümenin gelişmesine katkıda bulunabilirler.

Ho-Ming Tong, paketleme endüstrisinin lideri Advanced Semiconductor Engineering (ASE) firmasının CTO’su (en üst seviye teknik idareci) geçenlerde yaptığı bir açıklamada, paketleme endüstrisinin, yarıiletken endüstrisinin geri kalanının büyüme hızını geçtiğini söyledi. Önde gelen firmalare göre kıyaslanırsa, paketleme ve test firmalarının endüstriyle tanıştırdığı yeni çözümlerdeki hız, 5-10 yıl öncesine göre, 4-5 kat daha hızlı, diye Tong dikkat çekti. Endüstrinin geri kalanı yavaşlarken, paketleme ve test alanındaki gelişme hızlanıyor.

Büyüme yavaşladıkça karşılaşılan bir diğer zorluk da tasarımları bir sonraki ve en iyi nesile geçirmedeki geliştirme maliyetlerinin korkunç derecede çok olması ve tasarımların giderek karmaşıklaşması. Daha da fazlası, piyasa şu an tüketici elektroniği tarafından yönlendiriliyor, ki daha ucuz, küçük ve daha karmaşık ürünler sadece arzulanmıyor tüketiciler tarafından, bekleniyor.

Bu yüzden, daha küçüğe ölçeklendirmek yerine, yarıiletken tedarikçileri daha alışılmadık tasarımlara ve paketleme türlerine yöneliyor. Küçülmeyi es geçmenin en yaygın yolu da teknolojileri chip üzerindeki sistemde birleştirmek (SoC). Bu da ayrıca paketleme firmalarının tasarımlarıyla iddialı oldukları bir alan, ve endüstri birden çok chipi destekleyebilecek paketleme tiplerinin arttığını görüyor, paket üstüne paket (PoP), çoklu-chip paket (MCP) ve paket içinde sistem (SiP).

Geçmişte, bu çoklu chipler kart üzerinde birbirine bağlanırdı, fakat endüstri kaplanan alanın artışının tedarikçiler için endişe kaynağı olduğu noktaya geldi. Tong bu trendin devam edeceğine işaret etti ve tedarikçiler, alandan kazanmak için birden fazla chipi üst üste koyan üç-boyutlu paketleme çözümleri için rotayı oraya çevirdiğinden, paketleme ve test endüstrisinin etkisinin arttığının görüleceği anlamına geliyor.

Bir yarıietken firmasının SoC tasarımı veya 3B paketleme kullanıp kullanmayacağı, benimsediği iş kriterine göre değişir. Genel olarak, herkes, daha küçük, daha az yer tutan cihazlar ister, fakat tedarikçiler maliyet, performans, işlevsellik, ne kadar sürede piyasaya sürülebilir, ısı dağıtımı ve güç tüketimi gibi diğer şeyleri de hesaba katmalı.

Mesela, tipik olarak SoC’lar çok yüksek maliyetlere ve uzun zaman alan geliştirme aşamasına sahiptir ama göreceli olarak performansı genelde benzer cihazlardaki SiP çözümlerinden daha iyidir, ki SiP tel ile bağlantı esasına dayanır ara bağlantılarda, diğer yandan, düşük maliyetli, hemen piyasaya çıkarılabilir çözüm olarak değerlendirilir ve performansın cihazın kilit rolü olmadığı yerde uygun bir seçimdir.

SoC’a alternatif bir yaklaşım olarak ortaya çıktı SiP , çünkü bu teknoloji SoC’a göre bazı avantajlar sağlıyor piyasadaki birçok alanda. Özellikle, SiP entegrasyon konusunda daha çok esneklik sağlıyor, piyasaya sürülmesi daha hızlı, Ar-Ge masrafları daha düşük, NRE (non-recurring engineering – bir sefer mahsus olan sabit maliyet, araştırma, tasarım, test gibi maliyetlerini içeren) bedeli daha az, ve birçok uygulamada SoC’dan daha ucuz üretim maliyetine sahip. Bununla birlikte, SiP yüksek seviye, tek chip, silikon entegrasyonu yerine geçebilecek bir çözüm değil, bunun yerine SoC’a bir tamamlayıcı olarak görülmeli.

Belki de, hepsinden daha önemlisi, SiP mimarileri tedarikçiler için daha da gelişmiş chip-dışı arabağlantı tasarımları kullanma şansı sunuyor, TSV (Through Silicon Vias) gibi. TSV çok daha kısa yol uzunlukları ve daha düşük direnç ve endüktans sağlıyor sinyal ve güç iletiminde tel bağlantılı yapılara göre.

TSV tasarımında, chipler birbirinin üzerine istiflenir, ama tel bağlantı kullanmaktansa, her katman arası geçiş bağlantı(-sı, via) silikonu bütün katmanların içinden geçecek şekilde işlenir (etching process, tabaka üzerindeki taslak şeklin etrafını oyarak, tabaka üzerinde şekil meydana getirme işlemi). Sonra, bakır gibi bir madde ile geçiş bağlantıları doldurulur ve bu da arabağlantı olarak işlev gösterir, bu şekilde bütün chipler birbirine bağlanmış olur.

TSV, SoC için olduğundan daha düşük geliştirme maliyetlerine yardımcı olma potansiyeline sahip, bir yandan SiP’den daha iyi performans sergilerken. TSV, üst üste istiflenecek zar sayısından bağımsız olarak devreler arasındaki mesafeyi kısaltmak gibi avantajlar da sağlıyor. Bu yüzden, TSV ile yapılmış, geliştirilmiş hız ve performansa sahip cihaz, daha küçük cihazlar için daha uygun.

TSV bağlantılı, 3 boyutlu istifleme SiP için gerekli teknolojiler, wafer inceltmesi, delme, waferler arasında arabağlantı olarak çalışacak iletken madde dolgusu ve ısı dağıtımı. TSV daha çok Bosch işlemi (bir plasma etching işlemi) ile şekillenir, geçiş bağlantısının açılacağı yerin tekrar tekrar oksitlendirilmesi ve buranın altının kuru şekilde oyulması ilkesine dayanır.

Piyasada TSV için olan geliştirme programlarında birincil mesele, geçişler (via) ilk mi olacak, son mu, yani üretim sürecinde via ne zaman yapılacak.

Genel olarak, via’nın en son yapıldığı uygulamaların piyasada ilk olması gerekiyor, teknik zorlukları çok olmadığından. Yapıları daha büyük ve bu yüzden aynı zamanda şekillendirmesi daha kolay, SiP’den ve diğer uygulamalardan dışarı (yani blok dışına) daha yüksek derecede bağlantı imkânları sunuyor. Bu genelde paketleme tesislerine büyük AR-GE faydası sağlar.

Daha kolay, aslında kolay anlamına gelmez. TSV teknolojisinde sınırlayan etken via dolgusu. Çok yavaş bir üretim süreci kullanılmadıkça, daha küçük çapta TSV yapılarını doldurmak için gereken en-boy oranı sınırlıdır. İnçin binde biri via için dolgu bakır kaplamayla yapılır. Daha geniş via’lar bir çok işlemin ardından elde edilebilir. Bugün üretimde daha büyük via’ları doldurmak için kullanılan üretim süreçleri, poly-Si, iletken macun ve bazı diğer şeyleri içeriyor.


http://img528.imageshack.us/img528/4236/ibmwaferwr1.jpg
IBM tesislerinden bir TSV wafer



İlk via’nın yapıldığı programda, via’lar wafer üzerinde diğer üretim işlemlerinden önce açılır. Bununla birlikte, ilk-via şekli teknik olarak daha zorlu. Yapılar daha yüksek en-boy oranına sahip, bu da via dizilimini zorlaştırıyor, viayı oymaktan (parazitleri önleyecek kadar) yeterli izolasyona ve ardından metal gömmeye ve kaplamaya kadar. Bu zorluklar, ilk-via’nın, en son-via’ya göre benimsenmesini geciktirecek, ama, ilk-via yöntemi, özünde daha çok I/O şansına sahip olmasından (ve bu yüzden Moore yasasının yolundan, gerekli olan nanometrik küçülme olmaksızın ilerleyebilme şansından) , endüstrideki firmalar tarafından kutsal kâse olarak görülüyor. Tasarımhaneler için en cazibeli 3 boyutlu entegre devre uygulaması ve bu yüzden entegre cihaz üreticilerine daha kıymetli imkânlar sunuyor. İlk-via muhtemelen dökümhaneler (Örnekler:TSMC, Chartered, AMD’den yeni ayrılan üretim grubu The Foundry Company...) ve entegre cihaz üreticileri (Örnekler:Intel, artık fabless olan AMD...) tarafından kullanıma sokulacak, ama paketlemeciler tarafından değil.(Ara not: Bu firmalar böyle yapacağından değil, foundry ve IDM’ye örnek vermek için isim yazdım)

Bununla birlikte, TSV kaydadeğer birleştirme zorlukları da doğuruyor. Çünkü TSV’ye dayalı 3B wafer istifleme, etch, CVD (Chemical vapor deposition – yüksek saflık, performans ve dayanıklılıkta materyal elde etmek için kullanılan kimyasal bir yöntem) ve PVD (Physical vapor deposition – bir tür vakum tabakalandırma, maddenin buharının yüzey üzerinde yoğunlaştırılmasıyla ince film tabaka oluşturma işlemi) işlemlerini birbirine uyumlu şekilde gerektiriyor güvenilir wafer içinden doğru arabağlantılar için, işlemler birbirinden ayrı ele alınamaz çünkü her işlemin karakteristikleri sıradakini etkiliyor.

Bu yerleştirmede isabet anlamına geliyor ve daha da önemlisi tutturma metodu çok hassas olmalı. Tutturma TSV’li zarın konfigürasyonuna bağlı olacak, birtakım adresleme meseleleri gibi, istiflenecekler mi yoksa gövde üzerine mi yerleştirilecekler? TSV birleşim-montaj meseleleri, bilhassa SiP montajında hala tamamen açıklığa kavuşturulmuş değil.

Yine de, önderlik eden TSV konsorsiyumu EMC-3D geçenlerde bir üretim süreci ve TSV yapılar için arabağlantı maliyet modeli geliştirdiğini duyurdu. Rozalia Beica, EMC-3D’nin program yöneticisi ve konsorsiyum üyesi Semitool’daki TSV yöneticisi, artan ilgi ve müşteri ricaları kadar bu ölçülerin etch ve deposition (CVD – PVD) zorlukları yüzünden, ilk-via’nın 5 mikron çapında, 30 mikron derinliğinde olacak şekilde seçildiğini söyledi.

Entegre süreci litografi ve etch işlemi için hard mask, via oluşturmak için DRIE (Deep reactive-ion etching) , termal ve CVD astar ve bariyer, ıslak bakır gömme, bakır elektrokaplama dolgu, CMP (Chemical-mechanical planarization – kimyasal-mekanik cila ) ve via’yı tamamlamak için ilgili waferin temizlikleri işlemlerini içeriyor. Ardından waferler standard CMOS teknolojisi kullanılarak işlenir ve sonunda TSV grubuna arkayüz işlemleri için geri verilir, bunlar, inceltme, litografi, yeniden bakır dağıtımı, bağlantı noktası lehimi, kesme ve süreci tamamlamak için en son zar tutturumundan önce geçici yapışkan bağ ile wafer’e zar yerleşimini içeren işlemlerdir.

Mark Scannel, Grenoble’da CEA-Leti’nin (Electronics and Information Technology Laboratory of the French Atomic Energy Commission – Fransız Atom Enerjisi Komisyonu Elektronik ve BT Laboratuarı) mikroelektronik program yöneticisi, zorlukların, tutturma sırasında wafer’e zar yerleşiminde isabetin olduğu kadar etch, deposition, bakır dolgu ve CMP işlem adımlarında entegrasyonu geliştirdiğini belirtti. Birim işlemlerin çoğu iyi anlaşıldı ve karakteristikleri belirlendi. Şu anki mücadele teknolojiyi toplu üretime etkin maliyetli paketle getirmek.


https://store.donanimhaber.com/2a/0e/bd/2a0ebd2f5c385ee752107db33ee1c6ea.jpg
Samsung'un TSV DRAM chipi (ve altında sanırım wafer)


Samsung SAIT’den Dr. Yoon-Chun, sıradaki mücadelenin daha iyi elektriksel ve ısıl performans için etkin bir 3B yapı tasarlamak ve materyal kusurları, mekanik baskı ve electro-migration ile olan ilişkisini belirlemek olduğunu söyledi. (şu son üç etki ile ilgili haber arşivimden nVidia chiplerinin kusuru ile ilgili yazı dizisine bakabilirsiniz)

Konsorsiyum ayrıca, aylık 10.000 wafer kapasitelik üretim hattına sahip olmanın şu an wafer başı 190$ altı maliyete mümkün olduğuna işaret etti. EMC-3D maliyet modelinin tanımına göre şu an toplamda, bütün adımlar için tüm maliyet 189 USD ve model konsorsiyumun, maliyet geliştirme programının fiyatı wafer başı 145 USD altına çekmeye ihtiyacı olduğunu belirliyor.

Böylesine bir piyasa gelişiminin ortasında, endüstri firmalari TSV için güçlü beklentiler kuruyorlar. Tong’a göre, TSV pazardaki her yerde uygulanacak. Bunlara ek olarak, paketleme ve test endüstrisindeki firmalar TSV (en son-via) geliştirmesine zaten kaynaklarını tahsis etmiş durumda, Tong, birçok entegre cihaz üreticisinin, 2 boyutlu alanda, alan kullanımında verimi arttırma girişimi olarak, TSV’yi ön uç işlemlerine (ilk-via olarak) dahil etmeye başladığına dikkat çekti. TSV şu an endüstrideki bütün firmaların gözünü diktiği mücadele alanı diye ekledi.

Piyasa araştırma firması Yole Development’a göre, 2015’den itibaren milyonlarca 3B-TSV wafer siparişi yerine getirilmiş olacak ve bu teknoloji bellek piyasasında %25 kadar etkili olma potansiyeline sahip. Bellek cihazları hariç, 3B-TSV waferları 2015’den itibaren toplam yarıiletken endüstrisinin %6’sından fazlasını tutabilir.

Piyasaya sürebilme takvimi ve maliyet konusunda müşterilerin şartlarını yerine getirebilmek için, ASE, hırslı bir şekilde TSV teknolojisi geliştirmeye yöneliyor, 2009’da ortaya çıkması beklenen satış miktarının yardımıyla dedi Tong. ASE, baştan sonra gerekli olan herşeye sahip olduğu tedarik zincirine dayalı olarak TSV geliştirmesinde rekabet edebilecek bir yere sahip. Mevcut ekipman üzerinde yapılacak üretim ve geliştirmeyle, ASE sadece bazı yeni ekipmanı elde etmek ardından da yükseltmek zorunda kalacak.

Evrim veya Devrim


SEMICON Taiwan 2008 sırasında endüstriden bir yönetici, TSV’nin yarıiletken endüstrisinde herşeyi değiştirebileceği yorumunda bulundu. Yole, IDM’den fabless firmalara ve CMOS dökümhanelerine ve montaj ve test firmalarından substrate ve devre montajı yapanlara kadar bütün yarıiletken endüstri zincirinin etkileneceğine işaret etti. Yole, TSV’lerin 3B ile entegrasyonunun CMOS wafer fabrikalarında birleşmeyi hızlandırabileceğine ve hatta piyasayı fabrikasız, dökümhane modeline daha çok kaydıracağına inanıyor.

Tong iyimser ve tedarik zincirinde farklı alanlardaki yarıiletken firmaları arasındaki yakın bağların önemini vurguladı. Tong ayrıca, endüstrideki firmalar arasında, birlikteliğe girenlerde, böylesine güçlü bağların herkeze kazandıracağını öngördüğüne dikkat çekti.

Dünya çapında, paketlemeciler için parlak gelecek var fikrine Yole katıldı. Araştırma firması, tamamen yeni bir yapılanmanın, yarıiletken üretim zincirinde orta uç tarafından geliştirilmesi gerektiğini savunuyor. Ön uç ve arka uçtan gelen yeni teknolojiler, ekipmanlar ve gelişmiş materyaller geliştirilmekte ve yarıiletken paketleme ve devre montaj endüstrilerinin yeniden doğmasına sebep olacak.

3B’ye geçiş için teşvikler


Yole, teknolojinin zaten MEMS (Microelectromechanical systems) ve CMOS görüntü sensörlerinin üretimine başarılı bir şekilde sokulduğuna dikkat çekti. Bütün bu teşvik, daha yoğun paketle daha küçük form faktör, beraberinde bandgenişliği, RF ve güç tüketimi performansı gelişmeleri için. Maliyet, kesinlikle uzun vadede 3B teknolojiler geliştirmek için en güçlü teşvik diye Yole işaret etti.

Tong, TSV’ye olan talebin halihazırda bellek ve CMOS görüntü sensörü alanlarında ortaya çıkmış olduğuna dikkat çekti. Anaband entegre devre (IC) , radyo frekans (RF) ve CPU alanında gelecekte talep artmalı diye beklenti olduğunu ekledi.

Yole’un belirttiğine göre CMOS görüntü sensörlerinde, vialar kısmen veya tamamen doldurulacak, geliştirilen via doldurma yaklaşımına göre, kısmî doldurma için bakır, tamamen doldurma için poly-silicon veya tungsten kullanılacak. Yole, chip başına olacak arabağlantılarda I/O birimlerinin birkaç yüzü bulmasını bekliyor, dijital sinyal işleme chipleri, görüntü sensörünün altına istifleneceğinden yeni trende göre.

MEMS chipi kendi ASIC’i (uygulamaya özel chip) ile birleşip, kablosuz SiP’ler heterojen katmanları birleştirirken, MEMS de 3B’den yararlanmış olacak, bu sayede farklı litografi yöntemleriyle, Si, GaAS, SiGe substrat materyalleri kullanılabilecek.

Yole, tam ölçekli 3B IC entegrasyonuna girebilmek için çeşitli engellerin olduğunu kabul etti, test, 3B elektronik dizayn otomasyonu araçları, termal yönetim ve 300mm ekipman elde edilebilirliği bunlardan.

Testlere göre, birçok çözüm geliştirilmekte ve denenmekte olduğundan, ortaya çıkan sorunların çözülmesi yakın.

Daha da fazlası, endüstrinin bir kısmı waferden wafere konfigürasyonlara yönelirken ince waferlarla, TSV, RDL ve bağlantı yatağı yapısında her tabakanın istiflemesine binaen elektriksel işlevsellikten emin olmak için wafer seviyesinde hasar vermeden test edebilmek için bazı yeni gerekliler ortaya çıkıyor. Sonuç olarak, bir çok firma temassız test teknolojileri talep ediyor optik veya kablosuz metodlarına dayalı diye işaret etti Yole.

Wafer yüzeyinin kontrol edilmesi, açık/kısa devre elektrik testi ve 3B sistem seviye işlevsellik doğrulaması için teknoloji ve ekipman geliştiriliyor.

Yine de, 3B EDA tasarımı ve termal yönetimde yazılım araçlarının elde edilebilirliği tamamen farklı bir mesele. Yole’ın inandığına göre 2011’den itibaren bunlara sahip olabilme mücadelesi endüstri için gerçekten çetin olacak, 300mm 3B-TSV ekipmanının bulunabilirliği sadece bir zaman meselesi olmasına rağmen. Yole’ın dediğine göre ilk 300mm araç parçaları bu yıl pilot imalat hatları için dağıtıldı.

Araştırma firmasının belirttiğine göre 2013’den itibaren 3B-TSV üretim araçları için ilgili ekipman hızlı bir şekilde yayılacak ve 1 milyar USD tutarını geçecek. Daha gelişmiş 3B-TSV üretim materyalleri için ise, Yole’ın öngördüğü piyasa tutarı 2015 yılından itibaren 1 milyar USD’yi geçecek.



Kaynak: Digitimes,
Not: Kaynak linki veremiyorum, zira Digitimes'ın kimi belgesi ticari ürün, paralı üyeler ulaşabiliyor linkler ve arşivlere, yani abonelik gerekiyor, o yüzden link çalışmayacak.

Not (2): Teknik meselenin aşırı karıştırıldığı yerlerin az bir kısmını kırptım, bazı yerleri akıcılığı temin etmek için biraz farklı tercüme ettim, malum dil farkından ötürü ilginç durumlar ortaya çıkabiliyor, birebir tercüme değildir. Dava metinlerinden sonra çevirmesi en gıcık yazı tipleri henüz tecrübe ettiğim kadarıyla bu tür haberler.


Ne zamandır çevireyim diyordum, şimdiye nasipmiş. Piyasanın içine girmekte olduğu yeni şekli görmeniz açıısından bu haberin önemli olduğunu düşündüm. Hep merak etmişsinizdir, nm küçül küçül nereye kadar, daha da küçülemeyince ne yaparlar, işte cevabı burada, bir aydır falan zaten forumda üstü kapalı bahsetmekteyim benzer teknolojilerden.

Digitimes endüstriyel kesime hitap eden bir haber sitesidir, son kullanıcıya hitap etmez, o yüzden bu işin yenilerine ağır kaçabilir bu konu, iyi okumalar.
Forumda telifi ve telif edilenlerin okunabilirliğini arttırmak için bir teklif


Kullanıcıların hazırladıkları inceleme, test, makale, araştırma gibi teliflere linklerin, anasayfada yer alması, -editör seçimiyle- iyi olurdu. VR-Zone'daki gibi. Böylece herkezin gözü önünde olur, herkez haberdar olur, teşvik de olur. Bazen birkaç gün foruma girmediğimiz de oluyor, ya da bir süre, forumda geçmiş sayfaları karıştırması çok zor, bir iki günde sayfa komple arkaya öteleniyor. Böylece faydalı konulara da arşivden daha kolay ulaşılır. Yine başınıza iş çıkarmış gibi oldum ama güzel olurdu, siteye de rağbeti arttırırdı
http://www.xfastest.com/redirect.php?tid=14549&goto=newpost

Asus anakart üzerindeki bellek slotlarına yapıştırılmış uyarı notunun tercümesi:

Intel'in bildirdiği CPU özelliklerine göre, 1.65V'den yukarısıyla çalışan bellekler CPU'ya kalıcı hasar verebilir. Voltajı 1.65V'den aşağı olan DIMM modüller kullanmanızı tavsiye ederiz.
With default voltage, the Kuma CPU can easily hit 3GHz. Raise volt to 1.4375V and core clock can reach 3.3GHz and passed SP2004 easily. Increasing voltage to 1.45V and 6500 can oc to 3.4GHz, but can not pass SP2004. Please this is only on air. Looks Kuma have outstanding OCbility.

yatmadan önce koyayım dedim:
http://en.expreview.com/2008/09/23/amds-best-dual-core-ever-athlon-6500-kuma-review/


Testlere de bakarsanız, bazı alanlarda hatırı sayılır artışlar var.

Eski Intel mühendisi, AMD’nin yeni CEO’su Dirk Meyer’la röportaj


Yeni AMD CEO'su en iyi chip tasarımcısı olarak biliniyor

AMD’yi yeniden tasarlamak


Sunnyvale, California – Dirk Meyer üniversiteyi bitireli altı ay olmuştu, hissedarlar toplantısında punch (genelde şarap-meyve suyu karışımı bir içecek) masasına, Intel’in efsanevi eş-kurucusu ve entegre devrenin eş-mucidi Bob Noyce’un yanına gittiğinde Intel için mühendis olarak çalışıyordu. “Benimle otuz dakika konuştu – daha önce hiç duymamış olduğu sümüklü bir çocukla.” diye Meyer anımsadı. “Bana sordu ‘Nasıl firmamı sevdin? Neyi sevdin? Seni ne şaşırttı?’ ”

Noyce’un sürekli erişilebilir olması, onda devam etmekte olan bir izlenim bıraktı – ve bugün Meyer, Intel’in büyük rakibi AMD’nin CEO’su olarak yeni görevinde, yatırımcılardan gelen çok daha zor sorulara karşı böyle davranıyor. En zorlarından biri: Bu hafife alınan mühendis, firmayı finansal felaketin kıyısından döndürebilecek mi?

Yanlış değil, AMD zorlu dönemler geçiriyor. Geçen iki yıldaki bir dizi yanlış hamleden sonra, firma depresif hisse değerleriyle karşı karşıya, grafik chipi üreticisi ATi’nin satın alınmasından yaklaşık 5 milyar dolar borçta, azalan para su gibi elden çıkıyor ve kazanç her zaman iyi olmuyor. Meselâ geçen çeyrek, firma 1.35 milyar dolar gelir duyurdu, beklenenden yaklaşık 100 milyon dolar daha az. Brüt kâr beklenen %37.1’den 5 puan daha az çıktı ve Intel’e olan pazar payı kaybı devam etti.

Geçen ay CEO’luğa yükselmeden önce yönetim kurulu başkanı olan Meyer, firmanın potansiyelini biliyor. Yaklaşık 13 yıldır firmada çalışıyor, Intel’in fason üretiminden yeni bir mimari geliştirme dönüşümüne yardım etmesi için tutulduğundan beri. Bu hedefin peşinde koşarken, Meyer, Athlon işlemcisinin tasarımını yönetti, bir kırılma noktası ki, AMD’yi piyasaya tasarımcı güç olarak koydu. Bu hamleyi finanse edebilmek için, zamanın CEO’su Jerry Sanders diğer iş kollarını sattı. “Jerry’nin çok açık bir hedefi vardı: Intel’e gerçekten dayanabilecek bir alternatif yapmak” dedi Meyer.


Jerry Sanders



Meyer için, AMD’nin şu anki hâli, onun ilk günlerine benzer, tek görev Intel’e bir alternatif yapmak değil, onu korumak, varlığını devam ettirmek. Muhakak ki, AMD’nin ünü, itibarı çok daha fazla oturdu ve müşterileriyle ilişkileri daha derin.

Geçmişte Sanders’ın yaptığı gibi, Meyer de AMD’nin yarınını finanse edebilmek için AMD’nin onlarsız da yapabileceği pahalı mülklerini satmaya odaklanmış durumda. İşte bu yüzden geçenlerde firma dijital TV işini Broadcom’a 192.8 milyon dolar nakite sattığını duyurdu. (Ayrıca eltipi (handheld) cihaz işi de satılığa çıkarıldı.) Bu hamleler, Meyer’ın dediğine göre: “Elimize biraz daha nakit geçme şansı verecek ve kasamızdaki parayı arttıracak, borç yükünü azaltacak.”

Bu gerekli, çünkü chip üretimi pahalı bir iş. Bir chip tasarlamak için yüzlerce mühendis tuttuğunuzda (ucuz değil) ve onların çalışmalarını test ettiğinizde (kulağa geldiğinden daha zor) , büyük, modern üretim tesisleri kuracaksınız (fabrika denilen) onu üretmek için. Bunları kendi başınıza yapmak milyarlarca dolarlık yatırım gerektirir, bu Intel’de olup da AMD’de olmayan bir para. Bu kadarıyla da bitmiyor, her nesil chip için, aynı küçük pakete daha fazla güç koyabilmek adına daha karmaşık chipler üretmek için fabrikanın geliştirilmesi gerekli.

Bunu yapmaya artık parası yetmediğinden, AMD yıl sonunda chip üretim işlemlerini firmadan ayırmayı planlıyor, firma bünyesinden ayırmakla veya daha büyük bir chip üreticisiyle işortaklığına imza atarak – bir evi satıp sonra onu kiralamaya benzeyen bir manevra olarak. Anlaşmanın tam zamanlaması konusunda Meyer belirsiz, ama biliyor ki bu, firmanın finansal durumunu çabucak düzeltmek için yapabileceği en iyi şey, ve yatırımcıları arasındaki itibarını. Başarılı bir satış anlaşması AMD’nin cebine iyi para gördürür, bir yandan üretim işini, Intel’in dünya çapında en iyilerden olan üretim işlemleriyle yarışabilecek birine devrederken.

Bu olana kadar, Wall Street’teki (New York’taki borsa merkezi) çoğu kişi AMD hakkında temkinli kalacak. “AMD hisseleri konusunda temkinliyiz” şeklinde yazdı geçenlerde yatırımcılar için yapılan araştırma yazısında, Wedbush Morgan Securities’den (bir yatırım şirketi) Patrick Wang. Hisseler hakkındaki puanlaması “durgun” , ama dediğine göre bir dönüş daha yakın göründüğünde, daha iyimser olabilir. Citi Investment Research’ten Glen Yeung AMD’nin küçülmesi konusundaki stratejik önemi doğruluyor, ama firma hakkında nötr kalacağını söylüyor çünkü Intel’e karşı nasıl rağbet kazanmayı başaracağını görmek zor.

Geçen hafta Sunnyvale’deki AMD karargâhındaki tahta panelli konferans odasında Meyer ile oturduğumda, firmanın karşılaştığı şeyleri gizlemedi. Kravatsız ve yakalı gömleği ile, 46 yaşındaki CEO, satacağı lafları hazır olan sıradan bir CEO’dan çok bir mühendis gibi duruyor ve görünüyor. Konuştuğum mühendisler AMD bunlara nasıl dolandı sorduğumda kemküm etti; Meyer açıkca konuştu. “Malesef tam bizim de işlerimizin kötüye gittiği bir zamanda, kendisinin de işleri kötüye giden bir firma satın aldık” diyerek ATi’den dem vurdu. “Gerçekten kötü finansal bir durumun ortasındayız ve işte burası işleri gerçekten döndürmemiz gereken yer.”

Aslında, AMD için büyük para kazanma fırsatları hâlâ orada duruyor, eğer firma uygun rolü alabilirse. Intel, HP, Dell gibi piyasanın baskın PC oyuncuları mini-laptoplarda ve mobil cihazlarda büyüme peşindeyken, AMD, sıradan-eski PC işiyle pazar payında birkaç puan toplayarak bolca büyüyebilir, ki bu piyasadaki pazar payı bugün %20’nin altında. (Apple geçenlerde bu kavramın gücünü gösterdi, Mac bilgisayarları PC pazarında büyüdükçe, satışlarda milyarlarca dolar kaydetti.)

İlk olarak, Meyer, AMD’yi kendi başarısının mağduru olma huyundan kurtarmak zorunda kalacak. Birden fazla kere, popüler bir ürünü piyasaya sürdü, sonra talebi karşılamakta zorlandı veya zamanında geliştirmeleri sağlayamadı. Yakın zamandaki en bariz örnek, AMD’nin sunucular için olan, Barcelona kod adlı Opteron işlemcisiydi, geçen sene geç geldi ve beklenen gücü veremedi. AMD ayrıca Dell’den yeni iş aldı ve diğer chipler için siparişleri doldurmakta zorlandı, perakendeci işortaklarını kızdırarak.

Perakendeciler, Meyer’ın dediğine göre, ürün yetiştirilememesini “AMD (sistem üreticisi) müşterilerimizi ve perakende işimizi berbat ediyor” şeklinde algıladılar, ve şöyle devam etti “bu yüzden dediler ki, birkaç çeyrek dönem içim AMD’den birkaç adım geri duralım” Bu olduğu zaman, pazar payınız düşer ve kâr etmeyi unutun gitsin.

İşleri düzeltmek şimdi Meyer’a düşüyor, bu da beni onun liderlik yaklaşımını sormaya sevk etti. Futbol ve beyzbol oynarken antrenörlere büyüklenip, baskınlık kurduğu gözlenmesine rağmen, Meyer, dediğine göre, birisini kenarıya çekip “Sana güveniyorum” diyen ve güvenoyunu motivasyon olarak kullanan biri olmayı tercih ediyor.

Meyer, böyle samimi dokunuşların istenmedik yerlere gidebileceğini de biliyor. Zaman zaman, bana anlattığına göre, o işe daha iyi uyacak biriyle daha çabuk değiştirilmesi gerekirken bir idareciye çok fazla şans vermesine sebep oldu.

Sıradaki birkaç ay içinde, yapabileceği çok az hata payı olacak. Sene sonuna doğru, Wall Street üretim bölünmesinin detaylarını duymayı umuyor ve 7 çeyrektir devam eden kayıplardan sonra 2009’daki kârları. Eğer bunun da mühendisliğini yapabilirse, Wall Street’in tezahüratını yapacağı çok şey olacak.

Kaynak (tıkla)

Not: Direct image link için, imageshack forumlarda kullanmayın diyor, sanırım reklam gelirleri sağlayabilmek için, bu yüzden remote-hosting denilen kısıtlama uygularsa, resimler görünmeyebilir, göremiyorsanız haber verin.
SuperPi 1M'de, aynı frekansdaki Athlon X2 den, 6 saniye daha ilerideymiş, daha fazla resim ve sonuçla güncelleyeceğim diyor haberin sahibi.



Kaynak (tıkla)


L3 e sahip, Athlon X2 lerden farklı olarak, farklı mimari olmasına rağmen, Athlon ismiyle satılıyor.

Görünen o ki, integer performansı arttırılmış.

Aynı frekansdaki Core 2 Duo'ya karşı ne yapacak acaba?
Atom N330 Dual Core, doğal Dual Core tasarım değil mi?


https://store.donanimhaber.com/9a/ec/9c/9aec9c4aa59a63a04775413fe05a3b65.jpg



Intel çok defalar dual core bir Atom işlemcinin olacağını söylemişti ve işte burada! Görünüşe göre bir diğer Kentsfield/Yorkfield, iki zar içeren tek gövde. Bu tür bir tasarım çok da yakışıklı değil ama üretim maliyetini etkili bir şekilde düşürebilir. Çift çekirdekli Atom (Resmi adı: Atom N330) ayrıca 2009 Sandra'da test edilmiş durumda.

İşlemci aritmetik testi:

Intel Atom N270 1.6GHz – 8291 kpixels/s
Intel Atom 330 1.6GHz Dual Core – 16920 kpixels/s
Intel Core 2 Duo U7700 1.3GHz – 24742 kpixels/s

Bellek bandgenişliği testi:

Intel Atom N270 1.6GHz – 3.54 GB/s
Intel Atom 330 1.6GHz Dual Core – 7.18 GB/s
Intel Core 2 Duo U7700 1.3GHz – 9.53 GB/s

Kaynak: En.Expreview, cn.engadget.com'dan alıntılamış. Daha fazla testleri için link verilmiş sayfada amma velâkin aşırı yükten sitenin SQL serverı çalışmaz halde.

Yorumum:

Ben de Atom'a HT'i geri getirmişler, düşük perfomanslı tek çekirdekli bir işlemci nihayetinde, demek ki bununla bir nebze olsun güçlendirme planları var diyordum.

Sonra kendime sordum:
Yahu bu adamlar, dualcore çıkaracaklarını söylediler Atom için, acaba nasıl olacak? Belki onda HT olmaz, 2 thread, 2 core olur, doğal tasarım olur, HT'yi de kaldırırlar diye düşündüm.

Ama bu resmi görünce sorunun cevabının farklı olduğunu gördüm:

4 thread, 2 Core olacak, çünkü 2 threadli, (HT'li) 2 çekirdek birleştirilmiş, doğal olmayan bir tasarımla. Vakti zamanında Pentium D, şimdi ise Core 2 Quad lar ile yaptıkları gibi. Gerçi Pentium D'ler rezildi, çünkü kendi aralarında haberleşmek için kuzey köprüsüne gidiyorlardı, zaten 945 serisi chipsetler de aslen Core 2 için tasarlanmamıştır. Şu anki doğal olmayan tasarım ise Core 2 Quad larda ve önümüzdeki aylarda çıkacak olan 6-Core Dunnington'daki gibi. (E yani öyle olsa gerek, aynı hata iki kere yapılmaz ki.) Doğal tasarım olmasa da, kayıpları ve verimsizliği de Pentium D'deki kadar olmaz herhâlde. İlginç bir işlemci, bakalım uygulama performansı nasıl olacak. Tabi HT siz, 2 core, 2 threat bir de doğal olmayan bir şekilde çıkarsa bir ürün, o zaman anlarım ki N2XX çekirdeğiyle aynı değil N330'un barındırdığı iki çekirdek.
Evet arkadaşlar, saatler süren hesaplama, çizim ve sayım uğraşından sonra, bazı şeyler hazırladım:

65nm GTX280 zarının (576mm^2) , wafer üzerindeki yerleşimi ve tamamı çıkarılabilecek zar adedi
55nm RV770 zarının (256mm^2), wafer üzerindeki yerleşimi ve tamamı çıkarılabilecek zar adedi
45nm Wolfdale (6MB L2 olanı bu, 3MB L2 Wolfdale-M3 ile karıştırmayın) zarının (107mm^2), wafer üzerindeki yerleşimi ve tamamı çıkarılabilecek zar adedi


GTX280 ile başlıyoruz, wafer üzerinde tam parça çıkan 98 adet zar bloğu var,

https://store.donanimhaber.com/f4/20/cf/f420cfac51ab3b32317b051ebd5edab4.jpg




RV770 (4870-4850) ile devam ediyoruz, wafer üzerinde tam parça çıkan 234 adet zar bloğu var,

http://img78.imageshack.us/img78/9748/rv770300mm234pcsyb4.jpg




45nm Wolfdale 6MB L2 dualcore işlemci ile bitiriyoruz, wafer üzerinde tam parça çıkan 570 adet zar bloğu var,

https://store.donanimhaber.com/c9/10/c2/c910c224f337128397e004c8b40d5877.jpg


Bu resimden birşey anlamayacaksınız çok sıkışık olduğu için, o yüzden rapi dshare e yükleyeyim büyük versiyonunu dedim:
ra pid share . com/files/142846186/resampled.jpg.html


Not: Resimler birebir ölçülerdedir. İnanmayan söksün işlemci kapağını yanyana getirip ölçsün


Ayrıca; AMD energy efficient X2 dualcore zarı bulamadım (BE-XXXX ve XXXXe modelleri), ama zar alanı 118mm^2 (65nm) , yukarıdaki 45nm Intel ise 107mm^2, tahmin etmesi zor olmayacağı gibi, (45nm'ye rağmen) bu kadar büyük olmasına sebep olan Intel zarının , büyük L2 cache belleği. X2'lerin EE modelleri ile Wolfdale 6MB ların zar boyutu ve wafer değerleri neredeyse aynı.


Şimdi sorular aklınıza gelecek:
Bu adam neden hazırladı bunları, yoksa mikroişlemci piyasasına girmeyi mi düşünüyor?
Bunların bize ne yararı var ki, bizi niye alâkadar etsin?


Birincisi hassas çalıştım onu söyleyeyim, GTX280 ve RV770 neredeyse mükemmel kare şeklinde olduklarından onların ölçeklendirilmesi sorun olmadı, ama Intel işlemci beni hesap kitapla uğraştırdı. 107mm^2 alanın çarpanlarını, çok hassas biçimde gerçek zarın kenarları oranına göre bularak ölçeklendirmek yani... Intel'e sesleniyorm, lütfen kare şeklinde üretin

Bu da o hesapların bir kısmının resmi:

F23 ve F26'daki o nadide rakamları çarpıyorsunuz ki 107mm^2 olduğunu bulup sağlayabilin hesabı doğru yaptığınızı ve tabloda görünmeyen küsurat var.




İftara yaklaşırken ve kafam iyice bulanıyorken, aklıma gelen diğer şeyleri yazmaya devam edeyim, akünün suyu tamamen boşalmadan.
1. AMD, L2 bellekten ötürü zarda çok büyük alandan kâr ediyor. 45nm Intel cpusu ile zar boyutu neredeyse aynı. Performansları ayrı kavram, farklı mesele.
Lafı nereye getireceğim; AMD 45nm'ye geçtiğinde, her alandaki işlemcileri rakibi olan Intel işlemcilerden daha az yer tutuyor olacak wafer üzerinde. Bu da maliyet açısından önemli. Hele L3'ü olmayan Quadcore Propus'ları düşününce, heyecanlanmamak elde değil.

2. Atom cpu'yu (örnek aldığım N270) hesaplamadım, çok uğraştıracaktı çünkü. Şunu diyeyim, Penryn adedini 4 ile çarpın. Hatta bir de %15 ekleyin bu adede (~=570*4*1,15), kenar kırpık kayıpları Atom'da daha az olacağı için, zar alanı 25mm^2 tutuyor. Intel bundan ne para kırıyor, gerisini siz düşünün. Tabi bu satıldığı için hem kendisinin, hem rakiplerinin bazı segment satışları azalıyor, o da ayrı bir mesele.

3. nVidia transistör yığmakla kendi zarar ediyor. nVidia'nın şu an en çok muhtaç olduğu şey yeni bir mimari. GTX280, RV770'e kıyaslandığında, RV770 234 parça çıkarırken, GTX280 98 parça çıkarıyor. GTX280, büyük olduğundan, kırpık kenardan daha çok muzdarip oluyor.

Ayrıca, bu adetler, %100 verim halinde geçerli. Ama o waferden %100 verim çıkmaz. %85 diyelim. Hem nokta kadar da kusur oluşsa wafer üzerinde, nVidia'da koca bir GTX280 chipi katlolurken, aynı büyüklükteki kusur, tek bir RV770 götürüyor. Yani zarar üstüne zarar.

Tasarladığınız zar boyutu ne kadar büyürse, o kadar da verim düşüyor.

Bir de bunun packaging denilen son aşamadaki zayiatları var, ona da %5 diyelim. 98 GTX280 'nin, 98*0,85*0,95=~79 tanesi satılabilir hâle gelebiliyor. 234 RV770'in ise, 234*0,85*0,95=~189. Yani, 300mm waferde ve sonrasındaki işlemlerde, her 2 GTX280 chipine karşılık, 5 adet RV770 hasadı var.

Koltuğunuza yaslanın, gözlerinizi kapatın ve ATi'nin, indirim konusunda ne kadar ileri gidebileceğini düşünün.

Maliyet 2 katından fazla diye sürekli diyordum, belki fabrika raporlarını ele geçirebilsek göreceğiz ki, 3 katı.

İşte bu yüzden AMD-ATi'nin yeni stratejisi bu, alanı büyütmeden, performansı büyütmek.

Diyeceğim o ki: 45nm AMD işlemcileri, bilhassa Propusları ve 40nm RV870 'lil Dragon'u bekleyin... dört gözle.
Ve çok büyük indirimler ummakta özgürsünüz.



Düzenleme notu: Resimler çok büyük olduğu için küçültülüyor forum yazılımı tarafından, tıklayarak görün.
Hakkında
Konum: Kocaeli,Derince
Forum İkinci El İmzası:
Hakkımda:
Haber arşivime ulaşmak için tıkla6DD4692A52D24BF9B3145896A483369B.jpg
Temel Bilgiler ve İstatistikler
Aktiflik: Şu anda DH'de değil
Son Giriş: geçen yıl
Son Mesaj Zamanı: 11 yıl
Mesaj Sayısı: 3.672
Gerçek Toplam Mesaj Sayısı: 3.928
İkinci El Bölümü Mesajları: 34
Konularının görüntülenme sayısı: 77.635 (Bu ay: 132)
Toplam aldığı artı oy sayısı: 1 (Bu hafta: 0)
En çok mesaj yazdığı forum bölümü: Donanım / Hardware
Mesajları
İkinci El Referansları
- x
Bildirim
mesajınız kopyalandı (ctrl+v) yapıştırmak istediğiniz yere yapıştırabilirsiniz.