AMD Mantle Hakkında Her Şey | DonanımHaber Forum

AMD Mantle Hakkında Her Şey - Sayfa 4

Jake Lockley · 2013-10-19T17:33:57.0000000+03:00

7000 serisi ve uzeri kart gerekiyor. A Graphics Core Next-enabled graphics chip, such as the AMD Radeon™ R9 Series, R7 Series or HD 7000 Series GPUs. http://community.amd.com/community/amd-blogs/amd-gaming/blog/2013/10/17/the-four-core-principles-of-amd-s-mantle mantle oyunlara verilen bir destek degil oyun motoruna verilen destek yani o motorla yapilmis oyun GCN mimari kartlarda daha iyi calisiyor.frostbite3 motoruyla ve farkli motorlarla su anda hazirlanan 20 tane oyun var yeni oyunlar da aciklandi ve mantlenin islemci uzerinde de etkisi var.11 kasimda yapilan yazilim gelistiricileri konferansinda mantle ile bf4 demo render artik bir sey oturup oynamadilar ama 290x'e 2 ghz'ye dusurulmus 8350 yetmis yani islemcileri rahatlacak bir sey olacagi zaten bekleniyordu ama bu kadar fark beklemiyordum. Mantle surucu: http://support.amd.com/en-us/kb-articles/Pages/latest-catalyst-windows-beta.aspx 24.06 güncelleme: thief ve bf4 oyunlarinin shaderlerinin dx11'den devsirme oldugunu ogrendim bu yuzden mantle secince grafik farki olmuyormus.ancak bu durumda bu oyunlar has mantle oyunu degil demektir.mantle icin ozel yapilan star swarm demo sonuclarini gostermek istiyorum sonicman nickli arkadasla beraber yaptigimiz.resimleri de gorelim derseniz 12-13. sayfada olmasi lazim.burada dikkat cekilen sey islemci hizi dustukce dx11 ile mantle arasindaki farkin artmasi. Star Swarm Demo .45 ACP 14.1 sürücü 7970+8320@4.4 ghz Directx 24.24 fps Mantle 51.72 fps Fark Yüzdesi: %133 _______________________ 7970+8320@2 ghz Directx 12.80 fps Mantle 43.81 Fark Yüzdesi: %342 Sonicman 14.1 sürücü 7950+2500K@5.3Ghz Directx 44.24 fps Mantle 64 fps Fark Yüzdesi: %44.67 ________________________ 7950+2500K@3.3 ghz Directx 28.17 Mantle 53.69 Fark Yüzdesi: %90.59 _________________________ 7950+2500K@1.6 ghz Directx: 17.19 Mantle: 55.42 Fark Yüzdesi: %222.4

buraoca2

Yarbay

12812 Mesaj

Tüm Başarılarını Gör

_____________________________

İmzanız kural dışıdır! || Uymanız gereken imza kurallarını okumak için tıklayınız.

Tugrul_512bit

Yarbay

7312 Mesaj

Tüm Başarılarını Gör

_____________________________

İmzam kural dışıdır! || Uymam gereken imza kurallarını okumak için tıkladım ama sonra üşendim ve bu mesajı değiştirdim.

-dehşet-

Yarbay

6862 Mesaj

Tüm Başarılarını Gör

_____________________________

Belki benim kağıt param bir şekilde döne dolaşa senin cebine girmiştir...
Bülent ORTAÇGİL

Sanat Günesi

Yarbay

2547 Mesaj

Tüm Başarılarını Gör

_____________________________

W Nex Sacramentum

Binbaşı

1743 Mesaj

Tüm Başarılarını Gör

_____________________________

Jake Lockley

Yarbay

36035 Mesaj

Tüm Başarılarını Gör

_____________________________

Wilson Fisk - .45 ACP - cyrix120

https://ibb.co/JFcsQyQL

Rubisco

Kurmay Yarbay

4914 Mesaj

Tüm Başarılarını Gör

_____________________________

Mess With us, and you will feel
A Pain so true yet so unreal

Tugrul_512bit

Yarbay

7312 Mesaj

Tüm Başarılarını Gör

_____________________________

İmzam kural dışıdır! || Uymam gereken imza kurallarını okumak için tıkladım ama sonra üşendim ve bu mesajı değiştirdim.

Rubisco

Kurmay Yarbay

4914 Mesaj

Tüm Başarılarını Gör

_____________________________

Mess With us, and you will feel
A Pain so true yet so unreal

Tugrul_512bit

Yarbay

7312 Mesaj

Tüm Başarılarını Gör

quote:

Orijinalden alıntı: Rubisco

quote:

Orijinalden alıntı: Tugrul_512bit

Artık C++ AMP yardımıyla APU'nun hem normal çekirdeklerini hem gcn çekirdeklerini aynı şekilde kullanabilecek miyiz kolayca? Atıyorum SSE/AVX gibi optimizasyonları gcn üzerine aktarabilecek miyiz? Mesela skyrim sse optimizasyonunu gcn ye aktarabilen bir iş hattı var ise ne güzel olur değil mi?

HSA'nın amacı o ama zort diye olacak değil. Ona uygun kodlamayı tasarımı faln ypman grek. Onun için library faln var veya hazırlanıyor. Bolt'u faln o amaçla çıkardılar zaten. Orda ama ihtiyacın olan şeyin nerede nasıl neyle yapılması gereklilği de önemli. Eğer gecikmeden yüksek oranda etkilenmeye meyilli ise ve bunu engelleyemiyorsan, coherent bus / GCN / GPU'da kurtarmayabilir seni APU için. Skyrm SSE için doğru, eğer elleirnde imkan olsaydı belli hesaplamayı GPU'ya gecikmeden darbe almayacak kşekilde aktarabilselerde katkısı güzel olurdu. Önemli olan neyin nasıl implemente edildiği, donanımın sınırlarını bilmek, o sınırlar içine yapmak istediğin şeyi sığdırmaya çalışmk.
Bi miktar hesaplama için SSE yerine GPU'ya çıkmak sana ilave yüzlerce cycle gecikmeye maloluyorsa, oyunda bu FPS düşüşü olarak geri geliyorsa ne anladım o işten o zman dersin rahatça. Critic path üstünde olmayan, GPU'daki bi sonucu işletebileceksen faydalı olmuş olacak.

Elde bi library olsun, belli bi yere kadar SSE gibi kullanabileyim GPU'yu, APU üstünde bile olsa yeter dedirtebildikleri sürece çok ekmek yiyen çıkar bundan. Dedikleri gibi hesap sistemlerine faln verimli olarak entegre edilebilir bu. O noktadan sonra işte öbür tarafta dediğin / dediğim daha büyük APU / multi-soket coherent APU / HSA sistemler çoğalma eğilimine girer.

Peki crossfire olayını artık tüm gcn kartlar-apu arasında yapmaya olanak sağlayabilir mi bu mantle?

Mesela isteyen HD7730 ile 384 çekirdek daha ekleyerek ikiye katlasın, isteyen R9-290x 'i %5-%10 daha fazla performanslı kullansın. Tıpkı lucid-virtu-mvp yardımıyla intel HD kullanarak çerçeve düzenleme/atlama yapan anakartlar gibi.

_____________________________

İmzam kural dışıdır! || Uymam gereken imza kurallarını okumak için tıkladım ama sonra üşendim ve bu mesajı değiştirdim.

defaulticus

Yarbay

8849 Mesaj

Tüm Başarılarını Gör

_____________________________

AMD Ryzen 7 5800x3d - Arctic Liquid Freezer II 420 aio - Asus x570 ROG Crosshair VIII Hero - Gskill 2 x 16gb 3200CL14 Ram(3800CL16) - Asus Rtx4090 TUF OC - Samsung 990 PRO 2tb m2 SSD, Samsung 980 PRO 1tb m2 SSD, 3 x Samsung 870 QVO 8tb SSD - Samsung G8 OLED Monitor - Phanteks Enthoo Pro 2 Case - Corsair AX1000 Platinum Psu - Creative Sound Blaster AE-9 Sound Card - Noctua NF-A12x25 PWM Chromax, Arctic P14 PWM PST fans, Corsair Icue Commander Core XT - Logitech G815 Tactile Keyboard - Logitech G PRO X SUPERLIGHT Mouse - ARTISAN FX HAYATEOTSU X-SOFT X-LARGE Mousepad - Sennheiser HD 800s hi fi Headphone

Guest-994965FA4

Yarbay

11051 Mesaj

Tüm Başarılarını Gör

_____________________________

Rubisco

Kurmay Yarbay

4914 Mesaj

Tüm Başarılarını Gör

Tugrul_512bit

kullanıcısına yanıt

_____________________________

Mess With us, and you will feel
A Pain so true yet so unreal

Tugrul_512bit

Yarbay

7312 Mesaj

Tüm Başarılarını Gör

_____________________________

İmzam kural dışıdır! || Uymam gereken imza kurallarını okumak için tıkladım ama sonra üşendim ve bu mesajı değiştirdim.

Rubisco

Kurmay Yarbay

4914 Mesaj

Tüm Başarılarını Gör

_____________________________

Mess With us, and you will feel
A Pain so true yet so unreal

Tugrul_512bit

Yarbay

7312 Mesaj

Tüm Başarılarını Gör

@Rubisco

Aslında buna uygun sayılabilecek bir çeşit programlama türü vardı unuttum adını, bildiğim kadarını söyleyeyim:

1)Çizimi yapılacak nesneler sıraya konulup parçalara ayrılır ve hesaplanacak fizik öğeleri de parçalara ayrılır.

2)Daha sonra sistemdeki tüm hızlandırıcılar vb... için çalışabilirlik durumu algılanır. Uygun olanlara iş verilir. Kim işini çabuk bitirirse, sıradaki işi kapar.

Simülasyon: 3dmark11 P-preset, combined.

Sadece 1 adet çerçeveyi bitirmek için gerekli işlemler 15 adet çizim + 12 adet fizik olsun.

Başla.

kalan iş: 15 çizim + 12 fizik

Aygıt durumu: HD7850= 5x, APU=2x

Aygıtlara iş sağlanıyor: HD7850=3 çizim + 2 fizik, APU=1 çizim + 1 fizik
kalan iş: 11 çizim + 10 fizik

Aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
Aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
Aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)

Aygıt durumu: APU=2x
Aygıtlara iş sağlanıyor: APU=2 çizim
kalan iş: 9çizim + 10 fizik

aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)

Aygıt durumu: APU=2x
Aygıtlara iş sağlanıyor: APU=2 fizik
kalan iş: 9 çizim + 8 fizik

aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)

Aygıt durumu: HD7850=5x, APU=2x
Aygıtlara iş sağlanıyor: HD7850=2 çizim + 2 fizik, APU= 2 çizim
kalan iş: 5 çizim + 6 fizik

aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)

Aygıt durumu: APU=2x
Aygıtlara iş sağlanıyor: APU= 2 çizim
kalan iş: 3 çizim + 6 fizik

aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)

Aygıt durumu: APU=2x
Aygıtlara iş sağlanıyor: APU= 2 çizim
kalan iş: 1 çizim + 6 fizik

aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)

Aygıt durumu: HD7850=5x, APU=2x
Aygıtlara iş sağlanıyor: HD7850=1 çizim + 4 fizik, APU= 2 fizik
kalan iş: yok

aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)
aygıt bekleniyor...(bu sırada CPU çekirdekleri de botları oynatıyor, oyun değişkenlerini hesaplıyor, sırayla yapılan bir işi yapıyor hatta fiziğe yardım ediyor)

çerçeve çiziliyor

başa dön.

< Bu mesaj bu kişi tarafından değiştirildi Tugrul_512bit -- 12 Kasım 2013; 22:15:39 >

_____________________________

İmzam kural dışıdır! || Uymam gereken imza kurallarını okumak için tıkladım ama sonra üşendim ve bu mesajı değiştirdim.

Rubisco

Kurmay Yarbay

4914 Mesaj

Tüm Başarılarını Gör

Oracle açıkladı bugün HSA'ya katılacağını vs. En azından elle tutulur her yerde çalışabilir demo da yaptılar.

@Tugrul_512bit Workerlar arası senkronizasyon hiçbi şart altında gerekmeyecek mi, gerekirse nasıl senkron edeceksin, main worker ile nasıl iletşim kuracaklar vs. vs. vs. tonla aydınlatman implemente etmen gereken şey var. Kurman gereken devasa bi framework var, bugün dünyada bunun altından kalkabilecek bişey yok. HSA bunu amaçlıyor ama yüksek seviyede. C# yada Java ile, yüksek seviyede yazdığın kodun, takr takr OpenCL kerneli yazmışsın gibi çalışmasını sağlatmak istiyor. Veya imkan varsa GPU değil DSP vs. üstünde.

Belli bi Framework olmadan bunları birleştirmen çok çok zor çok karmaşık, çok fazla detayı kayıp parçası vs. si var. Birbirleri arasında bağımlılık olmaması lazım bahsettiğin gibi çalışması için, gerçek dünyada imkansız. Bağımlılıkları kıracak gelişmiş bi scheduler altyapısı lazım o da olamaz. Bağımlılıkları azaltabilirsin ama tamamen kıramazsın. Ondan sonra dönüp dolaşıp farklı threadler arasında senkronizasyon / iletişim / belli limit / bariyere ulaşınca senkronize olana kadr boş beklemek yerine başka işle uğraştırman lazım vs. vs.

Yazdığın şeylerin parça parça farklı yerlerde yapılma durumu var veya yapılabiliyor. Ama baştan aşağı bütün sistem kaynaklarını dinamik oalrak kullanabilecek ve kullandırtabilecğeimiz tam bi yapı yok. CF benzeri işi mesela 12:3 oranında önceden bölersin. Sürekli dinamik olarak kalan işi yapabileceğin kadar kaynağın ve zmanın yok. Senin varsayımsal modelinde görev dağıtıcısının %100 olarak bağımsız iş yapabileceğine 1 kere dispatch ettikten sonra hiçbi threadin kendisine yakın olmayan gruptakiler ile veya daha yukarıdaki birimlerer ile ortak bi havuzda vs. iletişim kurmayacağı temel alıyorsun. Grafik için bunu yapamazsın, yapmak içn asla ama asla geri bildirimin olmaması gereken bi yapı kurman lazım. 1 kere dispatch ettikten sonra mümkün olduğu kadar sonuçların yerel olarak kullanılmasını istemen gerekir. harici karta sürekli emir yolla, APU'ya emir yolla, aralarındaki iletişim sorununu yok sayıyorsun yada önemsemiyorsun. dispatch ettikten sonra kendi kernellerini çalıştırsınlar ve anca yeni dispatchler ile bu çalışma yapısı değişsin demen lazım. Onu da her tür yapıya uyduramazsın sorun orda. N-body'e bi kısmını uydurursun, her bi parça sade etrafındaki parça ile etkileşir. Farklı kuvvet grupları / yerçekimini işin içine dahil ettiğin zaman dönüüp dolaşıp bağımlılıklar oluşur. Bağımlılığı dizayn aşamasında bi yere kadar kırmaya çalışırsın gerisi alt seviyede donanıma kalır (veya compiler altyapısına, daha öncesinde de kodlama alyapına).

Problemi tamamen bağımsız parçalara ayırmadığın sürece VE düşük gecikme süreleriyle işleyemediğin sürece, her bi parçasını ne kadar hızlı işlediğinin önemi kalmıyor. Bugun Nandini (Oracle Java VP) tam bunun üstüne parmak bastı. Sen BigData ile uğraşmak istiyorsun, elinde Tesla'lar var, ama o dediğim noktalardan sonra bu artık BigData olmaktan çıkıyor, sadece FastData'ya iniyor. Yapabildiğin bunları yerel olarak hızlı işlemek. En temelde fundemental olarak ne bu amaca uygun farklı bi yazılım altyapın var ne debuna uygun donanım altyapın . Birbirleriyle iletişim kurma / konusunda sorun yaşayan donanımların var, bunlarda o BigData'yı FastData kavramına çeviriyor. Teslalar arasında mikrosaniye seviyesinde MPI iletişimi kurman, Teslalar için Melanox ile Infiniband altyapısı kurmaları, GPU'nun başka bi serverdaki GPU'ya mikrosaniye mertebesinde komut yollaması sadece FastData'da kalmana yol açıyor. Fundemental olarak temel olarak yazılım altyapın da buna uyugn değil, portatif de değil, başka sistemlerle uyumlu değil. Dönüp dolaşıp en baştaki limitlere takılıyorsun. Nvidia boşuna bi tarafını yırtmıyor CPU'dan kurtulalım diye (sırf Xeon'dan kurtulup cebini doldurmak için değil anı zmanda tam unified bi CPU--GPU altyapısı kuramadığı için, bunu geliştirmek için işletim sistemini çalıştırmak bi yandan da GPU/Tesla'yı sürmek için yeterli donanım altyapısı için dünya kadar başka şey istediği için vs. vs. ). Echelon peşinden boşuna koşmuyorlar. O zamana kadar altından kalkabilecek şeyleri yok, yapabildikleri FastData olarak işlemek. Temel olarak olaya bakış açısında değişim getiremiyorlar.

Bu da bizi en baştaki sorunumuza geri götürüyor. Eğer Kaveri tarzı bi APU'nun devasa versiyonlarını yapamazsak farklı sistemler arasındaki iletişim yükleri bize bela olur. İş dönüp dolaşıp bizim problemin çözümü aşamasında tasarımını yaparken, problemi çok çok yüksek oranda bağımsız parçalara indirgememiz gerekiyor. Bnu yaparken de elimizdeki donanıma bakıyoruz. Bu şekilde parçalarsak ne kadar verimle işleyebilriim duvara toslamadan önce vs. diye.

Oyun kısmına geri dönersek(hiç o kısmına girmedim dikkat edersen, çoğunlukla GPGPU / HPC üstünden gittim), 3d render kısmında driver altyapısının nasıl işlediğine vs. sine bi miktar bakarsan bi sürü user moddan kernel moda geçiş olduğnu driverın gidip GPU'ya bişey koyduğunu, sonra GPU'nun geri dönüp bana bişey koyuldu bunu aldım işledim sana bunu geri bildiriyorum dediğini vs. vs. bunun da tonla başka kımı var. Şu an oyun için yaygın Dx var. GL bunu parmak şıklatalım, şık, bütün dertlemizin çözümü noktasına indirimeyiz. Mantle tarzı zımbırtılar da bi yere kadar. Farklı donanım birimleri arasında iletişim kurmamız, geri bildirim almamız vs. gerekiyor, birbirleri arasında bağımlılıklar oluyor. Bunları kıramıyorsun, conditional jump vs. gibi şeyler yerine GPU'lar bi maske ekliyor pipeline'a. Bunun üstünden bi bracnh açıyor, iki farklı durumu da işliyor. Bu tarz kısımlar işin alt seviye kısmına giriyor. Alt seviyede komutların işlemesi , GPU birimlerinin iletişimi vs. CPU'dan çok çok farklı değil. Bi sürü branch, yerine göre prediction, yerine göre önden yollanmış hint vs. vs. tonla şey var. Alt seviyede komutlar arasında iletişim, senkronizayon, yeni veri yüklenmesi, geri bildirim yapılması, sonuçların bi yere yazılması vs. yine tonla şey var. Ama burda donanım seviyesinde bu bağımlılıklar ile yapılacak işlerle faln uğraşıyorsun. Yüksek seviyede, Dx komutlarına faln gedlğin zaman HLSL ile, veya GL için GLSL ile shader üstünden yapacakların için yine limitlerin var yine duvara toslayacağın yer var. Harici GPU'ya Vec4 yolla, dahili APU'ya Vec2 yolla, işle de. Bunun için de geri bildirim vs. gerektirmeyen yolla-ve-unut tarzı bi driver altyapın faln olmalı. APU'ya yolladğın işler için GPU'ya yolladığın işler için, en sonunda bi yerde bunların sonuçlarının birleştirilmesi vs. si gerkli.

Hep dönüp dolaşıp aynı yerlerde tıkanıp duruyoruz.

_____________________________

Mess With us, and you will feel
A Pain so true yet so unreal

Tugrul_512bit

Yarbay

7312 Mesaj

Tüm Başarılarını Gör

_____________________________

İmzam kural dışıdır! || Uymam gereken imza kurallarını okumak için tıkladım ama sonra üşendim ve bu mesajı değiştirdim.

Rubisco

Kurmay Yarbay

4914 Mesaj

Tüm Başarılarını Gör

quote:

Orijinalden alıntı: Tugrul_512bit

Her oyun/benchmark başında bir ön-benchmark ile en zorlu işi hangi parçaya vermek daha iyi olur o bulunsa mesela elimizde APU+HD7730-cf var , ön benchmark sonucuna göre render işlemini CF'ye vermek uygun görülmüş olsun. Tamamen bağımsız olan yapay zeka, gaz akışı hesabı, kırılan kutular, ses yankıları hesabı gibi şeyler de APU'da hesaplanacağı ortaya çıksın ön-benchmark yardımıyla. Yoksa her olasılığı, tüm kart kombinasyonlarını sürücüye koymak hatta overclocklu durumları hesaba katıp önceden tanımlanmış yük hesabı yapmak zor olmaz mı? Belki eleman apuya öyle bir oc çekecek ki HD7850 yi sollayacak ama oyun bunu algılayamayacak ve darboğaz meydana gelecek, güç boşa gidecek.

Aparapinin Javaya entegre hali gibi ama temiz bi syntax vs. ile. Demo belki sonradan çıkartırlar public yaparlar. Bi sürü session var hepsi dıraşı kapalı ve derya gibi şeyler var.

Oyunlar öyle yapılmıyor işte. Oyun dediğin şey için de dünya kadar durumu göze alman gerekiyor. Yetiştirmeye çalışılırken zar zor yetiştiriliyor artık, yıllar öncesi gibi değil. Yıllar önce PC Gamer "oyunlar artık beta haliyle satışa çıkıyor, kullanıcılar bugları temizliyor" gibisinden yazı yazmıştı. Şimdiki durum onun aşmış hali. Düzgün sorunsuz oyunlar da var ama çok oyunda öyle veya böyle sorunlar dizisi var. Saha testi son kullanıcı ile beraber bi tür geniş alanlı test olarak yürüyor. Beta meta olayları zaten farklı bi konumda artık feedback almak için.

İş böyle olunca, desteklemen gereken bi sürü cpu gpu mimarisi ve versiyonu olunca, olabildiğince hepsinde iyi çalışan bişey çıkartmaya çalışıyorlar. ****da bu dertlerin hiçbiri yok. SAbit platformun güzelliği orada, bodoslama istediğin kadar uç noktalara gidebilirsn. Pc için, bahsettiğin APU + CF küçük bi kullanıcı kısmınını oluşturuyor. Buna itiraz oalrak notebooklara, Intel'in işlemcisinin dahil olduğu Intel işlemci + harici GPU gibi durumları öne sürebilirsin. Bu seferde oyun geliştricisine, envai çeşit AMD Intel APU + harici GPU için bi render altyapısı kurdurtman lazım. bunu da driver dışından yapman lazım. Kimse bunu yapamaz.

AMD APU kısmına geri dönersek, bu tarz şeyler için baskı oluşturacak kadar geniş bi kullanıcı kitlesine ve yaygınlığa sahip değil. O yüzden kısım kısım mantıklı olsa da kimse onlarla uğraşmaz. Özellikle de geridönüşünün kısıtlı olduğu şeyler için. Onun yerine bugun olan şey, kullanmaya çalıştığın motora veya render altyapısına göre sistem kaynaklarını tahmin etmek. Çünkü çok çeşitli kullanıcı kitlesi var, bunların bi ton donanımı var. Sade APU CF için ise az sayıda kullanıcı var. Dönüp dolaşıp önceden bi yerde örneğini verdiğim ARM gillerden neden konsol çipi olmuyor olayı gibi noktaya geliyoruz. Geliştrici olarak küçük bi kullanıcı kısmına, varolan driver altyapısının tanımadığı ayrıcalığı tanıtmak istiyorsun. Driver altyapısı uygun olrsa Dx API üsütnden kurtarmaz uğraşmam dersin. Mantle için belki olur, detaylarını bilmioz mantle'ın çünkü.

Geliştrici önceki paragrafta, belli miktar varsayımda bulunuyor ona göre sistem kaynaklarını dağıtıyor. Mesela 4 thread üstünde kuruyor sitemini. 1 tane ana thread CPU kullanımında 1. çekirdeğin %95 seviyeleirnde meşgul ediyor. Render için de bu thread kullanılıyor. 2. 3 4. threadler diğer işlere yarıyor. Sonuçta elinde 4 çekirdekli işlemciyi %95 %13 %5 %12 oranlarında kullanan bi oyun çıkıyor. 6 8 çekirekli işlemciye koyduğun zman bunu yine saçma sapan dağılımlar kalıyor elinde. Hatta belki çok çekirdeği kullanmaya çalıştığından dolayı oluşan overhead performansı bile düşürüyor.

Sistem kaynaklarını tamamen dinamik ve verimli kullandırmtak için çok şeye ihtiyacın var. Bench 'e göre latency / throughput da test eder ona göre latency critic işleri hangisi iyi ise ona througput critic işleri diğerlerine atar. Oc li örnek verdin mesela, süper bi latency elde etti, ana render threadini ayrı bi çekirdeğe atar sürekli GPU'ya yüksek oranda dispatch edilmesini faln amaçlar. Olabilir bunlar ama çok çok çalışma ister, geri dönüşü soru işareti ama. AMD APU'lar %50 pazar payına sahip olsaydı, millet yatar kalkar bunlardan yağ çıkarmanın yollarına bakardı. Şimdiki pazar payı ile olası geliştirme zamanına değmez, uğraşmayız derler o kadar iş ile. Bunlara ayıracaklar zaman vs. için, daha iyi bi render kodu sıkıştırma kodu vs. bi ton başka şeyler uğraşırız diyebilirler ve haklılar. Arz talep eldeki imkanlar meselesi hep. ARM'dan konsol yap, koy MP32 GPU'yu. Hani nerde gerçek hayatta uygulaması var mı 1 Tflop'u geçen PowerVR? Kim lisansını alıp geliştirme işini gözü yiyor? Napıyorlar o yüzden, anca varolanla yetiniyorlar varolan tasarımları kullanıp konsol çakması bişeyler yapıyorlar. burda da durum aynı. Büyük bi kullanıcı kitlesini peşinden süürkleme imkanı olsa suyunu çıkartana kadar peşinden koşarlar. Konsolların farkı orda, dandik PS3'ün RSX'inin yapamadığı işleri arkasından dolaşa dolaşa yapabildiler bugune kadar geldi. Pc vs. ps3 bf3 'e bakıyorsun fark var kabul, ama o PS3'de BF3'ü çalıştırmanın bi nimet olduğunu anlayabilenlerin sayısı az (PS3'ü kötülüyorum burda, başka türlü anlayanlar olr). Geri dönüşü olan sana bişeyleri geri verebilen bi durum var, PS3'de geliştirme yaptığın zaman. Çünkü sabit platform. Bunun suyunu çıkartana kadar herşeyinin peşine düşersin, millete de bi voaaa dedirtecek oyun verebildiğin zaman 150TL den de 250TL den de satarsın oyunu. PC, APU CF olayı öyle değil, sorn da orda zaten.

Madem öyle, biz kodlama altyapısını geliştricilerin değerli bulabileceği çabuk geliştirme yapabileceği hale getirelim diyorlar. Olup biten herşey bununla alakalı. Orta karar bi C# / Java programcısına Al sana GPU al sana OpenCL al sana PC geliştir hızlandır bunu diyoruz bugun. HSA, direk senin yazdıkalrın ile alakalı değil ama bu C# Java programcısını , bugun OpenCL'de iş görecek kernel yazan C++ programcısının yaptığı işlerle karşılaştırılabilecek kadar ama bunu çok daha kolay yollardan yapma imkanı veren bi altyapı geliştrime olma derdinde. Bu, oyun yapımcıları içinde ters taraftan aynı. Mantle gibi yapılar (illa mimariye bağımlı olmak zorunda değiller), uygun library altyapıları ile uygun bi erişim altyapısı ile sana aylarca sürece araştırma inceleme içinden çıkmak için debelenme sürecini haftalara indirgeyecek ortam sunumalı. Ondan sonra sen, coherent yapıyı kullnmak için "oranın adresini nerde tutacaz, pointer buraya nasıl pass edilecek, şunu şurda parse etmem gerekir mi"" diye şeylerle mücadele etmeyeceksin. çağıracağın bi fonksiyon yada belli bi template sana pointer'ın assign edileceği yeri geri bildirimini vs. sini otomatik ayarlayacak hazır o kod kısmına yerleştirecek. Ondan sonra sen coherency için dert etmeden işini görebileceksin, farklı tasarım istiyorsan onun peşinde koşacaksın. Voxel bazlı bi iş için vaktini ona ayıracaksın mesela APU'daki Coherency'i kullanıken harici CF için 3 kuruş hızlanma nasıl elde ederim diye takla atmakla uğraşmayacaksın. Yine aynı şeyi söylersem dönüp dolaşıp pazardaki % ile alakalı. büyük baş olursan sana uymaya çalışan çok olur. yoksa böyle sürünürsün. Eski yönetimleirn yeterince göremediği içinden çıkamadığı şeyler hep bunlarla alakalıydı AMD'nin anasını ağlattılar.

Bu dediklerim ile , motorun bi kısmı hazır olmuş gibi oluyor. Belli işlemler için amerikayı yeniden keşfetmemen o donanıma uygun altyapının olması çok önemli şeyler. Developer programları buna benzer şeyler için var, ama tam bu APU / CF gibi daha düşük kullanıcı kitlelerini hedef almıyor. Geliştricilerin bunları da hedef almaalrı içn onlara hızlı geliştirme yapacakları ortam sunuman lazım tak tak halletsinler diye. %10lık kesimi dışarda bırakmasınlar, onlar için de hızlı çalışan bi kod alyapısı sunsunlar diye. uzun vadede anca olabilecek işler bunlar hep.

_____________________________

Mess With us, and you will feel
A Pain so true yet so unreal

AMD Mantle Hakkında Her Şey (4. sayfa)