eXpander
27-04-2009, 23:49
Doamnelor si domnilor, buna seara!
Acum 2 zile, co-forumistul si prietenul nostru, poparamiro, a publicat pe forum articolul acesta (http://forum.crazypc.ro/showthread.php?t=10996) in care testa influenta pe care o are latimea de banda a interfetei PCI-Express asupra performantelor placilor video. Mai exact, influenta pe care o are folosirea placilor in configuratie SLI pe sloturi PCI-E x16 sau PCI-E x8. Concluzia a fost simpla: influenta conexiunii PCI-E x16 sau x8 este extrem de mica, diferentele sunt foarte mici, si sesizabile doar in benchmark-uri, in jocuri ne-contand aproape deloc.
Acest articol vine in completarea celui publicat de Ramiro, folosind o singura placa video mai slaba (GTX 260), si testand si in mod x4.
Am inceput cateva teste deoarece aveam o vaga senzatie ca diferentele sunt asa de mici placilor video extrem de puternice (2buc GTX295, Quad-SLI), si vroiam sa vad cum se comporta o placa video mai slaba. Asa ca, inarmat cu un pix, o foaie, un calculator, un internet si o portie de determinare, am inceput sa ma documentez si sa fac niste calcule. Doream sa aflu de ce este nevoie pentru a se atinge limita fizica a interfetei PCI-E.
Asa am aflat ca fiecare lane al interfetei PCI-Express Generation 2.0 poate transporta 500 MB/s. Deci, in cazul folosirii interfetei PCI-E x16, avem o latime de banda maxima de 8000MB/s, in cazul x8 avem 4000MB/s etc. Ei, dupa cateva calcule, am mai facut niste calcule, urmate de alte calcule... Patru ore mai tarziu... am ajuns la cateva rezultate. Mai exact, am aflat pentru un GTX 260:
- latimea totala de banda a memoriei video;
- latimea de banda necesara doar pentru afisarea unui cadru
- numarul maxim teoretic de cadre care pot fi afisate de catre placa video, pana in momentul in care latimea de banda nu mai este suficienta.
Dupa aceea mi-am dat seama ca am ratat complet tinta si ca de fapt asta n-are nici o legatura cu interfata PCI-Express, ci cu bus-ul intern al placii video. Pentru a afla momentul in care ramanem fara banda pe bus-ul PCI-E, avem nevoie sa stim cantitatea de date care se transporta prin bus in fiecare secunda. Ei, din pacate, n-am gasit absolut nimic care sa-mi ofere aceasta informatie.
Asa ca m-am hotarat sa trec la testarea placii video in practica.
1. Principiul de functionare:
M-am gandit ca cel mai bine ar fi sa limitez efectiv placa sa ruleze in modurile care doream sa le testez: x16, x8, x4 si x1. Dupa aceea mi-am dat seama ca pe placa de baza am doar un slot x16 si unul x8. Cum ramanea cu testele in x4 si x1? Mi-am adus aminte ca acum vreo 2 ani citisem un articol similar de la Tom’s Hardware, in care limitasera modul de functionare al bus-ului PCI-E prin izolarea pinilor care dicteaza latimea de banda prin acoperirea acestora cu banda izolatoare. Acest lucru este posibil datorita constructiei „modulare” a interfetei. Asa ca am facut rost de o diagrama a pinilor (atasata in acest post) si m-am apucat sa-i izolez.
Mod x8:
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/x8.jpg
Mod x4:
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/x4.jpg
Din pacate, in mod x1 placa nu a functionat, deci nu am postat si aceste rezultate. Sistemul a boot-at corect, dar nu afisa deloc imaginea. Si sunt sigur ca am acoperit pinii care trebuiau, deci tind sa cred ca e o limitare a placii mele.
2. Sistemul de test.
Sistemul de test este sistemul pe care-mi desfasor activitatea in mod normal, si este compus din:
Hardware:
CPU: Intel Core2Duo E6750 @ 3.2GHz
Placa de baza: Gigabyte EP45-UD3P Rev. 1.0, BIOS F9a
Memorie: 2 x 1GB Crucial Ballistix Tracer @ 1066MHz, CL5-5-5-15 (stock)
Placa video: Gigabyte GTX 260 OC @ 576 / 999 / 1242 (stock)
Sursa: Gigabyte Superb 550W
HDD: Seagate 200GB S-ATA II
Monitor: CRT Compaq V75, max 1280x1024 @ 60Hz
Software:
Sistem de operare: Windows XP Professional SP2 x86
Driver video: Forceware 182.50
3DMark2001 SE Build 3.3.0
3DMark06 Professional Edition 1.1.0
FurMark Build 1.6.5.
Far Cry 2 Benchmark Tool V. 1.0.2.0
Crysis Build 5767
CPU-Z 1.50
GPU-Z 0.3.3
3. Metoda de testare:
Am folosit procesorul cu un minim de overclock la 3.2GHz (totul pus pe Auto, din lene :D), desi stiu ca functioneaza fara probleme la 3.6GHz, si cu mici probleme la 3.73GHz (bsod cam la 2 ore – n-am avut timp/chef sa-l bibilesc) pentru ca am profilurile salvate in BIOS si au fost testate si ras-testate. Din pacate sistemul de operare cam face figuri si nu vrea mai sus de 3.2GHz. Se duse naibii la ultima instalare fresh cand am pus driverii de chipset (cu ocazia concursului de la Lab501.ro pt HD4870 X2) si mi-a fost prea lene sa-l reinstalez. O sa fac asta pe viitor.
Placa video si memoria RAM au ramas la setarile indicate de producator.
Pentru ca nu am vrut sa o intind prea mult, am ales doar 5 teste: trei sintetice si doua jocuri. Am selectat aceste doua jocuri deoarece sunt cele mai pretentioase si solicitante dintre toate jocurile care le-am avut la dispozitie.
Testele in 3Dmark2001SE s-au efectual la setarile standard, 1024x768x32bit. Pentru toate celelalte teste, rezolutia a fost de 1280 x 1024 x 32bit. Setarile in driver au fost default, la fel si in cazul testelor sintetice. In cazul celor doua jocuri, s-au utilizat profilele predefinite: „High” in Crysis si „Ultra High” in Far Cry 2. Din pacate Crysis nu permite setarea profilului „Ultra High” decat in Vista.
S-a testat atat cu Antialiasing 8x, cat si fara AA. Pentru aceasta, s-a apelat la optiunea existenta in aplicatii, deci nu s-a fortat din driver.
Dupa cum o sa vedeti, in unele screenshot-uri din 3Dmark01 si 06 lipsesc instantele de CPU-Z. Am uitat sa le pun o data, dupa care nu le-am mai pus deloc, deoarece setarile de procesor si memorie au ramas aceleasi pe toata durata testelor. Pentru FurMark, Crysis si Far Cry 2 nu am mai facut screenshot-uri deoarece am considerat a fi inutil.
4. Rezultate si interpretarea lor:
Incepem cu jocurile.
Crysis CPU Benchmark
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-CrysisCPU.jpg
Dupa cum se vede, diferenta dintre x16 si x8 este infima, putand fi la fel de bine neglijata. Practic se incadreaza in marja de eroare experimentala. Testul l-am repetat de 3 ori, si de fiecare data am obtinut acelasi rezultat.
In momentul activarii AA, in mod x4 rata fps-urilor scade sub pragul de 30fps, fapt care cauzeaza neplaceri resimtite puternic in experienta de joc.
Crysis GPU Benchmark
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-CrysisGPU.jpg
Situatia este identica cu testul de CPU.
Per ansamblu, experienta de joc pare identica in toate 3 cazurile, atat fara AA cat si cu AA 8x. Doar ca in cazul AA 8x, framerate-ul minim cade sub pragul jucabil de 30fps.
Totusi, o scadere a performantelor de peste 40% in cazul folosirii AA e destul de suparatoare. Partea buna e ca jocul arata excelent si fara AA, la detalii mari, astfel ca e indicat sa nu-l folosim in cazul unei configuratii mai mediocre.
Far Cry 2
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-FarCry.jpg
Fara AA, se vede o diferenta relativ semnificativa intre cele 3 setari testate. In momentul activarii AA 8x, framerate-ul scade simtitor, si diferenta intre cele 3 setari este mult mai mica. Aceasta in schimb poate fi privita ca o problema a placii video sau a driverului, nu neaparat a limitarii latimii de banda. Totusi, jocul arata destul de urat fara AA, asa ca un minim de 2x, sau chiar 4x este indicat, fara pierderi semnificative de performanta.
Continuam cu testele sintetice:
3DMark2001 SE
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-3DMark2001SE.jpg
Da, rezultatele sunt foarte confuze. Am testat de mai multe ori fara AA in x16 si x8, cu restart dupa fiecare test.Cu toate acestea, am obtinut aceleasi rezultate.
In cazul PCI-E x8 cu AA 8x activat, de 3 ori am obtinut acelasi rezultat, mai slab ca in PCI-E x4. Inca nu am o explicatie sigura pentru situatia asta, cu toate ca banuiesc lipsa optimizarii driverilor.
3DMark2006
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-3DMark2006.jpg
Aici rezultatul este asteptat, o scadere constanta intre modurile x16, x8 si x4. Desi scaderea este relativ nesemnificativa.
FurMark
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-FurMark.jpg
FurMark l-am pus mai mult din curiozitate personala. Dupa cum se vede si din rezultate, chiar nu-i pasa de latimea de banda.
5. Concluzii.
Singura concluzie care pot sa o fac acum e ca latimea de banda oferita de catre interfata PCI-Express este arhisuficienta pentru sistemele existente la ora aceasta pe piata. Nu pot spune sigur daca GPU-ul sau CPU-ul sau memoria RAM trage in spate performanta totala a sistemului. Singurul lucru care-l pot spune cu certitudine e ca memoria RAM a placii video este mult mai rapida decat memoria sistemului, si ca latimea de banda oferita de aceasta este enorm de mare comparativ cu latimea de banda a memoriei RAM (de exemplu, latimea totala de banda in cazul unei placi video GTX 260 este de 111888 MB/s). Dar aceste lucruri le stiati deja.
Asa ca eu va multumesc pentru atentia cu care ati citit acest prim review al meu, si sper ca pe viitor sa revin cu alte review-uri si mai interesante.
Toate cele bune,
Dudu.
Acum 2 zile, co-forumistul si prietenul nostru, poparamiro, a publicat pe forum articolul acesta (http://forum.crazypc.ro/showthread.php?t=10996) in care testa influenta pe care o are latimea de banda a interfetei PCI-Express asupra performantelor placilor video. Mai exact, influenta pe care o are folosirea placilor in configuratie SLI pe sloturi PCI-E x16 sau PCI-E x8. Concluzia a fost simpla: influenta conexiunii PCI-E x16 sau x8 este extrem de mica, diferentele sunt foarte mici, si sesizabile doar in benchmark-uri, in jocuri ne-contand aproape deloc.
Acest articol vine in completarea celui publicat de Ramiro, folosind o singura placa video mai slaba (GTX 260), si testand si in mod x4.
Am inceput cateva teste deoarece aveam o vaga senzatie ca diferentele sunt asa de mici placilor video extrem de puternice (2buc GTX295, Quad-SLI), si vroiam sa vad cum se comporta o placa video mai slaba. Asa ca, inarmat cu un pix, o foaie, un calculator, un internet si o portie de determinare, am inceput sa ma documentez si sa fac niste calcule. Doream sa aflu de ce este nevoie pentru a se atinge limita fizica a interfetei PCI-E.
Asa am aflat ca fiecare lane al interfetei PCI-Express Generation 2.0 poate transporta 500 MB/s. Deci, in cazul folosirii interfetei PCI-E x16, avem o latime de banda maxima de 8000MB/s, in cazul x8 avem 4000MB/s etc. Ei, dupa cateva calcule, am mai facut niste calcule, urmate de alte calcule... Patru ore mai tarziu... am ajuns la cateva rezultate. Mai exact, am aflat pentru un GTX 260:
- latimea totala de banda a memoriei video;
- latimea de banda necesara doar pentru afisarea unui cadru
- numarul maxim teoretic de cadre care pot fi afisate de catre placa video, pana in momentul in care latimea de banda nu mai este suficienta.
Dupa aceea mi-am dat seama ca am ratat complet tinta si ca de fapt asta n-are nici o legatura cu interfata PCI-Express, ci cu bus-ul intern al placii video. Pentru a afla momentul in care ramanem fara banda pe bus-ul PCI-E, avem nevoie sa stim cantitatea de date care se transporta prin bus in fiecare secunda. Ei, din pacate, n-am gasit absolut nimic care sa-mi ofere aceasta informatie.
Asa ca m-am hotarat sa trec la testarea placii video in practica.
1. Principiul de functionare:
M-am gandit ca cel mai bine ar fi sa limitez efectiv placa sa ruleze in modurile care doream sa le testez: x16, x8, x4 si x1. Dupa aceea mi-am dat seama ca pe placa de baza am doar un slot x16 si unul x8. Cum ramanea cu testele in x4 si x1? Mi-am adus aminte ca acum vreo 2 ani citisem un articol similar de la Tom’s Hardware, in care limitasera modul de functionare al bus-ului PCI-E prin izolarea pinilor care dicteaza latimea de banda prin acoperirea acestora cu banda izolatoare. Acest lucru este posibil datorita constructiei „modulare” a interfetei. Asa ca am facut rost de o diagrama a pinilor (atasata in acest post) si m-am apucat sa-i izolez.
Mod x8:
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/x8.jpg
Mod x4:
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/x4.jpg
Din pacate, in mod x1 placa nu a functionat, deci nu am postat si aceste rezultate. Sistemul a boot-at corect, dar nu afisa deloc imaginea. Si sunt sigur ca am acoperit pinii care trebuiau, deci tind sa cred ca e o limitare a placii mele.
2. Sistemul de test.
Sistemul de test este sistemul pe care-mi desfasor activitatea in mod normal, si este compus din:
Hardware:
CPU: Intel Core2Duo E6750 @ 3.2GHz
Placa de baza: Gigabyte EP45-UD3P Rev. 1.0, BIOS F9a
Memorie: 2 x 1GB Crucial Ballistix Tracer @ 1066MHz, CL5-5-5-15 (stock)
Placa video: Gigabyte GTX 260 OC @ 576 / 999 / 1242 (stock)
Sursa: Gigabyte Superb 550W
HDD: Seagate 200GB S-ATA II
Monitor: CRT Compaq V75, max 1280x1024 @ 60Hz
Software:
Sistem de operare: Windows XP Professional SP2 x86
Driver video: Forceware 182.50
3DMark2001 SE Build 3.3.0
3DMark06 Professional Edition 1.1.0
FurMark Build 1.6.5.
Far Cry 2 Benchmark Tool V. 1.0.2.0
Crysis Build 5767
CPU-Z 1.50
GPU-Z 0.3.3
3. Metoda de testare:
Am folosit procesorul cu un minim de overclock la 3.2GHz (totul pus pe Auto, din lene :D), desi stiu ca functioneaza fara probleme la 3.6GHz, si cu mici probleme la 3.73GHz (bsod cam la 2 ore – n-am avut timp/chef sa-l bibilesc) pentru ca am profilurile salvate in BIOS si au fost testate si ras-testate. Din pacate sistemul de operare cam face figuri si nu vrea mai sus de 3.2GHz. Se duse naibii la ultima instalare fresh cand am pus driverii de chipset (cu ocazia concursului de la Lab501.ro pt HD4870 X2) si mi-a fost prea lene sa-l reinstalez. O sa fac asta pe viitor.
Placa video si memoria RAM au ramas la setarile indicate de producator.
Pentru ca nu am vrut sa o intind prea mult, am ales doar 5 teste: trei sintetice si doua jocuri. Am selectat aceste doua jocuri deoarece sunt cele mai pretentioase si solicitante dintre toate jocurile care le-am avut la dispozitie.
Testele in 3Dmark2001SE s-au efectual la setarile standard, 1024x768x32bit. Pentru toate celelalte teste, rezolutia a fost de 1280 x 1024 x 32bit. Setarile in driver au fost default, la fel si in cazul testelor sintetice. In cazul celor doua jocuri, s-au utilizat profilele predefinite: „High” in Crysis si „Ultra High” in Far Cry 2. Din pacate Crysis nu permite setarea profilului „Ultra High” decat in Vista.
S-a testat atat cu Antialiasing 8x, cat si fara AA. Pentru aceasta, s-a apelat la optiunea existenta in aplicatii, deci nu s-a fortat din driver.
Dupa cum o sa vedeti, in unele screenshot-uri din 3Dmark01 si 06 lipsesc instantele de CPU-Z. Am uitat sa le pun o data, dupa care nu le-am mai pus deloc, deoarece setarile de procesor si memorie au ramas aceleasi pe toata durata testelor. Pentru FurMark, Crysis si Far Cry 2 nu am mai facut screenshot-uri deoarece am considerat a fi inutil.
4. Rezultate si interpretarea lor:
Incepem cu jocurile.
Crysis CPU Benchmark
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-CrysisCPU.jpg
Dupa cum se vede, diferenta dintre x16 si x8 este infima, putand fi la fel de bine neglijata. Practic se incadreaza in marja de eroare experimentala. Testul l-am repetat de 3 ori, si de fiecare data am obtinut acelasi rezultat.
In momentul activarii AA, in mod x4 rata fps-urilor scade sub pragul de 30fps, fapt care cauzeaza neplaceri resimtite puternic in experienta de joc.
Crysis GPU Benchmark
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-CrysisGPU.jpg
Situatia este identica cu testul de CPU.
Per ansamblu, experienta de joc pare identica in toate 3 cazurile, atat fara AA cat si cu AA 8x. Doar ca in cazul AA 8x, framerate-ul minim cade sub pragul jucabil de 30fps.
Totusi, o scadere a performantelor de peste 40% in cazul folosirii AA e destul de suparatoare. Partea buna e ca jocul arata excelent si fara AA, la detalii mari, astfel ca e indicat sa nu-l folosim in cazul unei configuratii mai mediocre.
Far Cry 2
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-FarCry.jpg
Fara AA, se vede o diferenta relativ semnificativa intre cele 3 setari testate. In momentul activarii AA 8x, framerate-ul scade simtitor, si diferenta intre cele 3 setari este mult mai mica. Aceasta in schimb poate fi privita ca o problema a placii video sau a driverului, nu neaparat a limitarii latimii de banda. Totusi, jocul arata destul de urat fara AA, asa ca un minim de 2x, sau chiar 4x este indicat, fara pierderi semnificative de performanta.
Continuam cu testele sintetice:
3DMark2001 SE
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-3DMark2001SE.jpg
Da, rezultatele sunt foarte confuze. Am testat de mai multe ori fara AA in x16 si x8, cu restart dupa fiecare test.Cu toate acestea, am obtinut aceleasi rezultate.
In cazul PCI-E x8 cu AA 8x activat, de 3 ori am obtinut acelasi rezultat, mai slab ca in PCI-E x4. Inca nu am o explicatie sigura pentru situatia asta, cu toate ca banuiesc lipsa optimizarii driverilor.
3DMark2006
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-3DMark2006.jpg
Aici rezultatul este asteptat, o scadere constanta intre modurile x16, x8 si x4. Desi scaderea este relativ nesemnificativa.
FurMark
http://i133.photobucket.com/albums/q80/expanderxl/PCI-E/Graph-FurMark.jpg
FurMark l-am pus mai mult din curiozitate personala. Dupa cum se vede si din rezultate, chiar nu-i pasa de latimea de banda.
5. Concluzii.
Singura concluzie care pot sa o fac acum e ca latimea de banda oferita de catre interfata PCI-Express este arhisuficienta pentru sistemele existente la ora aceasta pe piata. Nu pot spune sigur daca GPU-ul sau CPU-ul sau memoria RAM trage in spate performanta totala a sistemului. Singurul lucru care-l pot spune cu certitudine e ca memoria RAM a placii video este mult mai rapida decat memoria sistemului, si ca latimea de banda oferita de aceasta este enorm de mare comparativ cu latimea de banda a memoriei RAM (de exemplu, latimea totala de banda in cazul unei placi video GTX 260 este de 111888 MB/s). Dar aceste lucruri le stiati deja.
Asa ca eu va multumesc pentru atentia cu care ati citit acest prim review al meu, si sper ca pe viitor sa revin cu alte review-uri si mai interesante.
Toate cele bune,
Dudu.