Какво представляват растерните блокове в картата. Характеристики на националната модернизация или от какво не бива да пестите. Ценови категории и какво получаваме, ако закупим видеокарта от по-ниска серия

В първата част на нашето ръководство за видеокарти за начинаещи разгледахме ключовите компоненти: интерфейси, изходи, охладителна система, GPUи видео памет. Във втората част ще говорим за функциите и технологиите на видеокартите.

Основните компоненти на видеокартата:

  • изходи;
  • интерфейси;
  • охладителна система;
  • GPU;
  • видео памет.

Част 2 (тази статия): графични технологии:

  • речник;
  • GPU архитектура: характеристики
    върхови/пикселни единици, шейдъри, скорост на запълване, текстурни/растерни единици, конвейери;
  • GPU архитектура: технология
    технически процес, GPU честота, локална видео памет (обем, шина, тип, честота), решения с множество видео карти;
  • зрителни функции
    DirectX високо динамичен диапазон(HDR), изглаждане на цял екран, филтриране на текстури, текстури с висока разделителна способност.

Речник на основните графични термини

Скорост на обновяване

Точно както в киносалон или телевизия, вашият компютър симулира движение на монитора, като показва последователност от кадри. Честотата на опресняване на монитора показва колко пъти в секунда ще се актуализира изображението на екрана. Например, честота от 75 Hz съответства на 75 актуализации в секунда.

Ако компютърът обработва кадри по-бързо, отколкото мониторът може да изведе, тогава може да възникнат проблеми в игрите. Например, ако компютърът изобразява 100 кадъра в секунда и честотата на опресняване на монитора е 75 Hz, тогава поради припокривания мониторът може да показва само част от изображението по време на периода на опресняване. В резултат на това се появяват визуални артефакти.

Като решение можете да активирате V-Sync (вертикална синхронизация). Той ограничава броя на кадрите, които компютърът може да изведе до честотата на опресняване на монитора, предотвратявайки артефакти. Ако активирате V-Sync, броят кадри, изчислен в играта, никога няма да надхвърли честотата на опресняване. Тоест при 75 Hz компютърът ще изведе не повече от 75 кадъра в секунда.

Думата "Pixel" означава " снимкатура ел ement" е елемент на изображението. Това е малка точка на дисплея, която може да свети определени с цвят(в повечето случаи нюансът се получава от комбинация от три основни цвята: червен, зелен и син). Ако разделителната способност на екрана е 1024x768, тогава можете да видите матрица с ширина 1024 пиксела и височина 768 пиксела. Всички пиксели заедно съставят изображението. Изображението на екрана се обновява от 60 до 120 пъти в секунда, в зависимост от вида на дисплея и изходните данни от видеокартата. CRT мониторите опресняват дисплея ред по ред, докато LCD мониторите с плосък панел могат да опресняват всеки пиксел поотделно.

Всички обекти в 3D сцена са съставени от върхове. Вертексът е точка в триизмерното пространство с координати X, Y и Z. Няколко върха могат да бъдат групирани в многоъгълник: най-често това е триъгълник, но са възможни и по-сложни форми. След това върху многоъгълника се прилага текстура, което прави обекта да изглежда реалистичен. 3D кубът, показан на илюстрацията по-горе, се състои от осем върха. По-сложните обекти имат извити повърхности, които всъщност са съставени от много голям брой върхове.

Текстурата е просто 2D изображение с произволен размер, което се нанася върху 3D обект, за да симулира повърхността му. Например нашият 3D куб се състои от осем върха. Преди да приложите текстурата, изглежда като обикновена кутия. Но когато нанесем текстурата, кутията става цветна.


Програмите за пикселни шейдъри позволяват на видеокартата да произвежда впечатляващи ефекти, например като тази вода в Elder Scrolls: Oblivion.

Днес има два вида шейдъри: върхови и пикселни. Програмите за шейдъри на Vertex могат да променят или трансформират 3D обекти. Програмите за пикселни шейдъри ви позволяват да променяте цветовете на пикселите въз основа на някои данни. Представете си източник на светлина в 3D сцена, който кара осветените обекти да светят по-ярко, като в същото време предизвиква хвърляне на сенки върху други обекти. Всичко това се постига чрез промяна на цветовата информация на пикселите.

Пикселните шейдъри се използват за създаване на сложни ефекти в любимите ви игри. Например кодът на шейдър може да накара пикселите около 3D меч да светят по-ярко. Друг шейдър може да обработва всички върхове на сложен 3D обект и да симулира експлозия. Разработчиците на игри все повече се обръщат към сложни програми за шейдъри, за да създадат реалистични графики. Почти всяка съвременна игра с богата графика използва шейдъри.

С пускането на следващия интерфейс за програмиране на приложения (API) Microsoft DirectX 10 ще бъде пуснат трети тип шейдър, наречен геометричен шейдър. С тяхна помощ ще бъде възможно да се чупят предмети, да се модифицират и дори да се унищожават, в зависимост от желания резултат. Третият тип шейдъри може да се програмира точно по същия начин като първите два, но ролята му ще бъде различна.

Скорост на запълване

Много често на кутията с видеокарта можете да намерите стойността на скоростта на запълване. По принцип скоростта на запълване показва колко бързо GPU може да изведе пиксели. По-старите видеокарти имаха скорост на запълване на триъгълник. Но днес има два вида скорости на запълване: скорост на запълване на пиксели и скорост на запълване на текстури. Както вече споменахме, скоростта на запълване на пикселите съответства на скоростта на изход на пикселите. Изчислява се като броят на растерните операции (ROP), умножен по тактова честота.

Скоростта на запълване на текстурата се изчислява по различен начин от ATi и nVidia. Nvidia вярва, че скоростта се получава чрез умножаване на броя на пикселните конвейери по тактовата честота. И ATi умножава броя на текстурните единици по тактовата честота. По принцип и двата метода са правилни, тъй като nVidia използва една текстурна единица на пикселна шейдърна единица (т.е. една на пикселен конвейер).

Имайки предвид тези определения, нека продължим напред и да обсъдим най-важните функции на GPU, какво правят и защо са толкова важни.

Архитектура на GPU: Характеристики

Реалистичността на 3D графиката до голяма степен зависи от производителността на видеокартата. Колкото повече пикселни шейдърни блокове съдържа процесорът и колкото по-висока е честотата, толкова повече ефекти могат да бъдат приложени към 3D сцената, за да се подобри нейното визуално възприятие.

GPU съдържа много различни функционални блокове. По броя на някои компоненти можете да прецените колко мощен е графичният процесор. Преди да продължим, нека прегледаме най-важните функционални блокове.

Vertex процесори (върхови шейдъри)

Подобно на пикселните шейдъри, върховите процесори изпълняват шейдър код, който докосва върховете. Тъй като по-големият бюджет за върхове позволява създаването на по-сложни 3D обекти, производителността на процесорите за върхове е много важна в 3D сцени със сложни или голям брой обекти. Въпреки това модулите за върхови шейдъри все още нямат толкова очевидно въздействие върху производителността като пикселните процесори.

Пиксел процесори (пикселни шейдъри)

Пикселният процесор е компонент на графичен чип, предназначен за обработка на програми за пикселни шейдъри. Тези процесори извършват изчисления, които засягат само пиксели. Тъй като пикселите съдържат информация за цвета, пикселните шейдъри ви позволяват да постигнете впечатляващи графични ефекти. Например, повечето от водните ефекти, които виждате в игрите, са създадени с помощта на пикселни шейдъри. Обикновено броят на пикселните процесори се използва за сравняване на пикселната производителност на видеокартите. Ако една карта има осем пикселни шейдърни единици, а друга има 16 единици, тогава е логично да се предположи, че видеокарта с 16 единици ще бъде по-бърза при обработката на сложни пикселни шейдърни програми. Тактовата честота също трябва да се вземе предвид, но днес удвояването на броя на пикселните процесори е по-енергийно ефективно от удвояването на честотата на графичния чип.

Унифицирани шейдъри

Унифицираните шейдъри все още не са пристигнали в света на компютрите, но предстоящият стандарт DirectX 10 е базиран на подобна архитектура. Тоест структурата на кода на програмите за върхове, геометрия и пиксели ще бъде същата, въпреки че шейдърите ще изпълняват различни работни места. Новата спецификация може да се види в Xbox 360, където GPU е специално проектиран от ATi за Microsoft. Ще бъде много интересно да видим какъв потенциал носи нов DirectX 10.

Единици за картографиране на текстури (TMU)

Текстурите трябва да бъдат избрани и филтрирани. Тази работа се извършва от единици за картографиране на текстури, които работят заедно с единици за пикселни и върхови шейдъри. Работата на TMU е да прилага текстурни операции към пиксели. Броят на текстурните единици в GPU често се използва за сравняване на текстурната производителност на видеокартите. Не е неразумно да се предположи, че графична карта с повече TMU ще даде по-добра текстурна производителност.

Растерни операторски единици (ROP)

Растерните процесори са отговорни за записването на пикселни данни в паметта. Скоростта, с която се извършва тази операция, е скоростта на запълване. В първите дни на 3D ускорителите ROP и скоростта на запълване бяха много важни характеристики на видеокартите. Днес работата с ROP все още е важна, но производителността на видеокартата вече не е ограничена от тези блокове, както беше преди. Следователно производителността (и броят) на ROPs рядко се използва за оценка на скоростта на видеокарта.

Конвейери

Тръбопроводите се използват за описание на архитектурата на видеокартите и дават много ясна представа за производителността на GPU.

Конвейерът не може да се счита за строг технически термин. GPU използва различни тръбопроводи, които изпълняват различни функции. В исторически план конвейерът означава пикселен процесор, който е свързан към неговия блок за картографиране на текстури (TMU). Например видеокартата Radeon 9700 използва осем пикселни процесора, всеки от които е свързан към собствен TMU, така че се счита, че картата има осем конвейера.

Но съвременните процесори са много трудни за описание с броя на тръбопроводите. В сравнение с предишните проекти, новите процесори използват модулна, фрагментирана структура. ATi може да се счита за новатор в тази област, който с линията видеокарти X1000 премина към модулна структура, което направи възможно постигането на подобрения в производителността чрез вътрешна оптимизация. Някои CPU блокове се използват повече от други и за да подобри производителността на GPU, ATi се опита да намери компромис между броя на необходимите блокове и площта на матрицата (която не може да бъде увеличена много). В тази архитектура терминът "пикселна тръба" вече е загубил значението си, тъй като пикселните процесори вече не са свързани към собствените си TMU. Например, графичният процесор ATi Radeon X1600 има 12 единици за пикселни шейдъри и само четири единици за картографиране на текстури TMU. Следователно не може да се каже, че архитектурата на този процесор има 12 пикселни конвейера, както не може да се каже, че има само четири от тях. Въпреки това, по традиция, пикселните тръбопроводи все още се споменават.

Като се вземат предвид горните предположения, броят на пикселните тръбопроводи в GPU често се използва за сравняване на видеокарти (с изключение на линията ATi X1x00). Например, ако вземете видеокарти с 24 и 16 тръбопровода, тогава е напълно разумно да се предположи, че картата с 24 тръбопровода ще бъде по-бърза.

Архитектура на GPU: Технология

Технически процес

Този термин се отнася до размера на един елемент (транзистор) на чипа и точността на производствения процес. Подобренията в техническите процеси позволяват получаването на елементи с по-малък размер. Например процесът от 0,18 микрона произвежда по-големи характеристики от процеса от 0,13 микрона, така че не е толкова ефективен. По-малките транзистори работят при по-ниско напрежение. На свой ред намаляването на напрежението води до намаляване на топлинното съпротивление, което води до намаляване на количеството генерирана топлина. Подобренията в техническия процес позволяват да се намали разстоянието между функционалните блокове на чипа и прехвърлянето на данни отнема по-малко време. По-късите разстояния, по-ниските напрежения и други подобрения позволяват постигането на по-високи тактови честоти.

Това, което донякъде усложнява разбирането, е, че днес и микрометрите (μm), и нанометрите (nm) се използват за обозначаване на технически процес. Всъщност всичко е много просто: 1 нанометър е равен на 0,001 микрометър, така че 0,09-μm и 90-nm процеси са едно и също нещо. Както беше отбелязано по-горе, по-малката технология на процеса позволява по-високи тактови скорости. Например, ако сравним видеокарти с 0,18 микрона и 0,09 микрона (90 nm) чипове, тогава е съвсем разумно да очакваме по-висока честота от 90 nm карта.

Тактова честота на GPU

Тактовата честота на GPU се измерва в мегахерци (MHz), което представлява милиони тактови цикли в секунда.

Тактовата честота пряко влияе върху производителността на GPU. Колкото по-високо е, толкова повече работа може да се свърши за секунда. За първи пример, нека вземем видео карти nVidia GeForce 6600 и 6600 GT: Графичният процесор 6600 GT работи на 500 MHz, докато обикновената карта 6600 работи на 400 MHz. Тъй като процесорите са технически идентични, 20% увеличение на тактовата честота на 6600 GT води до по-висока производителност.

Но тактовата честота не е всичко. Имайте предвид, че производителността е силно повлияна от архитектурата. За втория пример нека вземем видеокартите GeForce 6600 GT и GeForce 6800 GT. Графичният процесор 6600 GT работи на 500 MHz, но 6800 GT работи само на 350 MHz. Сега нека вземем предвид, че 6800 GT използва 16 пикселни конвейера, докато 6600 GT използва само осем. Следователно, 6800 GT с 16 конвейера на 350 MHz ще даде приблизително същата производителност като процесор с осем конвейера и двойна тактова честота (700 MHz). С това казано, тактовата честота може лесно да се използва за сравняване на производителността.

Локална видео памет

Паметта на видеокартата значително влияе върху производителността. Но различните параметри на паметта имат различен ефект.

Размер на видео паметта

Количеството видео памет вероятно може да се нарече най-надценения параметър на видеокарта. Неопитните потребители често използват капацитета на видеопаметта, за да сравняват различни карти една с друга, но в действителност капацитетът има малък ефект върху производителността в сравнение с параметри като честота на шината на паметта и интерфейс (ширина на шината).

В повечето случаи карта със 128 MB видео памет ще работи почти същото като карта с 256 MB. Разбира се, има ситуации, при които повече памет ще подобри производителността, но имайте предвид, че повече памет няма автоматично да доведе до по-високи скорости на игрите.

Там, където обемът може да бъде полезен, са игрите с текстури с висока разделителна способност. Разработчиците на игри предоставят няколко комплекта текстури за играта. И колкото повече памет има на видеокартата, толкова по-висока резолюция могат да имат заредените текстури. Текстурите с висока разделителна способност осигуряват по-голяма яснота и детайлност в играта. Следователно е доста разумно да вземете карта с голямо количество памет, ако всички други критерии отговарят. Нека ви напомним още веднъж, че ширината на шината на паметта и нейната честота оказват много по-силно влияние върху производителността, отколкото количеството физическа памет на картата.

Ширина на шината на паметта

Ширината на шината на паметта е един от най-важните аспекти на производителността на паметта. Модерните шини варират от 64 до 256 бита, а в някои случаи дори 512 бита. Колкото по-широка е шината на паметта, толкова повече информация може да прехвърли за един такт. И това пряко влияе върху производителността. Например, ако вземем две шини с еднакви честоти, тогава теоретично 128-битова шина ще прехвърли два пъти повече данни за тактов цикъл от 64-битова шина. А 256-битовата шина е двойно по-голяма.

По-висок пропускателна способностшина (изразена в битове или байтове за секунда, 1 байт = 8 бита) дава по-висока производителност на паметта. Ето защо шината на паметта е много по-важна от нейния размер. При еднакви честоти 64-битовата шина на паметта работи със скорост само 25% от 256-битовата!

Да вземем следния пример. Видеокарта със 128 MB видео памет, но с 256-битова шина дава много по-висока производителност на паметта от 512 MB модел с 64-битова шина. Важно е да се отбележи, че за някои карти от линията ATi X1x00 производителите посочват спецификациите на вътрешната шина на паметта, но ние се интересуваме от параметрите на външната шина. Например, X1600 има вътрешна пръстеновидна шина, която е широка 256 бита, но външна шина е само 128 бита широка. И в действителност шината на паметта работи при 128-битова производителност.

Видове памет

Паметта може да бъде разделена на две основни категории: SDR (единичен трансфер на данни) и DDR (двоен трансфер на данни), при които данните се прехвърлят два пъти по-бързо на такт. Днес SDR технологията с едно предаване е остаряла. Тъй като DDR паметта прехвърля данни два пъти по-бързо от SDR, важно е да запомните, че видеокартите с DDR памет често показват двойна честота, а не физическата честота. Например, ако DDR паметта е посочена на 1000 MHz, тогава това е ефективната честота, при която обикновената SDR памет трябва да работи, за да даде същата пропускателна способност. Но всъщност физическата честота е 500 MHz.

Поради тази причина мнозина са изненадани, когато честотата от 1200 MHz DDR е посочена за паметта на тяхната видеокарта, а помощните програми съобщават за 600 MHz. Така че ще трябва да свикнете. Паметта DDR2 и GDDR3/GDDR4 работи на същия принцип, тоест с двоен трансфер на данни. Разликата между DDR, DDR2, GDDR3 и GDDR4 памет е в производствената технология и някои детайли. DDR2 може да работи на по-високи честоти от DDR паметта, а DDR3 може да работи на дори по-високи честоти от DDR2.

Честота на шината на паметта

Подобно на процесора, паметта (или по-точно шината на паметта) работи на определени тактови честоти, измерени в мегахерци. Тук увеличаването на тактовите честоти пряко влияе върху производителността на паметта. А честотата на шината на паметта е един от параметрите, който се използва за сравнение на производителността на видеокартите. Например, ако всички други характеристики (широчина на шината на паметта и т.н.) са еднакви, тогава е съвсем логично да се каже, че видеокарта с памет 700 MHz е по-бърза от тази с 500 MHz памет.

Отново, тактовата честота не е всичко. 700 MHz памет с 64-битова шина ще бъде по-бавна от 400 MHz памет със 128-битова шина. Производителността на 400 MHz памет на 128-битова шина е приблизително еквивалентна на 800 MHz памет на 64-битова шина. Трябва също да запомните, че честотите на GPU и паметта са напълно различни параметри и обикновено се различават.

Интерфейс на видеокартата

Всички данни, прехвърляни между видеокартата и процесора, преминават през интерфейса на видеокартата. Днес за видеокартите се използват три вида интерфейси: PCI, AGP и PCI Express. Те се различават по честотна лента и други характеристики. Ясно е, че колкото по-висока е пропускателната способност, толкова по-висока е скоростта на обмен. Но само най-модерните карти могат да използват висока честотна лента и дори тогава само частично. В един момент скоростта на интерфейса престана да бъде пречка; днес тя е просто достатъчна.

Най-бавната шина, за която са произведени видеокарти, е PCI (Peripheral Components Interconnect). Без да навлизаме в историята, разбира се. PCI наистина влоши производителността на видеокартите, така че те преминаха към интерфейса AGP (Accelerated Graphics Port). Но дори спецификациите AGP 1.0 и 2x ограничават производителността. Когато стандартът увеличи скоростите до нива AGP 4x, започнахме да се доближаваме до практическата граница на честотната лента, която видеокартите могат да поемат. Спецификацията AGP 8x отново удвои пропускателната способност в сравнение с AGP 4x (2,16 GB/s), но нямаше забележимо увеличение графична производителностоще не сме го получили.

Най-новата и най-бърза шина е PCI Express. Нов графични картиОбикновено те използват интерфейса PCI Express x16, който комбинира 16 PCI Express ленти, давайки обща пропускателна способност от 4 GB/s (в една посока). Това е два пъти повече от пропускателната способност на AGP 8x. Шината PCI Express осигурява споменатата честотна лента и в двете посоки (пренос на данни към и от видеокартата). Но скоростта на стандарта AGP 8x вече беше достатъчна, така че все още не сме срещали ситуация, при която преминаването към PCI Express е дало увеличение на производителността в сравнение с AGP 8x (ако другите хардуерни параметри са същите). Например AGP версията на GeForce 6800 Ultra ще работи идентично с 6800 Ultra за PCI Express.

Днес е най-добре да закупите карта с PCI Express интерфейс, тя ще остане на пазара още няколко години. Най-мощните карти вече не се предлагат с AGP 8x интерфейс и PCI решения Express, като правило, е по-лесно да се намери от аналозите на AGP и те са по-евтини.

Решения на множество видео карти

Използването на няколко видеокарти за увеличаване на графичната производителност не е нова идея. В първите дни на 3D графиката, 3dfx навлезе на пазара с две графични карти, работещи паралелно. Но с изчезването на 3dfx, технологията на множество потребителски видеокарти, работещи заедно, беше оставена в забрава, въпреки че ATI пусна подобни системиза професионални симулатори след пускането на Radeon 9700. Преди няколко години технологията се завърна на пазара: с появата на решения nVidia SLIи малко по-късно, ATi Crossfire .

Използването на няколко графични карти заедно осигурява достатъчно производителност за стартиране на играта при висококачествени настройки с висока разделителна способност. Но изборът на едно или друго решение не е толкова лесен.

Нека започнем с факта, че решенията, базирани на множество видеокарти, изискват голямо количество енергия, така че захранването трябва да е достатъчно мощно. Цялата тази топлина ще трябва да бъде премахната от видеокартата, така че трябва да обърнете внимание на корпуса на компютъра и охлаждането, така че системата да не прегрява.

Освен това не забравяйте, че SLI/CrossFire изисква подходяща дънна платка (за една или друга технология), която обикновено струва повече от стандартните модели. Конфигурацията nVidia SLI ще работи само на определени платки nForce4, а картите ATi CrossFire ще работят само на дънни платки с чипсет CrossFire или някои Модели на Intel. За да усложнят нещата, някои конфигурации на CrossFire изискват една от картите да е специална: CrossFire Edition. След пускането на CrossFire за някои модели ATI видео картипозволява да се включва технология за сътрудничество PCI шина Express, а с пускането на нови версии на драйвери броят на възможните комбинации се увеличава. Но все пак хардуерният CrossFire със съответната карта CrossFire Edition осигурява по-висока производителност. Но картите CrossFire Edition също са по-скъпи от обикновените модели. В момента можете да активирате софтуерен режим CrossFire (без карта CrossFire Edition) на графични карти Radeon X1300, X1600 и X1800 GTO.

Има и други фактори, които трябва да се вземат предвид. Въпреки че две графични карти, работещи заедно, осигуряват увеличение на производителността, то далеч не е двойно. Но ще платите два пъти повече пари. Най-често увеличението на производителността е 20-60%. А в някои случаи, поради допълнителни изчислителни разходи за съпоставяне, изобщо няма увеличение. Поради тази причина е малко вероятно конфигурациите с няколко карти да си струват с по-евтини модели, тъй като по-скъпата графична карта обикновено винаги ще превъзхожда няколко по-евтини карти. Като цяло, за повечето потребители закупуването на SLI/CrossFire решение няма смисъл. Но ако искате да активирате всички опции за подобряване на качеството или да играете при екстремни разделителни способности, например 2560x1600, когато трябва да изчислите повече от 4 милиона пиксела на кадър, тогава не можете да правите без две или четири сдвоени видеокарти.

Визуални функции

В допълнение към чисто хардуерните спецификации, различните поколения и модели GPU могат да се различават в набора от функции. Например, често се казва, че картите от поколение ATi Radeon X800 XT са съвместими с Shader Model 2.0b (SM), докато nVidia GeForce 6800 Ultra е съвместима с SM 3.0, въпреки че техните хардуерни спецификации са близки една до друга (16 конвейера ). Поради това много потребители правят избор в полза на едно или друго решение, без дори да знаят какво означава разликата. Е, нека поговорим за визуалните функции и тяхното значение за крайния потребител.

Тези имена най-често се използват в спорове, но малко хора знаят какво всъщност означават. За да разберем, нека започнем с историята на графичните API. DirectX и OpenGL са графични API, тоест интерфейси за програмиране на приложения - стандарти с отворен код, достъпни за всеки.

Преди появата на графичните API, всеки производител на GPU използва свой собствен механизъм за комуникация с игри. Разработчиците трябваше да напишат отделен код за всеки GPU, който искаха да поддържат. Много скъп и неефективен подход. За да се реши този проблем, бяха разработени API за 3D графики, така че разработчиците да пишат код за конкретен API, а не за конкретна видеокарта. След това проблемите със съвместимостта паднаха върху плещите на производителите на видеокарти, които трябваше да гарантират, че драйверите ще бъдат съвместими с API.

Единствената трудност остава, че днес се използват два различни API, а именно Microsoft DirectX и OpenGL, където GL означава Графична библиотека. Тъй като DirectX API е по-популярен в игрите днес, ще се съсредоточим върху него. И този стандарт имаше по-силно влияние върху развитието на игрите.

DirectX е създаване на Microsoft. Всъщност DirectX включва няколко API, само един от които се използва за 3D графики. DirectX включва API за звук, музика, входни устройства и др. Direct3D API отговаря за 3D графиките в DirectX. Когато говорят за видеокарти, това имат предвид, така че в това отношение понятията DirectX и Direct3D са взаимозаменяеми.

DirectX се актуализира периодично с напредването на графичните технологии и разработчиците на игри прилагат нови техники за програмиране на игри. Тъй като популярността на DirectX бързо нарасна, производителите на графични процесори започнаха да адаптират нови версии на продуктите, за да приспособят възможностите на DirectX. Поради тази причина видеокартите често са обвързани с хардуерна поддръжка за едно или друго поколение DirectX (DirectX 8, 9.0 или 9.0c).

За да се усложнят нещата, части от Direct3D API могат да се променят с течение на времето, без да се променят DirectX поколенията. Например, спецификацията DirectX 9.0 определя поддръжка за Pixel Shader 2.0. Но актуализацията на DirectX 9.0c включва Pixel Shader 3.0. Така че, въпреки че картите са от клас DirectX 9, те може да поддържат различни набори от функции. Например Radeon 9700 поддържа Shader Model 2.0, а Radeon X1800 поддържа Shader Model 3.0, въпреки че и двете карти могат да бъдат класифицирани като DirectX 9 поколение.

Не забравяйте, че когато създавате нови игри, разработчиците вземат предвид собствениците на стари машини и видеокарти, тъй като ако пренебрегнете този сегмент от потребители, нивото на продажбите ще бъде по-ниско. Поради тази причина в игрите са вградени множество кодови пътища. Игра от клас DirectX 9 вероятно има DirectX 8 път и дори DirectX 7 път за съвместимост. Обикновено, ако е избран старият път, тогава някои от виртуалните ефекти, които присъстват на новите видеокарти, изчезват от играта. Но поне можете да играете дори на стар хардуер.

Много нови игри изискват инсталиране на най-новата версия на DirectX, дори ако видеокартата е от предишно поколение. Това означава, че нова игра, която ще използва DirectX 8 пътя, все още ще изисква инсталиране на най-новата версия на DirectX 9 за видеокарта от клас DirectX 8.

Какви са разликите между различни версии Direct3D API в DirectX? Ранни версии DirectX - 3, 5, 6 и 7 - бяха сравнително прости по отношение на възможностите на Direct3D API. Разработчиците можеха да избират визуални ефектиот списъка и след това проверете работата им в играта. Следващата голяма стъпка в графичното програмиране беше DirectX 8. Той въведе възможността за програмиране на видеокартата с помощта на шейдъри, така че разработчиците за първи път имаха свободата да програмират ефектите по начина, по който се нуждаят. DirectX 8 поддържани версии на Pixel Shader 1.0 до 1.3 и Vertex Shader 1.0. DirectX 8.1, актуализирана версия на DirectX 8, получи Pixel Shader 1.4 и Vertex Shader 1.1.

В DirectX 9 можете да създавате още по-сложни шейдър програми. DirectX 9 поддържа Pixel Shader 2.0 и Vertex Shader 2.0. DirectX 9c, актуализирана версия на DirectX 9, включваше спецификацията Pixel Shader 3.0.

DirectX 10, предстоящата версия на API, ще придружава новата Windows версия Vista. Не можете да инсталирате DirectX 10 на Windows XP.

HDR означава "висок динамичен обхват". Игра с HDR осветление може да произведе много по-реалистично изображение от игра без него и не всички видеокарти поддържат HDR осветление.

Преди появата на графичните карти DirectX 9 графичните процесори бяха силно ограничени от точността на техните изчисления за осветление. Досега осветлението можеше да се изчислява само с 256 (8 бита) вътрешни нива.

Когато се появиха видеокартите DirectX 9, те успяха да произведат осветление с висока прецизност - цели 24 бита или 16,7 милиона нива.

С 16,7 милиона нива и следващата стъпка в производителността на видеокартите DirectX 9/Shader Model 2.0, HDR осветлението стана възможно на компютри. Това е доста сложна технология и трябва да я гледате в динамика. С прости думи, HDR осветлението увеличава контраста (тъмните нюанси изглеждат по-тъмни, светлите нюанси изглеждат по-светли), като същевременно увеличава количеството детайли на осветлението в тъмните и светлите зони. Играта с HDR осветление изглежда по-жива и реалистична, отколкото без него.

Графичните процесори, съвместими с най-новата спецификация Pixel Shader 3.0, позволяват по-високи 32-битови прецизни изчисления на осветлението и смесване с плаваща запетая. Така видеокартите от клас SM 3.0 могат да поддържат специален метод HDR осветление OpenEXR, специално проектиран за филмовата индустрия.

Някои игри, които поддържат само OpenEXR HDR осветление, няма да работят с HDR осветление на графични карти Shader Model 2.0. Въпреки това, игри, които не разчитат на метода OpenEXR, ще работят на всяка DirectX 9 графична карта. Например, Oblivion използва метода OpenEXR HDR и позволява HDR осветление само на най-новите графични карти, които поддържат спецификацията Shader Model 3.0. Например nVidia GeForce 6800 или ATi Radeon X1800. Игрите, които използват 3D енджин на Half-Life 2, включително Counter-Strike: Source и предстоящата Half-Life 2: Aftermath, позволяват HDR рендиране да бъде активирано на по-стари DirectX 9 графични карти, които поддържат само Pixel Shader 2.0. Примерите включват линията GeForce 5 или ATi Radeon 9500.

И накрая, имайте предвид, че всички форми на HDR рендиране изискват сериозна процесорна мощност и могат да поставят на колене дори най-мощните графични процесори. Ако искате да играете най-новите игриС HDR осветление не можете без високопроизводителна графика.

Изглаждането на цял екран (съкратено AA) ви позволява да премахнете характерните „стълби“ на границите на полигоните. Но трябва да се има предвид, че изглаждането на цял екран консумира много изчислителни ресурси, което води до спад в честотата на кадрите.

Антиалиасингът зависи много от производителността на видео паметта, така че високоскоростна видеокарта с бърза памет ще може да изчисли антиалиасинг на цял екран с по-малко въздействие върху производителността, отколкото евтина видеокарта. Antialiasing може да се активира в различни режими. Например 4x антиалиасинг ще създаде по-добро изображение от 2x антиалиасинг, но ще бъде голям удар за производителността. Докато 2x antialiasing удвоява хоризонталната и вертикалната разделителна способност, 4x режимът я учетворява.

Текстурите се прилагат към всички 3D обекти в играта и колкото по-голям е ъгълът на показаната повърхност, толкова по-изкривена ще изглежда текстурата. За да елиминират този ефект, графичните процесори използват филтриране на текстури.

Първият метод на филтриране се нарича билинеен и създава характерни ивици, които не са много приятни за окото. Ситуацията се подобри с въвеждането на трилинейно филтриране. И двата варианта работят на модерни видеокарти без практически никакво увреждане на производителността.

Днес най-много по най-добрия начинФилтрирането на текстурата е анизотропно филтриране (AF). Подобно на антиалиасинг на цял екран, анизотропното филтриране може да се активира на различни нива. Например 8x AF дава повече високо качествофилтриране от 4x AF. Подобно на антиалиасинг на цял екран, анизотропното филтриране изисква определено количество процесорна мощност, която се увеличава с увеличаване на нивото на AF.

Всички 3D игри са създадени с оглед на специфични спецификации и едно от тези изисквания определя текстурната памет, от която ще се нуждае играта. Всички необходими текстури трябва да се поберат в паметта на видеокартата по време на играта, в противен случай производителността ще падне значително, тъй като достъпът до текстурата в RAM причинява значително забавяне, да не говорим за файла за пейджинг на твърдия диск. Следователно, ако разработчикът на игри разчита на 128 MB видео памет като минимално изискване, тогава наборът от активни текстури не трябва да надвишава 128 MB в нито един момент.

Съвременните игри имат няколко комплекта текстури, така че играта ще работи без проблеми на по-стари видео карти с по-малко видео памет, както и на нови карти с повече видео памет. Например една игра може да съдържа три комплекта текстури: за 128 MB, 256 MB и 512 MB. Днес има много малко игри, които поддържат 512 MB видеопамет, но все пак те са най-обективната причина да закупите видеокарта с такъв обем памет. Докато увеличаването на паметта има малко или никакво влияние върху производителността, ще се възползвате от подобрено визуално качество, ако играта поддържа подходящия набор от текстури.

Архитектура на GPU: Характеристики

Реалистичността на 3D графиката до голяма степен зависи от производителността на видеокартата. Колкото повече пикселни шейдърни блокове съдържа процесорът и колкото по-висока е честотата, толкова повече ефекти могат да бъдат приложени към 3D сцената, за да се подобри нейното визуално възприятие.

GPU съдържа много различни функционални блокове. По броя на някои компоненти можете да прецените колко мощен е графичният процесор. Преди да продължим, нека прегледаме най-важните функционални блокове.

Vertex процесори (върхови шейдъри)

Подобно на пикселните шейдъри, върховите процесори изпълняват шейдър код, който докосва върховете. Тъй като по-големият бюджет за върхове позволява създаването на по-сложни 3D обекти, производителността на процесорите за върхове е много важна в 3D сцени със сложни или голям брой обекти. Въпреки това модулите за върхови шейдъри все още нямат толкова очевидно въздействие върху производителността като пикселните процесори.

Пиксел процесори (пикселни шейдъри)

Пикселният процесор е компонент на графичен чип, предназначен за обработка на програми за пикселни шейдъри. Тези процесори извършват изчисления, които засягат само пиксели. Тъй като пикселите съдържат информация за цвета, пикселните шейдъри ви позволяват да постигнете впечатляващи графични ефекти. Например, повечето от водните ефекти, които виждате в игрите, са създадени с помощта на пикселни шейдъри. Обикновено броят на пикселните процесори се използва за сравняване на пикселната производителност на видеокартите. Ако една карта има осем пикселни шейдърни единици, а друга има 16 единици, тогава е логично да се предположи, че видеокарта с 16 единици ще бъде по-бърза при обработката на сложни пикселни шейдърни програми. Тактовата честота също трябва да се вземе предвид, но днес удвояването на броя на пикселните процесори е по-енергийно ефективно от удвояването на честотата на графичния чип.

Унифицирани шейдъри

Унифицираните шейдъри все още не са пристигнали в света на компютрите, но предстоящият стандарт DirectX 10 е базиран на подобна архитектура. Това означава, че структурата на кода на програмите за върхове, геометрия и пиксели ще бъде същата, въпреки че шейдърите ще изпълняват различна работа. Новата спецификация може да се види в Xbox 360, където GPU е специално проектиран от ATi за Microsoft. Ще бъде много интересно да видим какъв потенциал носи новият DirectX 10.

Единици за картографиране на текстури (TMU)

Текстурите трябва да бъдат избрани и филтрирани. Тази работа се извършва от единици за картографиране на текстури, които работят заедно с единици за пикселни и върхови шейдъри. Работата на TMU е да прилага текстурни операции към пиксели. Броят на текстурните единици в GPU често се използва за сравняване на текстурната производителност на видеокартите. Не е неразумно да се предположи, че графична карта с повече TMU ще даде по-добра текстурна производителност.

Растерни операторски единици (ROP)

Растерните процесори са отговорни за записването на пикселни данни в паметта. Скоростта, с която се извършва тази операция, е скоростта на запълване. В първите дни на 3D ускорителите ROP и скоростта на запълване бяха много важни характеристики на видеокартите. Днес работата с ROP все още е важна, но производителността на видеокартата вече не е ограничена от тези блокове, както беше преди. Следователно производителността (и броят) на ROPs рядко се използва за оценка на скоростта на видеокарта.

Конвейери

Тръбопроводите се използват за описание на архитектурата на видеокартите и дават много ясна представа за производителността на GPU.

Конвейерът не може да се счита за строг технически термин. GPU използва различни тръбопроводи, които изпълняват различни функции. В исторически план конвейерът означава пикселен процесор, който е свързан към неговия блок за картографиране на текстури (TMU). Например видеокартата Radeon 9700 използва осем пикселни процесора, всеки от които е свързан към собствен TMU, така че се счита, че картата има осем конвейера.

Но съвременните процесори са много трудни за описание с броя на тръбопроводите. В сравнение с предишните проекти, новите процесори използват модулна, фрагментирана структура. ATi може да се счита за новатор в тази област, който с линията видеокарти X1000 премина към модулна структура, което направи възможно постигането на подобрения в производителността чрез вътрешна оптимизация. Някои CPU блокове се използват повече от други и за да подобри производителността на GPU, ATi се опита да намери компромис между броя на необходимите блокове и площта на матрицата (която не може да бъде увеличена много). В тази архитектура терминът "пикселна тръба" вече е загубил значението си, тъй като пикселните процесори вече не са свързани към собствените си TMU. Например, графичният процесор ATi Radeon X1600 има 12 единици за пикселни шейдъри и само четири единици за картографиране на текстури TMU. Следователно не може да се каже, че архитектурата на този процесор има 12 пикселни конвейера, както не може да се каже, че има само четири от тях. Въпреки това, по традиция, пикселните тръбопроводи все още се споменават.

Като се вземат предвид горните предположения, броят на пикселните тръбопроводи в GPU често се използва за сравняване на видеокарти (с изключение на линията ATi X1x00). Например, ако вземете видеокарти с 24 и 16 тръбопровода, тогава е напълно разумно да се предположи, че картата с 24 тръбопровода ще бъде по-бърза.


СЪДЪРЖАНИЕ

Съвременните графични процесори съдържат много функционални блокове, чийто брой и характеристики определят крайната скорост на изобразяване, което влияе върху комфорта на играта. Въз основа на сравнителния брой на тези блокове в различни видео чипове, можете грубо да прецените колко бърз е даден GPU. Видео чиповете имат доста характеристики, в този раздел ще разгледаме само най-важните от тях.

Тактова честота на видеочипа

Работната честота на GPU обикновено се измерва в мегахерци, т.е. милиони цикли в секунда. Тази характеристика пряко влияе върху производителността на видео чипа - колкото по-висока е, толкова по-голям е обемът Работа на GPUможе да се изпълни за единица време, да обработи по-голям брой върхове и пиксели. Пример от реалния живот: честотата на видео чипа, инсталиран на платката Radeon HD 6670, е 840 MHz, а точно същият чип в модела Radeon HD 6570 работи на честота 650 MHz. Съответно всички основни характеристики на ефективността ще се различават. Но не само работната честота на чипа определя производителността; неговата скорост е силно повлияна от самата графична архитектура: дизайнът и броят на изпълнителните модули, техните характеристики и т.н.

В някои случаи тактовата честота на отделните GPU блокове се различава от работната честота на останалата част от чипа. Тоест различните части на графичния процесор работят на различни честоти и това беше направено, за да се увеличи ефективността, тъй като някои блокове могат да работят на по-високи честоти, докато други не. Повечето графични процесори са оборудвани с такива графични процесори. Видеокарти GeForceот NVIDIA. Като пресен пример, нека да разгледаме видео чипа в модела GTX 580, повечето от които работят на честота от 772 MHz, а универсалните изчислителни блокове на чипа са с удвоена честота - 1544 MHz.

Скорост на запълване

Степента на запълване показва колко бързо видеочипът може да рисува пиксели. Има два вида скорост на запълване: скорост на запълване на пиксели и скорост на запълване на текстура. Скоростта на запълване на пикселите показва скоростта на рисуване на пиксели на екрана и зависи от работната честота и броя на ROP единиците (операционни единици за растеризиране и смесване), а скоростта на запълване на текстурата е скоростта на вземане на проби от текстурни данни, която зависи от работната честота и броя на текстурните единици.

Например пиковата скорост на запълване на пикселите на GeForce GTX 560 Ti е 822 (честота на чип) × 32 (брой ROP единици) = 26304 мегапиксела в секунда, а скоростта на запълване на текстурата е 822 × 64 (брой текстуриращи единици) = 52608 мегатексела /с. В опростен вид ситуацията е следната - колкото по-голямо е първото число, толкова по-бързо видеокартата може да начертае готови пиксели, а колкото по-голямо е второто, толкова по-бързо се семплират данните за текстурата.

Въпреки че значението на "чистия" fillrate в напоследъкзначително намаля, отстъпвайки място на скоростта на изчисленията, тези параметри все още остават много важни, особено за игри с проста геометрия и относително прости изчисления на пиксели и върхове. Така че и двата параметъра остават важни за съвременните игри, но трябва да бъдат балансирани. Следователно броят на ROP единиците в съвременните видеочипове обикновено е по-малък от броя на текстурните единици.

Брой изчислителни (шейдърни) единици или процесори

Може би сега тези блокове са основните части на видео чипа. Те изпълняват специални програми, известни като шейдъри. Освен това, ако по-ранните пикселни шейдъри изпълняваха пикселни шейдърни блокове, а върховите шейдъри изпълняваха върхови блокове, тогава за известно време графичните архитектури бяха унифицирани и тези универсални изчислителни единици започнаха да се справят с различни изчисления: върхови, пикселни, геометрични и дори универсални изчисления.

За първи път унифицираната архитектура е използвана във видео чипа на игрова конзола Microsoft Xbox 360, този GPU е разработен от ATI (по-късно придобит от AMD). И във видео чипове за персонални компютриунифицирани шейдърни модули се появиха в платката на NVIDIA GeForce 8800 и оттогава всички нови видео чипове са базирани на унифицирана архитектура, която има универсален код за различни шейдърни програми (върхове, пиксели, геометрия и т.н.) и съответните унифицирани процесори. може да изпълни всяка програма.

Въз основа на броя на изчислителните единици и тяхната честота можете да сравните математическата производителност на различните видеокарти. Повечето игри сега са ограничени от производителността на пикселните шейдъри, така че броят на тези блокове е много важен. Например, ако един модел видеокарта е базиран на GPU с 384 изчислителни процесора в състава си, а друг от същата линия има GPU със 192 изчислителни единици, тогава еднаква честотавторият ще бъде два пъти по-бавен за обработка на всеки тип шейдър и като цяло ще бъде също толкова продуктивен.

Въпреки че е невъзможно да се направят недвусмислени заключения за производителността само въз основа на броя на изчислителните единици, е необходимо да се вземе предвид тактовата честота и различната архитектура на единиците различни поколенияи производители на чипове. Само въз основа на тези числа можете да сравнявате чипове само в една и съща линия на един производител: AMD или NVIDIA. В други случаи трябва да обърнете внимание на тестовете за производителност в игрите или приложенията, които ви интересуват.

Текстуриращи единици (TMU)

Тези графични процесори работят заедно с изчислителни процесори; избират и филтрират текстура и други данни, необходими за изграждане на сцена и изчисления с общо предназначение. Броят на текстурните единици във видеочипа определя производителността на текстурата – тоест скоростта на извличане на текселите от текстурите.

Въпреки че напоследък се набляга повече на математическите изчисления и някои текстури се заменят с процедурни, натоварването върху TMU блоковете все още е доста високо, тъй като в допълнение към основните текстури трябва да се правят селекции и от нормални карти и карти на изместване, както и буфери за целево изобразяване на изобразяване извън екрана.

Като се има предвид акцентът на много игри, включително производителността на текстуриращите единици, можем да кажем, че броят на TMU единиците и съответната висока производителност на текстурите също са един от най-важните параметри за видеочиповете. Този параметър оказва особено влияние върху скоростта на изобразяване на изображението при използване на анизотропно филтриране, което изисква допълнителни текстурни проби, както и при сложни алгоритми за меки сенки и новомодни алгоритми като Screen Space Ambient Occlusion.

Операционни единици за растеризация (ROPs)

Блоковете за растеризация извършват операциите по записване на пиксели, изчислени от видеокартата, в буфери и операциите по тяхното смесване (смесване). Както отбелязахме по-горе, производителността на ROP блоковете влияе върху скоростта на запълване и това е една от основните характеристики на видеокартите на всички времена. И въпреки че важността му също намаля донякъде напоследък, все още има случаи, в които производителността на приложението зависи от скоростта и броя на ROP блоковете. Най-често това се дължи на активното използване на филтри за последваща обработка и анти-алиасинг, активирани при високи настройки на играта.

Нека отбележим още веднъж, че съвременните видеочипове не могат да бъдат оценени само по броя на различните блокове и тяхната честота. Всяка серия GPU използва нова архитектура, в която изпълнителните единици са много различни от старите и съотношението на броя на различните единици може да се различава. По този начин устройствата AMD ROP в някои решения могат да извършват повече работа на такт от устройствата в решенията на NVIDIA и обратно. Същото важи и за възможностите на текстурните единици на TMU - те са различни в различните поколения GPU различни производителии това трябва да се има предвид при сравнения.

Геометрични блокове

Доскоро броят на единиците за обработка на геометрията не беше особено важен. Един блок на GPU беше достатъчен за повечето задачи, тъй като геометрията в игрите беше доста проста и основният фокус на производителността беше математическите изчисления. Важност паралелна обработкагеометрията и броят на съответните блокове се увеличиха рязко с появата на поддръжката на геометрична теселация в DirectX 11. NVIDIA беше първата, която паралелизира обработката на геометрични данни, когато няколко съответни блока се появиха в нейните чипове от семейството GF1xx. След това AMD пусна подобно решение (само в топ решенията на линията Radeon HD 6700, базирани на чипове Cayman).

В този материал няма да навлизаме в подробности; те могат да бъдат прочетени в основните материали на нашия уебсайт, посветени на графичните процесори, съвместими с DirectX 11. Това, което е важно за нас тук, е, че броят на единиците за обработка на геометрията има огромно влияние върху цялостната производителност в най-новите игри, които използват теселация, като Metro 2033, HAWX 2 и Crysis 2 (с най-новите пачове). И когато избирате модерна видеокарта за игри, е много важно да обърнете внимание на геометричната производителност.

Размер на видео паметта

Собствената памет се използва от видеочипове за съхраняване на необходимите данни: текстури, върхове, буферни данни и т.н. Изглежда, че колкото повече има, толкова по-добре. Но това не е толкова просто; оценката на мощността на видеокартата въз основа на количеството видеопамет е най-често срещаната грешка! Неопитните потребители най-често надценяват стойността на видео паметта и все пак я използват за сравняване на различни модели видеокарти. Това е разбираемо - този параметър е един от първите, посочени в списъците с характеристики на готовите системи, а също така е написан с голям шрифт върху кутиите на видеокартите. Следователно на неопитен купувач изглежда, че тъй като има два пъти повече памет, тогава скоростта на такова решение трябва да бъде два пъти по-висока. Реалността се различава от този мит по това, че паметта може да бъде различни видовеи характеристики, а растежът на производителността нараства само до определен обем, а след достигането му просто спира.

И така, във всяка игра и с определени настройки и игрови сцени има определено количество видео памет, което е достатъчно за всички данни. И дори да поставите 4 GB видео памет там, няма да има причина да ускорява изобразяването, скоростта ще бъде ограничена от изпълнителните модули, обсъдени по-горе, и просто ще има достатъчно памет. Ето защо в много случаи видеокарта с 1,5 GB видео памет работи със същата скорост като карта с 3 GB (при равни други условия).

Има ситуации, при които повече памет води до видимо увеличение на производителността - това са много взискателни игри, особено при свръхвисоки резолюции и при максимални настройки за качество. Но такива случаи не винаги се случват и количеството памет трябва да се вземе предвид, като не се забравя, че производителността просто няма да се увеличи над определено количество. Чиповете с памет имат и по-важни параметри, като ширината на шината на паметта и нейната работна честота. Тази тема е толкова обширна, че ще разгледаме по-подробно избора на обем видео памет в шестата част на нашия материал.

Ширина на шината на паметта

Ширината на шината на паметта е най-важната характеристика, влияеща върху честотната лента на паметта (MBB). По-голямата ширина позволява да се прехвърля повече информация от видео паметта към GPU и обратно за единица време, което в повечето случаи има положителен ефект върху производителността. Теоретично 256-битова шина може да прехвърли два пъти повече данни за такт от 128-битова шина. На практика разликата в скоростта на рендиране, въпреки че не достига два пъти, е много близка до тази в много случаи с акцент върху честотната лента на видео паметта.

Съвременните видеокарти за игри използват различни ширини на шината: от 64 до 384 бита (преди това имаше чипове с 512-битова шина), в зависимост от ценовия диапазон и времето на пускане специфичен модел GPU За най-евтините видеокарти от нисък клас най-често се използват 64 и по-рядко 128 бита, за средно ниво от 128 до 256 бита, а видеокартите от горния ценови клас използват шини с ширина от 256 до 384 бита. Ширината на шината вече не може да расте само поради физически ограничения - размерът на графичния процесор е недостатъчен, за да поеме повече от 512-битова шина, а това е твърде скъпо. Следователно честотната лента на паметта сега се увеличава чрез използване на нови типове памет (вижте по-долу).

Честота на видео паметта

Друг параметър, който влияе върху честотната лента на паметта, е нейната тактова честота. А увеличаването на честотната лента често влияе директно върху производителността на видеокартата в 3D приложения. Честотата на шината на паметта на съвременните видеокарти варира от 533 (1066, като се вземе предвид удвояването) MHz до 1375 (5500, като се вземе предвид учетворяването) MHz, тоест може да се различава повече от пет пъти! И тъй като честотната лента зависи както от честотата на паметта, така и от ширината на нейната шина, паметта с 256-битова шина, работеща на честота 800 (3200) MHz, ще има по-голяма честотна лента в сравнение с паметта, работеща на 1000 (4000) MHz с 128 -битова шина.

Особено внимание трябва да се обърне на параметрите на ширината на шината на паметта, нейния тип и работна честота при закупуване на сравнително евтини видеокарти, много от които имат само 128-битови или дори 64-битови интерфейси, което има изключително отрицателно въздействие върху тяхната производителност . По принцип не препоръчваме закупуване на видеокарта, използваща 64-битова шина за видео памет за компютър за игри. Препоръчително е да се даде предпочитание на поне средно ниво с поне 128- или 192-битова шина.

Видове памет

Съвременните видеокарти са оборудвани с няколко различни типа памет. Вече няма да намерите никъде стара едноскоростна SDR памет, но съвременните видове DDR и GDDR памет имат значително различни характеристики. Различните видове DDR и GDDR ви позволяват да прехвърляте два или четири пъти повече данни при една и съща тактова честота за единица време и следователно числото на работната честота често се удвоява или учетворява, умножено по 2 или 4. Така че, ако честотата е посочена за DDR памет 1400 MHz, тогава тази памет работи на физическа честота от 700 MHz, но те показват така наречената „ефективна“ честота, тоест тази, на която трябва да работи SDR паметта, за да осигури същата честотна лента. Същото нещо и с GDDR5, но честотата дори е четворна.

Основното предимство на новите типове памет е способността да работят на по-високи тактови честоти и следователно да увеличават честотната лента в сравнение с предишните технологии. Това се постига за сметка на повишени латентности, които обаче не са толкова важни за видеокартите. Първата платка, използваща DDR2 памет, беше NVIDIA GeForce FX 5800 Ultra. Оттогава технологията на графичната памет напредна значително и беше разработен стандартът GDDR3, който е близък до спецификациите на DDR2, с някои промени специално за видеокартите.

GDDR3 е памет, специално проектирана за видеокарти, със същите технологии като DDR2, но с подобрени характеристики на консумация и разсейване на топлината, което направи възможно създаването на чипове, които работят на по-високи тактови честоти. Въпреки факта, че стандартът е разработен от ATI, първата видеокарта, която го използва, беше втората модификация на NVIDIA GeForce FX 5700 Ultra, а следващата беше GeForce 6800 Ultra.

GDDR4 е по-нататъшно развитие на „графичната“ памет, работеща почти два пъти по-бързо от GDDR3. Основните разлики между GDDR4 и GDDR3, които са съществени за потребителите, отново са увеличените работни честоти и намалената консумация на енергия. Технически, GDDR4 паметта не се различава много от GDDR3; тя е по-нататъшно развитие на същите идеи. Първите видео карти с GDDR4 чипове на борда бяха ATI Radeon X1950 XTX и NVIDIA изобщо не пуснаха продукти, базирани на този тип памет. Предимствата на новите чипове памет пред GDDR3 са, че консумацията на енергия на модулите може да бъде с около една трета по-ниска. Това се постига чрез по-ниско напрежение за GDDR4.

GDDR4 обаче не се използва широко дори в Решения на AMD. Започвайки със семейството графични процесори RV7x0, контролерите на паметта на видеокартата поддържат нов тип GDDR5 памет, работеща на ефективна четворна честота до 5,5 GHz и по-висока (теоретично са възможни честоти до 7 GHz), което дава пропускателна способност до до 176 GB/s при използване на 256-битов интерфейс. Ако за увеличаване на честотната лента на паметта в паметта GDDR3/GDDR4 беше необходимо да се използва 512-битова шина, тогава преминаването към GDDR5 направи възможно удвояването на производителността с по-малки размери на кристали и по-ниска консумация на енергия.

Най-модерните типове видеопамети са GDDR3 и GDDR5, те се различават от DDR в някои детайли и също работят с двойно/четворно предаване на данни. Тези видове памет използват някои специални технологии за увеличаване на работната честота. Така GDDR2 паметта обикновено работи на по-високи честоти в сравнение с DDR, GDDR3 на още по-високи честоти, а GDDR5 осигурява максималната честота и честотна лента в момента. Но евтините модели все още са оборудвани с „неграфична“ DDR3 памет със значително по-ниска честота, така че трябва да изберете видеокарта по-внимателно.

Всеки ден във форума ни десетки хора търсят съвети за модернизиране на техните машини, с което ние с готовност им помагаме. Всеки ден, „оценявайки монтажа“ и проверявайки компонентите, избрани от нашите клиенти за съвместимост, започнахме да забелязваме, че потребителите обръщат внимание главно на други, несъмнено важни компоненти. И рядко някой си спомня, че при надграждане на компютър е необходимо да се актуализира също толкова важна част -. И днес ще разкажем и покажем защо не трябва да забравяте за това.

„...Искам да надстроя компютъра си, така че всичко да лети, купих i7-3970X и дънна платка ASRock X79 Extreme6, плюс видеокарта RADEON HD 7990 6GB. Какво друго е nan????777"
- така започват около половината от всички съобщения относно актуализацията настолен компютър. Въз основа на вашите собствени или семеен бюджет, потребителите се опитват да изберат най-бързите, най-бързите и най-красивите модули памет. В същото време, наивно вярвайки, че старият им 450W ще се справи и с енергоемка видеокарта, и с „горещ“ процесор при овърклок едновременно.

Ние, от своя страна, вече сме писали повече от веднъж за важността на захранването - но, признаваме, вероятно не е било достатъчно ясно. Затова днес се поправихме и сме подготвили за вас напомняне какво ще се случи, ако забравите за това, когато надграждате вашия компютър - със снимки и подробни описания.

И така, решихме да актуализираме конфигурацията...


За нашия експеримент решихме да вземем напълно нов среден компютър и да го надстроим до ниво „машина за игри“. Не е нужно да променяме конфигурацията много - ще бъде достатъчно да сменим паметта и видеокартата, за да имаме възможност да играем повече или по-малко модерни игри с прилични настройки на детайлите. Първоначалната конфигурация на нашия компютър е както следва:

Мощност: ATX 12V 400W

Ясно е, че за игри тази конфигурация е, меко казано, доста слаба. Така че е време да промените нещо! Ще започнем със същото нещо, от което започват повечето от гладните за „ъпгрейд“ - с. Няма да сменяме дънната платка - стига да ни устройва.

Тъй като решихме да не пипаме дънната платка, ще изберем такава, съвместима с FM2 сокет (за щастие има специален бутон за това на уебсайта на NICS на страницата с описание на дънната платка). Нека не бъдем алчни - нека вземем достъпен, но бърз и мощен процесор с честота 4,1 GHz (до 4,4 GHz в Турбо режим CORE) и отключен множител - ние също обичаме да „овърклокваме“, нищо човешко не ни е чуждо. Ето характеристиките на процесора, който избрахме:

Характеристики
Честота на шината на процесора 5000 MHz Разсейване на мощността 100 W Честота на процесора 4,1 GHz или до 4,4 GHz в режим Turbo CORE Ядро Ричленд L1 кеш 96 KB x2 L2 кеш памет 2048 KB x2, работещ на скорост на процесора 64 битова поддръжка да Брой ядра 4 Умножение 41, отключен множител Видео ядро ​​на процесора AMD Radeon HD 8670D с честота 844 MHz; Поддръжка на Shader Model 5 Максимален обем оперативна памет 64 GB Макс. брой свързани монитори 3 директно свързани или до 4 монитора с помощта на DisplayPort сплитери

Един стик от 4GB не е нашият избор. Първо, искаме 16GB, и второ, трябва да използваме двуканален режим на работа, за което ще инсталираме два модула памет по 8GB в нашия компютър. Високата производителност, липсата на радиатори и приличната цена ги правят най-вкусния избор за нас. Освен това можете да изтеглите от уебсайта на AMD Програма Radeon RAMDisk, който ще ни позволи да създадем супербърз виртуален диск до 6GB абсолютно безплатно – а всеки обича безплатните полезни неща.


Характеристики
памет 8 GB
Брой модули 2
Стандартна памет PC3-10600 (DDR3 1333 MHz)
Работна честота до 1333 MHz
Времена 9-9-9-24
Захранващо напрежение 1,5 V
Честотна лента 10667 Mb/сек

Можете да играете удобно на вграденото видео само в "миночистач". Ето защо, за да надстроим вашия компютър до игрово ниво, ние избрахме модерен и мощен, но не и най-скъпият, .


Той дойде с 2 GB видео памет, поддръжка на DirectX 11 и OpenGL 4.x. и отлична охладителна система Twin Frozr IV. Производителността му трябва да е повече от достатъчна, за да се насладим на най-новите части на най-популярните франчайзи за игри, като Tomb Raider, Crysis, Hitman и Far Cry. Характеристиките на избрания от нас са следните:


Характеристики
GPU GeForce GTX 770
GPU честота 1098 MHz или до 1150 MHz в режим GPU Boost
Брой шейдър процесори 1536
Видео памет 2 GB
Тип видео памет GDDR5
Ширина на шината на видео паметта 256 бита
Честота на видео паметта 1753 MHz (7,010 GHz QDR)
Брой пикселни тръбопроводи 128, 32 единици за вземане на проби от текстура
Интерфейс PCI Express 3.0 16x (съвместим с PCI Express 2.x/1.x) с възможност за комбиниране на карти чрез SLI.
Портове DisplayPort, DVI-D, DVI-I, HDMI, D-Sub адаптер са включени
Охлаждане на видеокартата Активен (радиатор + 2 вентилатора Twin Frozr IV от предната страна на платката)
Конектор за захранване 8 пина+8 пина
API поддръжка DirectX 11 и OpenGL 4.x
Дължина на видеокартата (измерена в NICS) 263 мм
Компютърна поддръжка с общо предназначениена GPU DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C++, OpenCL 1.0
Максимална консумация на енергия FurMark+WinRar 255 W
Оценка на ефективността 61.5

Неочаквани трудности

Сега имаме всичко необходимо, за да надстроим нашия компютър. Ще инсталираме нови компоненти в нашия съществуващ корпус.


Пускаме го и не работи. И защо? Но тъй като бюджетните захранвания физически не могат да работят с компютър с никаква мощност. Факт е, че в нашия случай захранването изисква два 8-пинови конектора, а захранването има само един 6-пинов конектор за захранване на видеокартата в основата си. Като се има предвид, че много хора се нуждаят от дори повече конектори, отколкото в нашия случай, става ясно, че захранването трябва да бъде сменено.

Но това не е толкова лошо. Само си помислете, няма конектор за захранване! В нашата тестова лаборатория намерихме доста редки адаптери от 6-пинов към 8-пинов и от molex към 6-пинов. Като тези:


Заслужава да се отбележи, че дори и на бюджета модерни блоковеС всяка нова версия на конектори Molex, захранването става все по-малко - така че сме късметлии, може да се каже.

На пръв поглед всичко е наред и с някои трикове успяхме да актуализираме системна единицакъм конфигурацията „геймър“. Сега нека симулираме натоварването, като стартираме теста Furmark и архиватора 7Zip в режим Xtreme Burning едновременно на нашия нов компютър за игри. Можем да стартираме компютъра - вече е добре. Системата оцеля и след стартирането на Furmark. Стартираме архиватора - и какво е това?! Компютърът изгасна, радвайки ни с рев на вентилатор, включен на максимум. „Скромният“ стандартен 400W не успя, колкото и да се опитваше, да захранва видеокартата и мощния процесор. А заради посредствената система за охлаждане нашият много загря и дори максималната скорост на вентилатора не му позволяваше да произведе поне обявените 400W.

Има изход!

пристигнахме Купихме скъпи компоненти, за да сглобим компютър за игри, но се оказа, че не можем да играем на него. Срамота е. Изводът е ясен за всички: старият не е подходящ за нашия компютър за игри, и трябва спешно да бъде сменен с нов. Но кой точно?

За нашия надграден компютър избрахме според четири основни критерия:

Първият е, разбира се, властта.Предпочетохме да изберем с резерв - бихме искали да овърклокнем процесора и да спечелим точки в синтетични тестове. Имайки предвид всичко, от което може да се нуждаем в бъдеще, решихме да изберем мощност от поне 800W.

Вторият критерий е надеждността. Наистина искаме този, взет „с резерв“, да оцелее при следващото поколение видеокарти и процесори, да не изгори сам и в същото време да не изгори скъпи компоненти (заедно с тестовата платформа). Затова нашият избор е само японски кондензатори, само защита от късо съединение и надеждна защитаот претоварване на някой от изходите.

Третата точка от нашите изисквания е удобство и функционалност.. Като начало имаме нужда - компютърът ще работи често и особено шумните захранвания, съчетани с видеокарта и охладител на процесора, ще подлудят всеки потребител. Освен това усещането за красота не ни е чуждо, следователно нов блокЗахранването на нашия компютър за игри трябва да е модулно и да има разглобяеми кабели и конектори. За да няма нищо излишно.

И последен в списъка, но не на последно място, критерият е енергийна ефективност. Да, грижим се както за околната среда, така и за сметките за електричество. Следователно захранването, което избираме, трябва да отговаря поне на стандарта за енергийна ефективност 80+ Bronze.

След като сравнихме и анализирахме всички изисквания, избрахме сред малкото кандидати този, който най-пълно удовлетвори всички наши изисквания. Стана мощност 850W. Имайте предвид, че по редица параметри той дори надмина нашите изисквания. Да видим неговата спецификация:

Характеристики на захранването
Вид оборудване Захранване с активен PFC (Power Factor Correction) модул.
Имоти Loop braiding, Японски кондензатори, Защита от късо съединение (SCP), Защита от пренапрежение (OVP), Защита от претоварване на всеки от изходите на модула поотделно (OCP)
+3.3V - 24A, +5V - 24A, +12V - 70A, +5VSB - 3.0A, -12V - 0.5 A
Разглобяеми захранващи кабели да
Ефективност 90%, 80 PLUS златен сертификат
Захранваща мощност 850 W
Конектор за захранване на дънната платка 24+8+8 пинов, 24+8+4 пинов, 24+8 пинов, 24+4 пинов, 20+4 пинов (разглобяем 24-пинов конектор. 4-пинов може да се отдели, ако е необходимо, подвижен 8-пинов конектор)
Конектор за захранване на видеокартата 6x 6/8-пинови конектори (демонтируем 8-пинов конектор - 2 пина могат да се разглобяват)
MTBF 100 хиляди часа
Охлаждане на захранването 1 вентилатор: 140 x 140 mm (на долната стена). Пасивна охладителна система при натоварване до 50%.
Контрол на скоростта на вентилатора От температурния датчик. Промяна на скоростта на вентилатора в зависимост от температурата в захранването. Ръчен избор на режим на работа на вентилатора. В нормален режим вентилаторът се върти постоянно, а в тих режим спира напълно при ниско натоварване.


, един от най-добрите за парите. Нека го инсталираме в нашия случай:


Тогава се случи нещо, което малко ни обърка. Изглежда, че всичко е сглобено правилно, всичко е свързано, всичко работи - но захранването мълчи! Тоест като цяло: вентилаторът е спрял, а системата е стартирала правилно и работи. Факт е, че при натоварване до 50% захранването работи в така наречения тих режим - без да върти вентилатора на охладителната система. Вентилаторът ще бръмчи само при голямо натоварване - едновременното стартиране на архиватори и Furmark все още кара охладителя да се върти.


Захранването има до шест 8-пинови 6-пинови конектора за захранване на видеокартата, всеки от които е сгъваем 8-пинов конектор, от който 2 пина могат да бъдат разкопчани, ако е необходимо. По този начин той е в състояние да захранва всяка видеокарта без никакви проблеми или затруднения. И дори нито един.


Модулната система за захранване ви позволява да откопчавате излишните и ненужни захранващи кабели, което подобрява въздушния поток на кутията, стабилността на системата и, разбира се, подобрява естетиката външен видвътрешно пространство, което ни позволява спокойно да го препоръчаме на модери и фенове на кутии с прозорци.
купете надеждни и мощен блокхрана . В нашия преглед стана. - и както виждате, не е случайно. Като закупите такъв от NICS, можете да сте сигурни, че всички компоненти на вашата високопроизводителна система ще бъдат снабдени с достатъчно и непрекъсваемо захранване, дори и при екстремен овърклок.


Освен това захранването ще има достатъчно мощност за няколко години напред - по-добре е с резерв, в случай че в бъдеще ще актуализирате системата с компоненти от високо ниво.

Може би сега тези блокове са основните части на видео чипа. Те изпълняват специални програми, известни като шейдъри. Освен това, ако по-ранните пикселни шейдъри изпълняваха пикселни шейдърни блокове, а върховите шейдъри изпълняваха върхови блокове, тогава за известно време графичните архитектури бяха унифицирани и тези универсални изчислителни единици започнаха да се справят с различни изчисления: върхови, пикселни, геометрични и дори универсални изчисления.

За първи път унифицираната архитектура е използвана във видео чипа на игровата конзола Microsoft Xbox 360; този графичен процесор е разработен от ATI (по-късно закупен от AMD). И във видео чиповете за персонални компютри се появиха унифицирани шейдърни модули в платката на NVIDIA GeForce 8800 и оттогава всички нови видеочипове са базирани на унифицирана архитектура, която има универсален код за различни шейдърни програми (върхови, пикселни, геометрични, и т.н.), а съответните унифицирани процесори могат да изпълняват всяка програма.

Въз основа на броя на изчислителните единици и тяхната честота можете да сравните математическата производителност на различните видеокарти. Повечето игри сега са ограничени от производителността на пикселните шейдъри, така че броят на тези блокове е много важен. Например, ако един модел видеокарта е базиран на GPU с 384 изчислителни процесора в състава си, а друг от същата линия има GPU със 192 изчислителни единици, тогава при същата честота вторият ще бъде два пъти по-бавен за обработка на всеки тип шейдъри и като цяло ще бъдат същите по-продуктивни.

Въпреки че е невъзможно да се направят недвусмислени заключения за производителността само въз основа на броя на изчислителните единици, е необходимо да се вземе предвид тактовата честота и различната архитектура на единици от различни поколения и производители на чипове. Само въз основа на тези числа можете да сравнявате чипове само в една и съща линия на един производител: AMD или NVIDIA. В други случаи трябва да обърнете внимание на тестовете за производителност в игрите или приложенията, които ви интересуват.

Текстуриращи единици (TMU)

Тези графични процесори работят заедно с изчислителни процесори; избират и филтрират текстура и други данни, необходими за изграждане на сцена и изчисления с общо предназначение. Броят на текстурните единици във видеочипа определя производителността на текстурата - тоест скоростта на извличане на текселите от текстурите.

Въпреки че напоследък се набляга повече на математическите изчисления и някои текстури се заменят с процедурни, натоварването върху TMU блоковете все още е доста високо, тъй като в допълнение към основните текстури трябва да се правят селекции и от нормални карти и карти на изместване, както и буфери за целево изобразяване на изобразяване извън екрана.

Като се има предвид акцентът на много игри, включително производителността на текстуриращите единици, можем да кажем, че броят на TMU единиците и съответната висока производителност на текстурите също са един от най-важните параметри за видеочиповете. Този параметър оказва особено влияние върху скоростта на изобразяване на изображението при използване на анизотропно филтриране, което изисква допълнителни текстурни проби, както и при сложни алгоритми за меки сенки и новомодни алгоритми като Screen Space Ambient Occlusion.

Операционни единици за растеризация (ROPs)

Блоковете за растеризация извършват операциите по записване на пиксели, изчислени от видеокартата, в буфери и операциите по тяхното смесване (смесване). Както отбелязахме по-горе, производителността на ROP блоковете влияе върху скоростта на запълване и това е една от основните характеристики на видеокартите на всички времена. И въпреки че важността му също намаля донякъде напоследък, все още има случаи, в които производителността на приложението зависи от скоростта и броя на ROP блоковете. Най-често това се дължи на активното използване на филтри за последваща обработка и анти-алиасинг, активирани при високи настройки на играта.