Чем отличается gpu от apu

xTechx.ru

Видеокарта, GPU («видюха», графический адаптер, graphics card, graphics adapter, display card, video card — eng.

) — устройство компьютера, предназначенное для обработки и вывода видео (иногда и аудио) сигнала на устройство отображения информации (монитор, ТВ). Имеет необходимые порты для вывода изображения.

К примеру VGA, DVI, DisplayPort, HDMI.

Подготовленные данные (OpenGL, DirectX) от центрального процессора, которые нужно обработать, попадают в видео (или оперативную) память и видеопроцессор начинает обрабатывать их определённым образом, для преобразования в понятный для монитора сигнал. Видеопамять (или ОЗУ) является также и буфером кадров, для более плавной картинки.

Типы видеокарт компьютера:

Встроенная видеокарта (встроенная графика, integrated videocard) — видеопроцессор встроенный в чипсет (набор логики) материнской платы либо в центральный процессор.

Является ограниченной в плане максимального тепловыделения, потому мощные видеочипы для встроенных видеокарт не используются. В современных встроенных видеочипах вполне хватает производительности для 2D и простеньких 3D игр.

Также они умеют неплохо кодировать и воспроизводить HD видео благодаря встроенным декодерам.
К примеру, технология QuickSync от Intel, использует встроенное в процессор видеоядро для быстрейшего декодирования видео.

По скорости, данное решение обгоняет даже многие видеокарты основанные на декодировании с помощью технологий параллельного вычисления CUDA и OpenCL.

Встроенные видеокарты, в качестве буфера используют оперативную память (ОЗУ).

Это отрицательным образом сказывается на производительности, особенно если память работает в узком, одноканальном режиме. Пропускной способности оперативной памяти недостаточно для обработки каких либо ёмких видеоданных.

На некоторых материнских платах, бывает распаяна более быстрая память (к примеру GDDR 3) для нужд встроенного видеоадаптера. Это примерно в 1.5 раза повышает скорость текстуризации, сглаживания и других характеристик.

У компании AMD, данная технология получила название HyperMemory.

Выходы встроенных видеокарт распаяны непосредственно на материнской плате. Обычно это VGA, DVI или DP.
Встроенные видеокарты подойдут для ниши офисного оборудования, либо для компьютера, на котором не будут использоваться современные громоздкие игры.

Также, благодаря низкому энергопотреблению,  основное их применение — портативные устройства, такие как ноутбуки, нэтбуки, планшетные компьютеры и так далее.
Самыми распространёнными встроенными видеокартами являются видеочипы Intel (GMA Series, HD Graphics).

Во многих процессорах и материнских платах является установлен принудительно, но цена по этому поводу повышается незначительно (в сумме максимум +15$).

Дискретная видеокарта (внешняя, отдельная) — второй по распространённости тип.

Дискретная видеокарта вставляется в специальный слот (pci-express, agp, pci) на материнской плате компьютера или другого устройства. Имеет собственную систему питания и охлаждения.

Отличается от встроенной значительно большими производительностью и тепловыделением. Зачастую, топовые видеокарты потребляют более 300W энергии при полной нагрузке. Стоит заметить, что для дискретной видеокарты требуется удовлетворяющий её потребности блок питания.

К этому стоит отнестись очень серьёзно во избежании выхода из строя блока питания, видеокарты, материнской платы или жёсткого диска. На коробке с видеокартой всегда указано какой мощности блок питания вам потребуется.

Если вы имеете качественный блок питания известной марки, то можно использовать блок питания на 50-100W меньшей мощности, чем рекомендовано.
Основными производителями дискретных видеокарт являются компании NVidia и AMD.

У данных производителей есть видеокарты для многих ценовых ниш начиная от 40$ и заканчивая 1000$.
Дискретные видеокарты подойдут для всех, но если в планах есть современные трёхмерные игры, то «настоящая» видеокарта, хотя бы среднего класса просто жизненно необходима.

К тому же, дискретная видеокарта значительно плавнее ускоряет видео, да и большинство видео плееров умеют работать со всей вычислительной мощностью современных видеочипов. Есть возможность реализовать двойную частоту кадров и другие полезные фильтры практически без ущерба для производительности.

APU (Accelerated Processing Unit) — система, содержащая процессор и аналог дискретной видеокарты в одном чипе.

APU является более предпочтительным, нежели встроенная графика. Видеокарта в APU обычно имеет достаточную производительность и универсальность для современных игр, декодирования видео и других вычислений. При этом обладает не высоким энергопотреблением и тепловыделением.

Самое главное, что может подтолкнуть на покупку APUнизкая цена такого решения. Имея на борту процессор среднего класса, видеокарту с неплохой мощностью и архитектурой как на дискретных видеокартах, вы сможете приобрести всё это по цене одного процессора средне-высокого класса.

Такое возможно благодаря интеграции процессора, контроллёра памяти, контроллёра шины pci-express и видеоядра на одном кристалле, который стоит значительно дешевле чем два или три чипа.
APU — подойдёт для экономных, но тем не менее требовательных пользователей.

Является значительно более выгодным вариантом чем встроенная графика, хотя отчасти APU тоже является процессором со встроенным видеоядром и для её нужд тоже используется оперативная память.

Главным игроком на рынке APU является компания AMD (серии A4, A8 и другие). Хотя с другой стороны, процессоры от Intel тоже в какой то степени можно назвать APU, так как они заключены на одном кристалле с видео ядром.

К чему приводит недостаток мощности видеокарты.

Недостаток вычислительной способности видеокарты получается из-за недостаточного количества исполнительных блоков видеокарты, которые обрабатывают графику. К примеру вы нагружаете карту большим количеством данных, но она может обработать лишь какое то количество в определённое время.

Исполнительные блоки работают на пределе своих возможностей, но плавную картинку выдать не могут из-за сложности данных. Если же в видеокарте большое количество исполнительных блоков, то она может заранее подготовить большое количество кадров в секунду (иногда даже избыточное).

Каждый класс видеокарт от бюджетных до топовых, рассчитан под определённую нагрузку, при которой видеокарта может выдать комфортную частоту кадров в секунду.

Стоит учитывать, что современная видеокарта тоже самое специализированное вычислительное устройство (наподобие CPU), но для определённой цели и определённого типа данных.

Недостаток мощности видеокарты приводит к:

  • -дёрганию, срезанию, торможению картинки при воспроизведении видео.
  • -снижению частоты кадров (тормоза, лаги) в видео играх (преимущественно Flash, 3D).
  • -шлейфы и остаточные изображения в интерфейсах программ и операционной системы, прокрутка с рывками.
  • -более медленная загрузка интернет страниц в браузере.

Недостаток питания видеокарты.

В отличии от встроенных видеокарт, дискретные потребляют значительное количество электроэнергии и выделяют значительное количество тепла. Недостаток питания для видеокарты очень распространённый симптом различного рода неисправностей компьютера.

Симптомы, присущие недостатку питания для дискретной видеокарты:

  • -артефакты (цветовые искажения) на экране в интерфейсе или артефакты при нагрузке.
  • -отключение компьютера при нагрузке, закрытие требовательных программ с ошибкой.
  • -появляется сообщение о недостаточном питании видеокарты.
  • -системный блок запускается но на экране ничего не появляется (одна из причин).
  • -постоянные сообщение об ошибке видео драйвера.


Что делать при недостатке питания видеокарты:

  • -Проверить, подключены ли все дополнительные, необходимые разъёмы блока питания к видеокарте (если они есть).
  • -Поставить более мощный блок питания.
  • -поставить менее мощную видеокарту.
  • -убрать разгон видеокарты и центрального процессора, если таковые имеется. Это даст какое то время для покупки нового блока питания.
  • -если до этого компьютер работал нормально, необходимо вскрыть блок питания и проверить на целостность конденсаторы и другие компоненты (при наличии базовых навыков).

Перегрев видеокарты.

Перегрев видеокарты довольно частая неисправность в компьютере. Естественно перегрев может быть только у дискретных видео адаптеров, так как они обладают высоким уровнем тепловыделения.

Симптомы перегревающейся видеокарты:

  • -непривычный гул системы охлаждения в системном блоке.
  • -на экране появляется предупреждение о высокой температуре (уведомление драйвера).
  • -в диагностических утилитах, таких как AIDA, MSI Afteburner, GPU-Z — температура видео ядра превышает 60 градусов в состоянии покоя.
  • -артефакты на экране при нагрузке.
  • -отключение компьютера при нагрузке (игры, 3D редакторы).
  • -при включении, компьютер не включается, либо на экране ничего не появляется но системный блок работает.

Допускать долговременного перегрева ни в коем случае нельзя, так как видео адаптер может выйти из строя. Например может быть отвал видео чипа, деградация системы питания и видеопамяти видеокарты.

Что необходимо делать если видеокарта перегревается:

  • -Обесточить всё, открыть системный блок, вытащить из слота видеокарту и штекеры дополнительного питания (на ваш страх и риск, заземлите себя или избавьтесь от возможных источников статического электричества).
  • -Прочистить систему охлаждения с помощью натуральной кисточки и пылесоса.

Если система охлаждения бловерного типа (турбина), нужно снять весь верхний чехол видеокарты, так как по другому вам её прочистить не удастся. Пыль забивается толстым слоем на радиаторе, который ближе к вентилятору. Заодно, лучше прочистить радиатор центрального процессора.

  • -Вставляем видеокарту обратно, подключаем питание. Если всё нормально, радуемся. Если нет, читаем ниже.
  • -Даём поработать системному блоку подольше, желательно при нагрузке. Открываем крышку, проверяем работает ли вентилятор на видеокарте и аккуратно щупаем радиатор на видеокарте пальцем. Если он горячий и невозможно держать на нём палец, значит дело не в высохшем термоинтерфейсе. Возможно внутри системного блока недостаточно качественный воздушный обмен. Если он еле тёплый или прохладный, значит дело скорее всего в высохшей термопасте.
  • -Чтобы улучшить воздухообмен внутри системного блока, нужно поставить несколько вентиляторов на вдув и несколько на выдув (иногда достаточно по одному 120х120). На вдув нужно ставить спереди или снизу, на выдув сверху или на задней части корпуса системного блока. Подключать необходимо либо к материнской плате (перед установкой нужно проверить, есть ли необходимые разъёмы), либо к molex (четыре штырька) разъёмам питания, если таковые имеются на вентиляторах.
  • -Проблема с высохшей термопастой, обычно не беспокоит первые 3 года с покупки видеокарты. Тем не менее, для замены вам необходима сама термопаста и отвёртки. Термопаста подойдёт КПТ-8 или другая подороже. Снятие системы охлаждения видеокарты — чисто индивидуальное для каждой модели. Но самое главное — никаких резких движений и чрезмерных усилий (на ваш страх и риск). Перед снятием лучше прогреть видеокарту, или просто нагреть горячим воздухом (газовая плита, фен) во избежании отрыва чипа. После снятия, нужно тщательно удалить старую термопасту ватой или мягкой бумагой. Если перед вами теплораспределительная крышка, то беспокоиться не о чем. Если перед вами сам кристалл, то будьте втройне аккуратнее. Малейший скол может вывести из строя видео чип. Наносим небольшую горошину термопасты в центр кристалла/крышки и очень равномерно прикладываем радиатор. Прикручиваем систему охлаждения методом половину оборота, затем на следующий винт и по круга. Если у вас кристалл без крышки то сильно не прикручиваем, чтобы не заработать скол ядра.
  • Если вы всё сделали правильно, то радиатор при работе должен быть горячим (>60 градусов — уже горячо).
  • Если ничего выше не помогло, то вам следует задуматься о качестве питания вашей видеокарты. Очень часто, перегревы бывают вызваны некачественным блоком питания. Так как напряжение подаётся недостаточное, видеокарта начинает перегреваться. Больше всего при этом страдает система питания на видео карте, а постоянный её перегрев, может даже после замены блока питания вызывать перегрев видео ядра. Здесь уже может помочь только профессиональный ремонт.

Источник: http://www.xtechx.ru/c40-visokotehnologichni-spravochnik-hitech-book/video-card-what-is-it-raznovidnosti-peregrev/

В чем разница между cpu и gpu?

Все мы знаем, что у видеокарты и процессора несколько различные задачи, однако знаете ли вы, чем они отличаются друг от друга во внутренней структуре? Как CPU (англ.

— central processing unit), так и GPU (англ. — graphics processing unit) являются процессорами, и между ними есть много общего, однако сконструированы они были для выполнения различных задач.

Подробнее об этом вы узнаете из данной статьи.

CPU

Основная задача CPU, если говорить простыми словами, это выполнение цепочки инструкций за максимально короткое время.

CPU спроектирован таким образом, чтобы выполнять несколько таких цепочек одновременно или разбивать один поток инструкций на несколько и, после выполнения их по отдельности, сливать их снова в одну, в правильном порядке.

Каждая инструкция в потоке зависит от следующих за ней, и именно поэтому в CPU так мало исполнительных блоков, а весь упор делается на скорость выполнения и уменьшение простоев, что достигается при помощи кэш-памяти и конвейера.

GPU

Основная функция GPU — рендеринг 3D графики и визуальных эффектов, следовательно, в нем все немного проще: ему необходимо получить на входе полигоны, а после проведения над ними необходимых математических и логических операций, на выходе выдать координаты пикселей.

По сути, работа GPU сводится к оперированию над огромным количеством независимых между собой задач, следовательно, он содержит большой объем памяти, но не такой быстрой, как в CPU, и огромное количество исполнительных блоков: в современных GPU их 2048 и более, в то время как у CPU их количество может достигать 48, но чаще всего их количество лежит в диапазоне 2-8.

Читайте также:  Чем отличается потребитель от покупателя

Основные отличия

CPU отличается от GPU в первую очередь способами доступа к памяти. В GPU он связанный и легко предсказуемый — если из памяти читается тексел текстуры, то через некоторое время настанет очередь и соседних текселов. С записью похожая ситуация — пиксель записывается во фреймбуфер, и через несколько тактов будет записываться расположенный рядом с ним.

 Также графическому процессору, в отличие от универсальных процессоров, просто не нужна кэш-память большого размера, а для текстур требуются лишь 128–256 килобайт.

Кроме того, на видеокартах применяется более быстрая память, и в результате GPU доступна в разы большая пропускная способность, что также весьма важно для параллельных расчетов, оперирующих с огромными потоками данных.

Есть множество различий и в поддержке многопоточности: CPU исполняет 12 потока вычислений на одно процессорное ядро, а GPU может поддерживать несколько тысяч потоков на каждый мультипроцессор, которых в чипе несколько штук! И если переключение с одного потока на другой для CPU стоит сотни тактов, то GPU переключает несколько потоков за один такт.

В CPU большая часть площади чипа занята под буферы команд, аппаратное предсказание ветвления и огромные объемы кэш-памяти, а в GPU большая часть площади занята исполнительными блоками. Вышеописанное устройство схематично изображено ниже:

Разница в скорости вычислений

Если CPU — это своего рода «начальник», принимающий решения в соответствии с указаниями программы, то GPU — это «рабочий», который производит огромное количество однотипных вычислений. Выходит, что если подавать на GPU независимые простейшие математические задачи, то он справится значительно быстрее, чем центральный процессор. Данным отличием успешно пользуются майнеры биткоинов.

Майнинг Bitcoin

Суть майнинга заключается в том, что компьютеры, находящиеся в разных точках Земли, решают математические задачи, в результате которых создаются биткоины.

 Все биткоин-переводы по цепочке передаются майнерам, чья работа состоит в том, чтобы подобрать из миллионов комбинаций один-единственный хэш, подходящий ко всем новым транзакциям и секретному ключу, который и обеспечит майнеру получение награды в 25 биткоинов за раз.

 Так как скорость вычисления напрямую зависит от количества исполнительных блоков, получается, что GPU значительно лучше подходят для выполнения данного типа задачи, нежели CPU. Чем больше количество произведенных вычислений, тем выше шанс получить биткоины. Дело даже дошло до сооружения целых ферм из видеокарт:

По материалам Wikipedia, habrahabr.ru и edu.chpc.ru

Источник: https://tproger.ru/articles/cpu-and-gpu/

В чем отличие cpu от gpu

Процессоры и графические ускорители очень похожи, они оба сделаны из сотен миллионов транзисторов и могут обрабатывать тысячи операций за секунду. Но чем именно отличаются эти два важных компонента любого домашнего компьютера?

В данной статье мы попытаемся очень просто и доступно рассказать, в чем отличие CPU от GPU. Но сначала нужно рассмотреть два этих процессора по отдельности.

Что такое CPU?

CPU (Central Processing Unit или же Центральное Процессорное Устройство) часто называют «мозгом» компьютера. Внутри центрального процессора расположено около миллиона транзисторов, с помощью которых производятся различные вычисления. В домашних компьютерах обычно устанавливаются процессоры, имеющие от 1 до 4 ядер с тактовой частотой приблизительно от 1 ГГц до 4 ГГц.

Процессор является мощным, потому что может делать все. Компьютер способен выполнить какую-либо задачу, так как процессор способен выполнить эту задачу. Программистам удалось достичь этого благодаря широким наборам инструкций и огромным спискам функций, совместно используемых в современных центральных процессорах.

Что такое GPU?

GPU (Graphics Processing Unit или же Графическое Процессорное Устройство) представляет собой специализированный тип микропроцессора, оптимизированный для очень специфических вычислений и отображения графики. Графический процессор работает на более низкой тактовой частоте в отличие от процессора, но имеет намного больше процессорных ядер.

Также можно сказать, что GPU — это специализированный CPU, сделанный для одной конкретной цели — рендеринг видео. Во время рендеринга графический процессор огромное количество раз выполняет несложные математические вычисления. GPU имеет тысячи ядер, которые будут работать одновременно.

Хоть и каждое ядро графического процессора медленнее ядра центрального процессора, это все равно эффективнее для выполнения простых математических вычислений, необходимых для отображения графики.

Этот массивный параллелизм является тем, что делает GPU способным к рендерингу сложной 3D графики, требуемой современными играми.

Отличие CPU и GPU

Графический процессор может выполнить лишь часть операций, которые может выполнить центральный процессор, но он делает это с невероятной скоростью. GPU будет использовать сотни ядер, чтобы выполнить срочные вычисления для тысяч пикселей и отобразить при этом сложную 3D графику. Но для достижения высоких скоростей GPU должен выполнять однообразные операции.

Возьмем, например, Nvidia GTX 1080. Данная видеокарта имеет 2560 шейдерных ядер. Благодаря этим ядрам Nvidia GTX 1080 может выполнить 2560 инструкций или операций за один такт. Если вы захотите сделать картинку на 1% ярче, то GPU с этим справится без особого труда. А вот четырехъядерный центральный процессор Intel Core i5 сможет выполнить только 4 инструкции за один такт.

Тем не менее, центральные процессоры более гибкие, чем графические. Центральные процессоры имеют больший набор инструкций, поэтому они могут выполнять более широкий диапазон функций.

Также CPU работают на более высоких максимальных тактовых частотах и имеют возможность управлять вводом и выводом компонентов компьютера.

Например, центральный процессор может интегрироваться с виртуальной памятью, которая необходима для запуска современной операционной системы. Это как раз то, что графический процессор выполнить не сможет.

Вычисления на GPU

Даже несмотря на то, что графические процессоры предназначены для рендеринга, они способны на большее. Обработка графики — это только вид повторяющихся параллельных вычислений.

Другие задачи, такие как майнинг Bitcoin и взломы паролей полагаются на одни и те же виды массивных наборов данных и простых математических вычислений. Именно поэтому некоторые пользователи используют видеокарты для не графических операций.

Такое явление называется GPU Computation или же вычисления на GPU.

Выводы

В данной статье мы провели сравнение CPU и GPU. Думаю, всем стало понятно, что GPU и CPU имеют схожие цели, но оптимизированы для разных вычислений. Пишите свое мнение в комментариях, я постараюсь ответить.

Источник: www.maketecheasier.com

Источник: https://losst.ru/v-chem-otlichie-cpu-ot-gpu

ATI / AMD и Ubuntu. Какой графический драйвер выбрать?

Признаюсь честно, но я старый поклонник продукции NVIDIA, так как она не вызывает у меня никаких опасений при установке драйвера.

Но понял, что моё бегание от продукции AMD привело к тому, что я совершенно не ориентируюсь в вопросе установки драйверов для ATI/AMD в Ubuntu.

Есть замечательная статья «ATI/AMD & Ubuntu: how to correctly choose and install the graphics drivers» чей перевод и перерисованные картинки предлагаются вашему вниманию.

Многие новички в Linux часто не знают как много драйверов уже «предустановлены» в их операционной системе. Это одно из приятных вещей, доступных при использовании открытой ОС. Железо определено и работает без лишних телодвижений.

Однако, часто требуется установить проприетарные (закрытые) драйвера. Но не читая документацию, часто пользователи ставят закрытый драйвер видеокарты производителя, когда в нём нет нужды, перезагружают компьютер и БАЦ … ничего не работает.

Так как есть масса различных конфигураций аппаратуры, то вам предлагается информативное изображение, которое легко позволит выбрать правильный путь установки нужного драйвера ATI/AMD в Убунту и её дериватах.

Немного терминов!

CPU (central processing unit) — центральный процессор (ЦП; также центральное процессорное устройство — ЦПУ). Иногда называют микропроцессором или просто процессором.

GPU (graphics processing unit) — графический процессор. Отдельное устройство, выполняющее графический рендеринг.

APU (accelerated processor unit) — гибридный процессор (ускоренный процессор, процессор с видеоускорителем). Микропроцессорная архитектура, подразумевающая объединение центрального процессора с графическим в одном кристалле.

Интегрированное (integrated) — GPU является частью материнской платы, деля ресурсы с CPU и системной памятью.

Отдельная, внешняя (discrete) — GPU располагается на отдельной плате (видеокарте), обладая своей видеопамятью.

1. Какая графическая карта ATI / AMD в системе?

Вызовите Терминал и вставьте команду lspci | grep VGA
Появившийся текст (как пример) позволит определить графическую карту:

  • Единственный ATI/AMD GPU или единственный AMD APU.01:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] RV635 [Radeon HD 3650/3750/4570/4580]У вас ИЛИ отдельная видеокарта AMD ИЛИ всё-в-одном от AMD.
  • Внешняя ATI/AMD GPU + Intel CPU с интегрированной графикой.00:02.0 VGA compatible controller: Intel Corporation Haswell-ULT Integrated Graphics Controller (rev 09)04:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Mars LE [Radeon HD 8530M / R5 M240] (rev ff)Часто встречается в ноутбуках — отдельная видеокарта AMD для мощных задач И графика от Intel для обычной работы, экономя батарею.
  • AMD APU + внешняя AMD GPU.00:01.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Trinity [Radeon HD 7600G]01:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Mars [Radeon HD 8730M] (rev ff)

2. Какие графические драйвера доступны?

После того как в №1 вы определились с установленной в системе видеокартой, следует перейти к нужной инструкции.

3. Единственный ATI/AMD GPU или единственный AMD APU

  • Radeon HD 5xxx, 6xxx, 7xxx, 8xxx или Rx 2xx AMD. У вас 2 пути:
    • открытый драйвер Radeon, который идёт по умолчанию и позволяет вам сразу же работать с видеокартой.
    • закрытый драйвер AMD Catalyst. Возможно лучший вариант, так как управление видеокартой он осуществляет лучше, чем Radeon драйвер. НО иногда вы можете столкнуться с ситуацией, когда AMD Catalyst не устанавливается и придётся использовать Radeon.
  • Radeon HD 4xxx, 3xxx, 2xxx или старые ATI карты. Вы НЕ МОЖЕТЕ использовать AMD Catalyst, так как AMD прекратила поддержку данных видеокарт и доступен только открытый Radeon.

    Для очень старых ATI карт, возможно, лучше подобрать лёгкую Убунту: Xubuntu, Lubuntu или Ubuntu MATE.

4. Внешняя ATI/AMD GPU + Intel CPU с интегрированной графикой

Внимательно взгляните на установленную модель ATI/AMD карты. Так как у вас в системе ДВЕ графические подсистемы: AMD GPU + интегрированный графический процессор Intel (IGP), то вы будете вынуждены переключаться между ними.

Решение Интел идеально для сёрфинга в Интернете, редактированию документов и всех тех задач, где не требуется мощное 3D и нужна экономия ресурсов, работая от батареи.

Решение AMD идеально для игр, 3D моделирования и всех тех задач, где требуется графическое быстродействие и нет необходимости работать от батареи.

  • Radeon HD 6xxx, 7xxx, 8xxx или Rx 2xx AMD. Ставьте закрытый AMD Catalyst драйвер. Он позволит задействовать мощь AMD GPU, изменять его настройки и переключаться на Intel карту. Помните, что переключение с карты на карту потребует от вас перезагрузки системы.
  • Radeon HD 5xxx или старые видеокарты. Вы не сможете установить AMD Catalyst драйвер, так как он не поддерживает старую систему Mux, которая занималась переключением между графическими процессорами в старых ноутбуках. Можно использовать только vga_switcheroo, который работает только с открытыми драйверами драйверами (Intel и Radeon соответственно).

5. AMD APU + внешняя AMD GPU

В данном случае нужно будет переключаться с APU на внешнюю GPU, хоть оба и от АМД.

  • Radeon HD 6xxx, 7xxx, 8xxx или Rx 2xx AMD. Ставьте закрытый AMD Catalyst драйвер. Вы сможете переключаться между графическими процессорами с помощью Catalyst Control Center. Вам всё равно потребуется перезагрузка, несмотря на общего производителя в лице АМД.
  • Radeon HD 5xxx или старые видеокарты. Используйте vga_switcheroo, который работает только с открытыми драйверами Radeon.

В MS Windows два графических процессора (APU и GPU) могут работать вместе и обеспечивать бо́льшую производительность, но данный функционал ещё не реализован в Linux.

Установка драйвера AMD Catalyst в Ubuntu

Установить драйвера видеокарты в Убунту:

  • Откройте Параметры системы -> Программы и обновления -> Дополнительные драйвера.
  • Выберите fglrx или fglrx-update
  • Перезагрузитесь и молитесь.

Иногда что-то может пойти не так и вы получите чёрный экран. Нужно удалить установленный вами драйвер и вернуться обратно к использованию открытого.

  • При чёрном экране жмите Ctrl + Alt + F2.
  • Введите свой логин и пароль.
  • Удалите драйвер — sudo apt-get remove -purge fglrx*
  • Перезагрузитесь — sudo reboot

Если простой графический способ установки драйвера не помогает, то обратитесь к Ubuntu Community documentation по адресу https://help.ubuntu.com/community/BinaryDriverHowto/AMD

Драйверные вопросы:
ATI / AMD driver Ubuntu.
Драйвер Linux для устройства.
Делаем отчёт по оборудованию в MS Windows — получаем результат о поддержке Линуксом. Мой проект «Linux HCL: поддерживаемое оборудование»

Источник: http://vasilisc.com/ati-amd-ubuntu-gpu-driver

Что такое GPU : различия c CPU в современных компьютерах

Привет, друзья.

Вы любите поиграть в реалистичные игры на компе? Или посмотреть фильм в качестве, при котором четко видно каждую мелочь? Значит, вы должны представлять, что такое gpu в компьютере. Ничего о нем не знаете? Моя статья поможет вам избавиться от этого недоразумения ;-).

GPU — это не видеокарта

Всегда считали, что эти функции выполняет видеокарта? Вы, конечно, правы, но она является комплексным устройством, и главным ее компонентом выступает как раз графический проц. Он может существовать и автономно от видюхи. Об этом поговорим немного позже.

GPU: не путать с CPU

Они отличаются архитектурой. CPU является многоцелевым девайсом, который отвечает за все процессы в компьютере. Для этого ему хватает нескольких ядер, с помощью которых он последовательно обрабатывает одну задачу за другой.

В свою очередь, GPU изначально разработан как специализированное устройство, предназначенное для выполнение графического рендеринга, с высокой скоростью обрабатывающее текстуры и сложные изображения. Для таких целей его оснастили многопоточной структурой и множеством ядер, чтобы он работал с большими массивами информации единовременно, а не последовательно.

В виду этого преимущества, лидеры среди производителей видеоадаптеров выпустили модели, в которых графические процессоры могут стать усовершенствованной заменой центральным. У бренда nVidia такой девайс называется GTX 10xx, а у его главного конкурента AMD — RX.

Виды графических процев

Чтобы вы могли ориентироваться на рынке GPU, предлагаю ознакомиться с видами этого устройства:

  • Дискретный. Входит в состав видеоадаптера. Подключается к системной плате через специально отведенный разъем (чаще всего PCIe или AGP). Имеет собственную оперативную память. Вы требовательный геймер или работаете со сложными графическими редакторами? Берите дискретную модель.
  • Интегрированный (IGP). Раньше впаивался в материнскую плату, теперь встраивается в центральный процессор. Изначально не годился для воспроизведения реалистичных игр и тяжелых графических программ, однако новые модели справляются с этими задачами. Все же учтите, что такие чипы несколько медлительнее, потому что не имеют личной оперативки и обращаются к памяти CPU.
  • Гибридная графическая обработка. Это 2 в 1, то есть когда в компьютере устанавливается и первый вид, и второй вид GPU. В зависимости от выполняемых задач, включается в работу или один, или другой. Однако бывают ноутбуки, в которых могут работать сразу 2 вида устройств.
  • Внешний тип. Как несложно догадаться, это графический процессор, расположенный снаружи компа. Чаще всего такую модель выбирают обладатели ноутбуков, которым сложно впихнуть в свое железо дискретную видеокарту, но очень хочется получить достойную графику.

Как выбирать?

Когда будете подбирать для себя видеоадаптер, обращайте внимание на такие характеристики:

  • Тактовая частота. Указывается в мегагерцах. Чем цифра выше, тем больше информации за секунду сможет обработать устройство. Правда, не только она влияет на его результативность. Архитектура также имеет значение.
  • Число вычислительных блоков. Они призваны обрабатывать задачи — шейдеры, отвечающие за вершинные, геометрические, пиксельные и универсальные расчеты.
  • Быстрота заполнения (филлрейт). Этот параметр может рассказать, с какой скоростью GPU может вырисовывать картинку. Он делится на 2 вида: пиксельный (pixel fill rate) и текстурный (texel rate). На первый влияет количество ROP-блоков в структуре проца, а на второй — текстурных (TMU).

Обычно в последних моделях GPU первых блоков меньше. Они записывают рассчитанные видеоадаптером пиксели в буферы и смешивают их, что по-умному называется блендинг. TMU выполняют выборку и фильтрацию текстур и другой информации, требуемой для выстраивания сцены и общих расчетов.

Геометрические блоки

Раньше на них никто не обращал внимания, потому что виртуальные игры имели простую геометрию. Этот параметр стали учитывать после появления в DirectX 11 тесселяции. Не понимаете, о чем я? Давайте по порядку.

Таким образом, если вы захотите с головой окунуться в атмосферу Metro 2033, Crysis 2, HAWX 2 и т. п., при выборе GPU учитывайте количество геометрических блоков.

Память

Собрались  брать новую видеокарту? Значит, вам нужно учесть еще несколько характеристик оперативки:

  • Объем. Важность RAM несколько переоценена, так как не только ее емкость, но также тип и свойства влияют на производительность карты.
  • Ширина шины. Это более весомый параметр. Чем шире, тем больше информации сможет отправить память чипу и наоборот за определенное время. Для воспроизведения игр необходимо минимум 128 бит.
  • Частота. Тоже определяет пропускную способность оперативки. Но учтите, что память с 256-битной шиной и частотой 800(3200) МГц работает продуктивнее, чем со 128 битами на 1000(4000) МГц.
  • Тип. Не буду грузить вас лишней информацией, а лишь назову оптимальные на сегодня типы — это GDDR 3 и 5 поколения.

Немного об охлаждении

Задумали установить мощный чип? Сразу позаботьтесь о дополнительном охлаждении в виде радиаторов, кулеров, а если собираетесь регулярно выжимать из девайса все соки, можно подумать и над жидкостной системой.

В целом, следите за температурой видюхи. Помочь в этом вам может программа GPU-Z и т. п., которая помимо этого параметра расскажет все об устройстве.

Конечно, современные видеокарты оснащаются защитной системой, которая вроде бы не допускает перегрева. Для разных моделей предельная температура отличается. В среднем, она составляет 105 °C, после чего адаптер сам выключается. Но лучше поберечь дорогой девайс и обеспечить вспомогательное охлаждение.

Почерпнули для себя кое-что полезное? Поделитесь этим с друзьями в социальных сетях. До скорого!

Источник: http://profi-user.ru/gpu/

Процессоры CPU и графические процессоры GPU отличия

Есть два типа процессоров которые выполняют разные задачи, CPU (central processing unit) и GPU ( graphics processing unit) в компьютере есть оба типа процессоров.

CPU — это центральные процессоры например Core i3, Core i5, Core i7 от Intel или AMD FX™ AMD Athlon™ X4​ от AMD. GPU — это графический процессор применяется в видеокартах Nvidia, AMD Radeon™, MSI.

Также есть процессоры CPU с встроенными графическими процессорами,  которые имеют ядра CPU центральных процессоров и ядра графических процессоров GPU, CPU+GPU, такие процессоры называют с интегрированной графикой например Intel® HD Graphics.

Основное отличие процессоров CPU и GPU в выполняемых задачах.

CPU это процессор основной задачей которого является выполнение различных вычислений и обеспечение работы программ напрямую не связанных с выводом графики, он выполняет последовательные задачи с большой вычислительной скоростью. Например конвертация данных или обеспечение работы мощного программного продукта имеющего различные вычислительные модули.

GPU предназначены для работы с графикой и в своём составе имеет несколько десятков, а то и тысяч небольших процессоров его основная задача получить данные и преобразовать их в пиксели на экране монитора.

Такие процессоры выполняют параллельные задачи, получают информацию и преобразуют полученные данные в пиксели (цвет, яркость).

Благодаря множеству мелких ядер которые работают независимо друг от друга, они обеспечивают очень быстрое преобразование данных и вывод картинки на экран монитора.

Микро процессоры производят параллельное преобразование один процессор производит вычисление только группы пикселей например в левой части экрана, другой отвечает за пиксели находящиеся в другой части экрана, после выполнения параллельного преобразования получиться картинка которая будет выведена на экран.

Наиболее доходчиво, работу процессора GPU демонстрируется на видео от Nvidia  когда картина рисуется одновременным выстрелом капель краски имитирующих пиксели, в течении секунды нарисована картина.

На практике представить работу CPU и GPU можно следующим образом, например в игре, CPU отвечает за обработку динамики в игре он произведёт вычисление в какой точке экрана должны оказаться объекты, эта информация поступит в графический процессор GPU, она будет обработана и  выведено  на экран изображение с объектами в нужных точках.

Поэтому в играх более эффективно будет работать связка например менее мощный  CPU Intel i3 и хорошая видеокарта и значительно хуже будет работать, набор процессор Intel i7 и слабая видеокарта. Это связано с тем, что основная задача в игре вывод на экран как можно быстрее картинки, а самих вычислений не так уж и много.

В не игровых программах где нужна скорость вычисления, обработка массивов информации и после обработки вывод результатов на экран, решающую роль играет мощность вычислений. В таких случаях практически не важно какой применяется графический процессор важно эффективность CPU.

Это хорошо прослеживается в тенденциях компьютеров, для офиса нужен компьютер с хорошим процессором CPU  в таком случае Intel i7 намного лучше Intel I3 и практически не востребована видеокарта с процессорами GPU.

Поэтому офисная техника как правило имеет встроенную графику так как она не столь важна.

Для геймеров наоборот играет роль мощность видеокарты процессоров GPU и тут как нельзя лучше подойдёт отдельная видеокарта которая и обеспечит вывод картинки на экран, также её более легко заменить произведя апгрейд компьютера с  заменой видеокарты.

Между CPU и GPU нет конкуренции эти процессоры предназначены для выполнения разных задач, они гармонично дополняют друг друга.

 

Источник: http://tab-tv.com/?p=14333

Графический процессор (особенности функционирования и структуры)

Современные видеокарты, в силу требований от них огромной вычислительной мощи при работе с графикой, оснащаются своим собственным командным  центром, иначе говоря — графическим процессором.

Это было сделано для того, чтобы «разгрузить» центральный процессор, который из-за своей широкой «сферы применения», просто не в состоянии справляться с требованиями, которые выдвигает современная игровая индустрия.

Графические процессоры (GPU) по сложности абсолютно не уступают центральным процессорам, но из-за своей узкой специализации, в состоянии более эффективно справляться с задачей обработки графики, построением изображения, с  последующим выводом его на монитор.

Если говорить о параметрах, то они у графических процессоров весьма схожи с центральными процессорами. Это уже известные всем параметры, такие как микроархитектура процессора, тактовая частота работы ядра, техпроцесс производства. Но у них имеются и довольно специфические характеристики.

Например, немаловажная характеристика графического процессора – это количество пиксельных конвейеров (Pixel Pipelines). Эта характеристика определяет количество обрабатываемых пикселей за один такт роботы GPU.

Количество данных конвейеров может различаться, например, в графических чипах серии Radeon HD 6000, их количество может достигать 96.

Пиксельный конвейер занимается тем, что просчитывает каждый последующий пиксель очередного изображения, с  учётом его особенностей. Для ускорения  процесса просчёта используется несколько параллельно работающих конвейеров, которые просчитывают разные пиксели одного и того же изображения.

Также, количество пиксельных конвейеров влияет на немаловажный параметр – скорость заполнение видеокарты. Скорость заполнения видеокарты можно рассчитать умножив частоту ядра на количество конвейеров.

Давайте рассчитаем скорость заполнения, к примеру, для видеокарты  AMD Radeon HD 6990 (рис.2) Частота ядра GPU этого чипа составляет 830 МГц, а количество пиксельных конвейеров – 96. Нехитрыми математическими вычислениями (830х96), мы приходим к выводу, что скорость заполнения будет равна  57,2 Гпиксель/c.

Рис. 2

Помимо пиксельных конвейеров, различают ещё  так называемых текстурные блоки в каждом конвейере. Чем больше текстурных блоков, тем больше текстур может быть наложено за один проход конвейера, что также влияет на общую производительность всей видеосистемы.  В вышеупомянутом чипе AMD Radeon HD 6990, количество блоков выборки текстур составляет 32х2.

В графических процессорах, можно выделить и другой вид конвейеров – вершинные, они отвечают за расчёт геометрических параметров трёхмерного изображения.

Сейчас, давайте рассмотрим  поэтапный,  несколько упрощенный, процесс конвейерного расчёта, с последующим формированием  изображения:

1й этап. Данные о вершинах текстур поступают в вершинные конвейеры, которые занимаются рассчётом параметров геометрии.

На этом этапе подключается блок «T&L» (Transform & Lightning). Этот блок отвечает за освещение и трансформацию изображения в трёхмерных сценах.

Обработка данных в вершинном конвейере проходит за счёт программы вершинного шейдера (Vertex Shader).

2ой этап. На втором этапе формирования изображения подключается специальный Z-буфер, для отсечения невидимых полигонов и граней трёхмерных объектов.

Далее происходит процесс фильтрации текстур, для этого в «бой» вступают пиксельные шейдеры. В программных интерфейсах OpenGL или Direct3D описаны стандарты для работы с трёхмерными изображениями.

Приложение вызывает определённую стандартную функцию OpenGL или Direct3D, а шейдеры эту функцию выполняют.

3–ий этап. В завершающем этапе построения изображения в конвейерной обработке, данные передаются в специальный буфер кадров.

Итак, только что мы вкратце рассмотрели структуру и принципы функционирования графических процессоров, информация ,конечно, «не из лёгких» для восприятия, но для общего компьютерного развития, я думаю,  будет  весьма полезна 🙂

Источник: http://we-it.net/index.php/zhelezo/videokarty/59-graficheskij-protsessor-osobennosti-funktsionirovaniya-i-struktury

Overclockers.ru

  • Вступление
  • Тестовая конфигурация
  • Инструментарий и методика тестирования
  • Результаты тестов: сравнение производительности
  • Сравнение производительности конфигураций
  • Соотношение стоимости и производительности конфигураций ($/средний FPS)
  • Измерение энергопотребления систем с различными конфигурациями
  • Заключение
  • Вступление

    Вопрос грамотной комплектации современного игрового компьютера тревожит умы большинства пользователей не один год. Последнее время преобладает мнение, что для игр важнее видеокарта, чем процессор. Однако не стоит забывать о том, что за прошедшие пару лет появилось немало проектов, предъявляющих высокие требования к мощности CPU. Поэтому сегодня мы решили исследовать этот вопрос.

    Тестовая конфигурация

    Тесты проводились на следующем стенде:

    • Процессоры:
    • Core 2 Duo E8400 — 3000 @ 4200 МГц
    • Pentium E6300 — 2800 @ 3800 МГц
    • Видеокарты:
    • GeForce GTX 260 896 Mбайт — 576/1242/2000 @ 700/1512/2400 МГц (Zotac)
    • GeForce 9800 GT 512 Mбайт — 600/1500/1800 @ 720/1836/2300 МГц (Zotac)
  • Материнская плата: GigaByte GA-EX38-DS4, BIOS F3
  • Система охлаждения CPU: Cooler Master V8 (~1100 об/мин)
  • Оперативная память: 2 x 2048 Мбайт DDR2 Hynix (Spec: 800 МГц / 6-6-6-18-2t / 1.8 В)
  • Дисковая подсистема: SATA-II 500 Гбайт, WD 5000KS, 7200 об/мин, 16 Мбайт
  • Блок питания: Thermaltake Toughpower 1200 Ватт (штатный вентилятор: 140-мм на вдув)
  • Корпус: открытый тестовый стенд
  • Монитор: 24″ BenQ V2400W (Wide LCD, 1920×1200 / 60 Гц)

Программное обеспечение:

  • Операционная система: Windows 7 build 7600 RTM x86
  • Драйверы видеокарт:NVIDIA GeForce 197.13 WHQL
  • MSI AFTERBURNER 1.5.1

Инструментарий и методика тестирования

Для тестов мы подобрали процессоры и видеокарты от одних производителей, соответственно, Intel и NVIDIA. Это было сделано с целью меньшего влияния архитектурных особенностей комплектующих на общую картину.

Были собраны две конфигурации: Core 2 Duo E8400 + GeForce 9800 GT 512 Мбайт и Pentium E6300 + GeForce GTX 260 896 Мбайт.

Как видно, одна система с мощным процессором и слабой видеокартой, а вторая наоборот — со слабым CPU и мощным GPU.

Все игры тестировались в разрешениях 1280х1024 и 1680х1050. В разрешении 1280х1024 система на базе Core 2 Duo E8400 и GeForce 9800 GT 512 Мбайт получит преимущество за счет мощного процессора.

В более высоком разрешении — 1680х1050 — нагрузка в основном ляжет на видеокарту, поэтому вследствие возросшей роли графического адаптера майку лидера, предположительно, должна получить конфигурация с Pentium E6300 + GeForce GTX 260 896 Мбайт.

В недавней статье «Сводное тестирование процессоров Core 2 Quad Q9550/Q9400/Q8300, Core 2 Duo E8400/E7600 и Pentium E6500/E5400 в играх» было выявлено немало игр, в которых процессор оказывает значительное влияние на производительность компьютера даже в высоких разрешениях, поэтому особенно интересно, чем закончится сегодняшнее противостояние.

Мы не стали тестировать данные связки в разрешении 1920х1080, так как у видеокарты GeForce 9800 GT 512 Мбайт по естественным причинам в нем могли возникнуть проблемы с производительностью.

Это можно посчитать существенным недостатком, но цель нашего исследования — не определить победителя в сегодняшнем противостоянии двух разных систем, а выявить основные тенденции и ответить на вопрос, что важнее при выборе «железа» для игр: процессор или видеокарта.

В следующих играх использовались средства измерения быстродействия (бенчмарк):

  • Batman: Arkham Asylum
  • Colin McRae: DIRT 2
  • Crysis Warhead (ambush)
  • Far Cry 2 (ranch small)
  • Lost Planet: Colonies (area1)
  • Resident Evil 5 (scene 1)
  • S.T.A.L.K.E.R.: Call of Pripyat (SunShafts)
  • World in Conflict: Soviet Assault

Игра, в которой производительность замерялась путем загрузки демо сцен:

В данных играх производительность измерялась с помощью утилиты FRAPS v3.2.0 build 11412:

  • Avatar
  • Borderlands
  • Call of Duty: Modern Warfare 2
  • Dragon Age: Origins
  • Fallout 3: Broken Steel
  • Grand Theft Auto 4
  • Need for Speed: SHIFT
  • Prototype
  • Race Driver: GRID
  • Risen
  • Sacred 2: Ice & Blood

Во всех играх замерялись минимальные и средние значения FPS.

В тестах, в которых отсутствовала возможность замера минимального FPS, это значение измерялось утилитой FRAPS.

VSync при проведении тестов был отключен.

Чтобы избежать ошибок и минимизировать погрешности измерений, все тесты производились по три раза. При вычислении среднего FPS за итоговый результат бралось среднеарифметическое значение результатов всех прогонов. В качестве минимального FPS выбиралось минимальное значение показателя по результатам трех прогонов.

Тестирование конфигураций проводилось в двух режимах работы:

  • В номинальном — Core 2 Duo E8400 @ 3000 МГц, 4 GB RAM @ 800 МГц (тайминги 6-6-6-18-2t), GeForce 9800 GT 512 Мбайт — 600/1500/1800 МГц и Pentium E6300 @ 2800 МГц, 4 GB RAM @ 800 МГц (тайминги 6-6-6-18-2t), GeForce GTХ 260 896 Мбайт — 576/1242/2000 МГц.
  • После разгона

Источник: https://overclockers.ru/lab/show/36629/otvechaem-na-vopros-chto-vazhnee-dlya-igr-cpu-ili-gpu

Разница между CPU и GPU в параллельных расчётах

Сохрани ссылку в одной из сетей:

Разница между CPU и GPU в параллельных расчётах

Рост частот универсальных процессоров упёрся в физические ограничения и высокое энергопотребление, и увеличение их производительности всё чаще происходит за счёт размещения нескольких ядер в одном чипе.

Продаваемые сейчас процессоры содержат лишь до четырёх ядер (дальнейший рост не будет быстрым) и они предназначены для обычных приложений, используют MIMD — множественный поток команд и данных.

Каждое ядро работает отдельно от остальных, исполняя разные инструкции для разных процессов.

Специализированные векторные возможности (SSE2 и SSE3) для четырехкомпонентных (одинарная точность вычислений с плавающей точкой) и двухкомпонентных (двойная точность) векторов появились в универсальных процессорах из-за возросших требований графических приложений, в первую очередь. Именно поэтому для определённых задач применение GPU выгоднее, ведь они изначально сделаны для них.

Например, в видеочипах NVIDIA основной блок — это мультипроцессор с восемью-десятью ядрами и сотнями ALU в целом, несколькими тысячами регистров и небольшим количеством разделяемой общей памяти. Кроме того, видеокарта содержит быструю глобальную память с доступом к ней всех мультипроцессоров, локальную память в каждом мультипроцессоре, а также специальную память для констант.

Самое главное — эти несколько ядер мультипроцессора в GPU являются SIMD (одиночный поток команд, множество потоков данных) ядрами.

И эти ядра исполняют одни и те же инструкции одновременно, такой стиль программирования является обычным для графических алгоритмов и многих научных задач, но требует специфического программирования.

Зато такой подход позволяет увеличить количество исполнительных блоков за счёт их упрощения.

Итак, перечислим основные различия между архитектурами CPU и GPU.

1) Ядра CPU созданы для исполнения одного потока последовательных инструкций с максимальной производительностью, а GPU проектируются для быстрого исполнения большого числа параллельно выполняемых потоков инструкций.

Универсальные процессоры оптимизированы для достижения высокой производительности единственного потока команд, обрабатывающего и целые числа и числа с плавающей точкой. При этом доступ к памяти случайный.

2) Разработчики CPU стараются добиться выполнения как можно большего числа инструкций параллельно, для увеличения производительности.

Для этого, начиная с процессоров Intel Pentium, появилось суперскалярное выполнение, обеспечивающее выполнение двух инструкций за такт, а Pentium Pro отличился внеочередным выполнением инструкций.

Но у параллельного выполнения последовательного потока инструкций есть определённые базовые ограничения и увеличением количества исполнительных блоков кратного увеличения скорости не добиться.

У видеочипов работа простая и распараллеленная изначально. Видеочип принимает на входе группу полигонов, проводит все необходимые операции, и на выходе выдаёт пиксели. Обработка полигонов и пикселей независима, их можно обрабатывать параллельно, отдельно друг от друга.

Поэтому, из-за изначально параллельной организации работы в GPU используется большое количество исполнительных блоков, которые легко загрузить, в отличие от последовательного потока инструкций для CPU. Кроме того, современные GPU также могут исполнять больше одной инструкции за такт (dual issue).

Так, архитектура Tesla в некоторых условиях запускает на исполнение операции MAD+MUL или MAD+SFU одновременно.

3) GPU отличается от CPU ещё и по принципам доступа к памяти. В GPU он связанный и легко предсказуемый — если из памяти читается тексель текстуры, то через некоторое время придёт время и для соседних текселей.

Да и при записи то же — пиксель записывается во фреймбуфер, и через несколько тактов будет записываться расположенный рядом с ним. Поэтому организация памяти отличается от той, что используется в CPU.

И видеочипу, в отличие от универсальных процессоров, просто не нужна кэш-память большого размера, а для текстур требуются лишь несколько (до 128-256 в нынешних GPU) килобайт.

4) Да и сама по себе работа с памятью у GPU и CPU несколько отличается.

Так, не все центральные процессоры имеют встроенные контроллеры памяти, а у всех GPU обычно есть по несколько контроллеров, вплоть до восьми 64-битных каналов в чипе NVIDIA GT200.

Кроме того, на видеокартах применяется более быстрая память, и в результате видеочипам доступна в разы большая пропускная способность памяти, что также весьма важно для параллельных расчётов, оперирующих с огромными потоками данных.

В универсальных процессорах большие количества транзисторов и площадь чипа идут на буферы команд, аппаратное предсказание ветвления и огромные объёмы начиповой кэш-памяти. Все эти аппаратные блоки нужны для ускорения исполнения немногочисленных потоков команд.

Видеочипы тратят транзисторы на массивы исполнительных блоков, управляющие потоками блоки, разделяемую память небольшого объёма и контроллеры памяти на несколько каналов.

Вышеперечисленное не ускоряет выполнение отдельных потоков, оно позволяет чипу обрабатывать нескольких тысяч потоков, одновременно исполняющихся чипом и требующих высокой пропускной способности памяти.

5) Есть также отличия в кэшировании. Универсальные центральные процессоры используют кэш-память для увеличения производительности за счёт снижения задержек доступа к памяти, а GPU используют кэш или общую память для увеличения полосы пропускания.

CPU снижают задержки доступа к памяти при помощи кэш-памяти большого размера, а также предсказания ветвлений кода. Эти аппаратные части занимают большую часть площади чипа и потребляют много энергии.

Видеочипы обходят проблему задержек доступа к памяти при помощи одновременного исполнения тысяч потоков — в то время, когда один из потоков ожидает данных из памяти, видеочип может выполнять вычисления другого потока без ожидания и задержек.

6) Есть множество различий и в поддержке многопоточности. CPU исполняет 1-2 потока вычислений на одно процессорное ядро, а видеочипы могут поддерживать до 1024 потоков на каждый мультипроцессор, которых в чипе несколько штук. И если переключение с одного потока на другой для CPU стоит сотни тактов, то GPU переключает несколько потоков за один такт.

7) Кроме того, центральные процессоры используют SIMD (одна инструкция выполняется над многочисленными данными) блоки для векторных вычислений, а видеочипы применяют SIMT (одна инструкция и несколько потоков) для скалярной обработки потоков. SIMT не требует, чтобы разработчик преобразовывал данные в векторы, и допускает произвольные ветвления в потоках.

Вкратце можно сказать, что в отличие от современных универсальных CPU, видеочипы предназначены для параллельных вычислений с большим количеством арифметических операций.

И значительно большее число транзисторов GPU работает по прямому назначению — обработке массивов данных, а не управляет исполнением (flow control) немногочисленных последовательных вычислительных потоков.

Это схема того, сколько места в CPU и GPU занимает разнообразная логика: 

В итоге, основой для эффективного использования мощи GPU в научных и иных неграфических расчётах является распараллеливание алгоритмов на сотни исполнительных блоков, имеющихся в видеочипах.

К примеру, множество приложений по молекулярному моделированию отлично приспособлено для расчётов на видеочипах, они требуют больших вычислительных мощностей и поэтому удобны для параллельных вычислений.

А использование нескольких GPU даёт ещё больше вычислительных мощностей для решения подобных задач.

Выполнение расчётов на GPU показывает отличные результаты в алгоритмах, использующих параллельную обработку данных. То есть, когда одну и ту же последовательность математических операций применяют к большому объёму данных.

При этом лучшие результаты достигаются, если отношение числа арифметических инструкций к числу обращений к памяти достаточно велико.

Это предъявляет меньшие требования к управлению исполнением (flow control), а высокая плотность математики и большой объём данных отменяет необходимость в больших кэшах, как на CPU.

В результате всех описанных выше отличий, теоретическая производительность видеочипов значительно превосходит производительность CPU. Компания NVIDIA приводит такой график роста производительности CPU и GPU за последние несколько лет: 

Естественно, эти данные не без доли лукавства. Ведь на CPU гораздо проще на практике достичь теоретических цифр, да и цифры приведены для одинарной точности в случае GPU, и для двойной — в случае CPU. В любом случае, для части параллельных задач одинарной точности хватает, а разница в скорости между универсальными и графическими процессорами весьма велика, и поэтому овчинка стоит выделки.

Источник: http://works.doklad.ru/view/wLI8tv9_4s0.html

Ссылка на основную публикацию