Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Графические ускорители. Особенности организации памяти и вычислений. Шейдеры




(Пишу по его слайдам, хотя я-бы все по другому писал)

Состав: Графический процессор, Видеоконтроллер, Видео-ПЗУ, Видеопамять, Цифро-аналоговый преобразователь (ЦАП) (RAMDAC-Random Access Memory Digital-to-Analog Converter), Интерфейс вывода на монитор, Система охлаждения.

Графика с разделяемой памятью (Shared graphics, Shared Memory Architecture). Видеопамять в виде специализированных ячеек как таковая отсутствует; вместо этого под нужды видеоадаптера динамически выделяется область основной оперативной памяти компьютера. (интегрированные видеокарты, являющиеся частью северного моста). Преимущества данного решения — низкая цена и малое энергопотребление. Недостатки — невысокая производительность в 3D-графике и отрицательное влияние на пропускную способность памяти.

Дискретная графика (Dedicated graphics). Есть своя видеопамять. Дискретная графика обеспечивает наивысшую производительность в трёхмерной графике. (выполнены в виде отдельных плат)Недостатки: более высокая цена и большее энергопотребление. Гибридная дискретная графика (Hybrid graphics). Комбинация вышеназванных способов, ставшая возможной с появлением шины PCIExpress. Небольшой объём физически распаянной на плате видеопамяти, который может расширяться за счёт использования основной оперативной памяти(ОЗУ).

Специализированные видеокарты. Применяются для высокопроизводительных вычислений. Для вывода изображения на монитор не используется.

Характеристики Видеокарт:

ширина шины памяти, измеряется в битах — количество бит информации, передаваемой за такт. Важный параметр в производительности карты.

объём видеопамяти, измеряется в мегабайтах — объём собственной оперативной памяти видеокарты. частота ядра — измеряются в мегагерцах

частота памяти — измеряются в мегагерцах

текстурная скорость заполнения, измеряется в млн. пикселов в секунду, показывает количество выводимой информации в единицу времени

пиксельная скорость заполнения, измеряется в млн. пикселов в секунду, показывает количество выводимой информации в единицу времени.

Шейдер. Шейдером в широком смысле называется программа для визуального определения поверхности объекта.

Вершинные шейдеры (Vertex Shader)Вершинный шейдер оперирует данными, сопоставленными с вершинами многогранников. К таким данным, в частности, относятся координаты вершины в пространстве, текстурные координаты, тангенс-вектор, вектор бинормали, вектор нормали. Вершинный шейдер может быть использован для видового и перспективного преобразования вершин, генерации текстурных координат, расчета освещения и т. д.

Геометрические шейдеры (Geometry Shader)Геометрический шейдер, в отличие от вершинного, способен обработать не только одну вершину, но и целый примитив. Это может быть отрезок (две вершины) и треугольник (три вершины), а при наличии информации о смежных вершинах (adjacency) может быть обработано до шести вершин для треугольного примитива. Кроме того, геометрический шейдер способен генерировать примитивы «на лету», не задействуя при этом центральный процессор. Впервые начал использоваться на видеокартах Nvidia серии 8.

Пиксельные шейдеры (Pixel Shader)Фрагментный шейдер работает с фрагментами изображения. Под фрагментом изображения в данном случае понимается пиксель, которому поставлен в соответствие некоторый набор атрибутов, таких как цвет, глубина, текстурные координаты. Фрагментный шейдер используется на последней стадии графического конвейера для формирования фрагмента изображения.

Это я сам написал кратко:

Для GPGPU (произвольные вычисления на графических процессорных устройствах). Есть язык OpenCL (открытый, разрабатывается AMD), CUDA (частично открытый, разрабатывается NVIDIA).

Модель использования — либо использование одноуровневых сред (thrust, boost), либо использование библиотек (CUBLAS, CUFFT и т. д.) либо написание программ самому. Поддерживают пока только С. Формат написания — ядра, выполняемые на GPU. Память должна быть скопирована на GPU (в последних версиях есть общая память — pinned memory).

Почему видео карты хорошо для вычислений — такая вот архитектура:

 
 

 


7. Способы организации высокопроизводительных процессоров: Ассоциативные процессоры. Клеточные и ДНК-процессоры. Нейронные процессоры. Процессоры с нечеткой логикой. Основные принципы функционирования, предпосылки развития альтернативных способов организации МВС, текущие трудности в реализации.

Ассоциативные процессоры Относятся к классу SIMD. Адресация памяти по содержимому. АЗУ – Ассоциативное Запоминающее Устройство. Ассоциативный способ обработки данных позволяет преодолеть многие ограничения, присущие адресному доступу к памяти, за счет задания некоторого критерия отбора и проведение требуемых преобразований, только над теми данными, которые удовлетворяют этому критерию. Критерием отбора может быть совпадение с любым элементом данных, достаточным для выделения искомых данных из всех данных. Поиск данных может происходить по фрагменту, имеющему большую или меньшую корреляцию с заданным элементом данных.

 

Клеточные и ДНК-процессоры. В настоящее время в поисках реальной альтернативы полупроводниковым технологиям создания новых вычислительных систем ученые обращают все большее внимание на биотехнологии, или биокомпьютинг, который представляет собой гибрид информационных, молекулярных технологий, также биохимии.

(ЭТО ИНТЕРЕСНО) Так же, как и любой другой процессор, ДНК процессор характеризуется структурой и набором команд. В нашем случае структура процессора - это структура молекулы ДНК. А набор команд - это перечень биохимических операций с молекулами. Принцип устройства компьютерной ДНК-памяти основан на последовательном соединении четырех нуклеотидов (основных кирпичиков ДНК-цепи). Три нуклеотида, соединяясь в любой последовательности, образуют элементарную ячейку памяти - кодон, которые затем формируют цепь ДНК. Теоретическое обоснование подобной возможности было сделано еще в 50-х годах прошлого века (Р.П. Фейманом). В деталях эта теория была проработана в 70-х годах Ч. Бенеттом и в 80-х М. Конрадом. Первый компьютер на базе ДНК был создан еще в 1994 г. американским ученым Леонардом Адлеманом. Он смешал в пробирке молекулу ДНК, в которой были закодированы исходные данные, и специальным образом подобранные ферменты. В результате химической реакции структура ДНК изменилась таким образом, что в ней в закодированном виде был представлен ответ задачи. Поскольку вычисления проводились в ходе химической реакции с участием ферментов, на них было затрачено очень мало времени.В конце февраля 2002 г. появилось сообщение, что фирма Olympus Optical претендует на первенство в создании коммерческой версии ДНК-компьютера, предназначенного для генетического анализа. Машина была создана в сотрудничестве с доцентом Токийского университета Акирой Тояма.
Компьютер, построенный Olympus Optical, имеет молекулярную и электронную составляющие. Первая осуществляет химические реакции между молекулами ДНК, обеспечивает поиск и выделение результата вычислений. Вторая - обрабатывает информацию и анализирует полученные результаты.
Возможностями биокомпьютеров заинтересовались и военные. Американское агентство по исследованиям в области обороны DARPA выполняет проект, получивший название Bio-Comp (Biological Computations, биологические вычисления). Его цель - создание мощных вычислительных систем на основе ДНК.

Достоинства:

более простая технология изготовления, не требующая для своей реализации столь жестких условий, как при производстве полупроводников;

использование не бинарного, а тернарного кода (информация кодируется тройками нуклеотидов), что позволит за меньшее количество шагов перебрать большее число вариантов при анализе сложных систем;

потенциально исключительно высокая производительность, которая может составлять до 1014 операций в секунду за счет одновременного вступления в реакцию триллионов молекул ДНК;

возможность хранить данные с плотностью, в триллионы раз превышающей показатели оптических дисков;

исключительно низкое энергопотребление.

Недостатки:

сложность со считыванием результатов – современные способы определения кодирующей последовательности несовершенны, сложны, трудоемки и дороги;

низкая точность вычислений, связанная с возникновением мутаций, прилипанием молекул к стенкам сосудов и т.д.;

невозможность длительного хранения результатов вычислений в связи с распадом ДНК в течение времени.

Клеточные компьютеры представляют собой самоорганизующиеся колонии различных "умных" микроорганизмов, в геном которых удалось включить некую логическую схему, которая могла бы активизироваться в присутствии определенного вещества. Для этой цели идеально подошли бы бактерии, стакан с которыми и представлял бы собой компьютер. Такие компьютеры очень дешевы в производстве. Им не нужна столь стерильная атмосфера, как при производстве полупроводников. Главным свойством компьютера такого рода является то, что каждая их клетка представляет собой миниатюрную химическую лабораторию. Если биоорганизм запрограммирован, то он просто производит нужные вещества. Достаточно вырастить одну клетку, обладающую заданными качествами, и можно легко и быстро вырастить тысячи клеток с такой же программой. Основная проблема, с которой сталкиваются создатели клеточных биокомпьютеров, - организация всех клеток в единую работающую систему. На сегодняшний день практические достижения в области клеточных компьютеров напоминают достижения 20-х годов в области ламповых и полупроводниковых компьютеров.

Искусственные нейронные сети (фуфел =))

Нейроны группируются в последовательность слоев; входные сигналы поступают на первый слой и последовательно проходят через все слои до последнего, выходного слоя сети. Но бывают и рекуррентные (с циклами) структуры, обеспечивающие циркуляцию некоторого набора внутренних сигналов.

Искусственная нейросеть, может обучаться: она содержит внутренние адаптивные параметры нейронов и своей структуры, и, меняя их, может менять свое поведение, добиваясь улучшения точности решения некоторой задачи.

Обучение или настройка нейронной сети: при переходе к новой задаче не нужно заново программировать алгоритм - можно просто взять универсальный нейросетевой инструмент и в нём создать и обучить нейросеть.

Нейронная сеть обучается решению задачи на некотором наборе ситуаций, каждая из которых описывает значения входных сигналов нейросети и требуемый при этих входных сигналах ответ.

Кроме обучения с учителем (на основе знаний об известных эталонных ответах для некоторого набора ситуаций) возможно и обучение без учителя − при этом происходит анализ описаний ситуаций и ищутся те или иные тенденции (например, похожие ситуации объединяются в группы так, чтобы данные внутри группы были больше похожи друг на друга, чем на данные из другой группы).

Нейронная сеть способна обучаться решению задач, для которых не существует формализованных, быстрых или работающих с приемлемой точностью теоретических или эмпирических алгоритмов.

Структура нейросети может быть адаптирована к задаче.

Процессоры с нечеткой логикой. Идея построения процессоров с нечеткой логикой (fuzzy logic) основывается на нечеткой математике. Подходы нечёткой математики дают возможность оперировать входными данными, непрерывно меняющимися во времени и значениями, которые невозможно задать однозначно, такими, например, как результаты статистических опросов. В отличие от традиционной формальной логики, известной со времен Аристотеля и оперирующей точными и четкими понятиями типа истина и ложь, да и нет, ноль и единица, нечеткая логика имеет дело со значениями, лежащими в некотором (непрерывном или дискретном) диапазоне. Согласно знаменитой теореме FAT (Fuzzy Approximation Theorem), доказанной Коско, любая математическая система может быть аппроксимирована системой, основанной на нечеткой логике. Свое второе рождение теория нечеткой логики пережила в начале восьмидесятых годов, когда сразу несколько групп исследователей (в основном в США и Японии) всерьез занялись созданием электронных систем различного применения, использующих нечеткие управляющие алгоритмы. Используя преимущества нечеткой логики, заключающиеся в простоте содержательного представления, можно упростить проблему, представить ее в более доступном виде и повысить производительность системы.

Задачи с помощью нечёткой логики решаются по следующему принципу: 1) численные данные (показания измерительных приборов, результаты анкетирования) фаззируются (переводятся в нечеткий формат); 2) обрабатываются по определённым правилам; 3) дефаззируются и в виде привычной информации подаются на выход.

Идеи нечеткой логики не являются панацеей и не смогут совершить переворот в компьютерном мире. Нечеткая логика не решит тех задач, которые не решаются на основе логики двоичной, но во многих случаях она удобнее, производительнее и дешевле. Разработанные на ее основе специализированные аппаратные решения (fuzzy-вычислители) позволят получить реальные преимущества в быстродействии. Если каскадировать fuzzy-вычислители, мы получим один из вариантов нейропроцессора или нейронной сети. Во многих случаях эти понятия просто объединяют, называя общим термином “neuro-fuzzy logic”. В настоящее время перспективой использовать процессоры, основанные на нечеткой логике всерьез заитересовались военные. Известно, что NASA рассматривает возможность применения (если еще не применяет) нечеткие системы для управления процессами стыковки космических аппаратов.




Поделиться с друзьями:


Дата добавления: 2015-01-03; Просмотров: 1690; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.017 сек.