Суперскалярная архитектура

История

Современные ЦП, выполняемые в виде отдельных микросхем (чипов), реализующих все особенности, присущие данного рода устройствам, именуют процессорами. С середины 1980-х последние фактически вытеснили остальные виды ЦП, вследствие чего термин стал всё почаще и почаще восприниматься как обычный синоним слова «микропроцессор». Все же, это не так: центральные процессорные устройства неких суперкомпьютеров Суперскалярная архитектура даже сейчас представляют собой сложные комплексы, построенные на базе микросхем большой (БИС) и сверхбольшой (СБИС) степени интеграции.

Вначале термин центральное процессорное устройство описывал спец класс логических машин, созданных для выполнения сложных компьютерных программ. Вследствие достаточно четкого соответствия этого предназначения функциям существовавших в то время компьютерных микропроцессоров, он естественным образом был перенесён Суперскалярная архитектура на сами компы. Начало внедрения термина и его аббревиатуры по отношению к компьютерным системам было положено в 1960-е годы. Устройство, архитектура и реализация микропроцессоров с того времени не один раз изменялись, но их главные исполняемые функции остались теми же, что и до этого.

Ранешние ЦП создавались в Суперскалярная архитектура виде уникальных составных частей для уникальных, и даже единственных в своём роде, компьютерных систем. Позже от дорогостоящего метода разработки микропроцессоров, созданных для выполнения одной единственной либо нескольких узкоспециализированных программ, производители компов перебежали к серийному изготовлению типовых классов многоцелевых процессорных устройств. Тенденция к стандартизации компьютерных девайсов зародилась в эру бурного развития Суперскалярная архитектура полупроводниковых частей, мейнфреймов и миникомпьютеров, а с возникновением интегральных схем она стала ещё более пользующейся популярностью. Создание микросхем позволило ещё больше прирастить сложность ЦП с одновременным уменьшением их физических размеров. Стандартизация и миниатюризация микропроцессоров привели к глубочайшему проникновению основанных на их цифровых устройств в ежедневную жизнь человека. Современные микропроцессоры Суперскалярная архитектура можно отыскать не только лишь в таких сверхтехнологичных устройствах, как компы, да и в автомобилях, калькуляторах, мобильных телефонах и даже в детских игрушках. В большинстве случаев они представлены микроконтроллерами, где кроме вычислительного устройства на кристалле размещены дополнительные составляющие (память программ и данных, интерфейсы, порты ввода/вывода, таймеры Суперскалярная архитектура и др.). Современные вычислительные способности микроконтроллера сравнимы с микропроцессорами индивидуальных ЭВМ десятилетней давности, а почаще даже существенно превосходят их характеристики.

Архитектура фон Неймана

Большая часть современных микропроцессоров для индивидуальных компов в общем основаны на той либо другой версии повторяющегося процесса поочередной обработки данных, изобретённого Джоном фон Нейманом.

Дж. фон Нейман выдумал схему постройки Суперскалярная архитектура компьютера в 1946 году.

Отличительной особенностью архитектуры фон Неймана будет то, что аннотации и данные хранятся в одной и той же памяти.

Этапы цикла выполнения:

Микропроцессор выставляет число, хранящееся в регистре счётчика команд, на шину адреса и отдаёт памяти команду чтения.

Выставленное число является для памяти адресом; память, получив Суперскалярная архитектура адресок и команду чтения, выставляет содержимое, хранящееся по этому адресу, на шину данных и докладывает о готовности.

Микропроцессор получает число с шины данных, интерпретирует его как команду (машинную аннотацию) из собственной системы команд и исполняет её.

Если последняя команда не является командой перехода, микропроцессор наращивает на единицу (в Суперскалярная архитектура предположении, что длина каждой команды равна единице) число, хранящееся в счётчике команд; в итоге там появляется адресок последующей команды.

Данный цикл производится постоянно, и конкретно он именуется процессом (откуда и вышло заглавие устройства).

Во время процесса микропроцессор считывает последовательность команд, содержащихся в памяти, и исполняет их. Такая последовательность Суперскалярная архитектура команд именуется программкой и представляет метод работы микропроцессора. Очерёдность считывания команд меняется в случае, если микропроцессор считывает команду перехода, — тогда адресок последующей команды возможно окажется другим. Другим примером конфигурации процесса может служить случай получения команды останова либо переключение в режим обработки прерывания.

Команды центрального микропроцессора являются самым нижним уровнем управления Суперскалярная архитектура компом, потому выполнение каждой команды безизбежно и непременно. Не делается никакой проверки на допустимость выполняемых действий, а именно, не проверяется вероятная утрата ценных данных. Чтоб компьютер делал только допустимые деяния, команды должны быть подходящим образом организованы в виде нужной программки.

Скорость перехода от 1-го шага цикла к другому определяется Суперскалярная архитектура тактовым генератором. Тактовый генератор производит импульсы, служащие ритмом для центрального микропроцессора. Частота тактовых импульсов именуется тактовой частотой.

Конвейерная архитектура

Конвейерная архитектура (pipelining) была введена в центральный микропроцессор с целью увеличения быстродействия. Обычно для выполнения каждой команды требуется выполнить некое количество однотипных операций, к примеру: подборка команды из ОЗУ, дешифровка команды, адресация Суперскалярная архитектура операнда в ОЗУ, подборка операнда из ОЗУ, выполнение команды, запись результата в ОЗУ. Каждую из этих операций сопоставляют одной ступени сборочного потока. К примеру, сборочный поток процессора с архитектурой MIPS-I содержит четыре стадии:

получение и декодирование аннотации,

адресация и подборка операнда из ОЗУ,

выполнение арифметических операций Суперскалярная архитектура,

сохранение результата операции.

После освобождения k-й ступени сборочного потока она сходу приступает к работе над последующей командой. Если представить, что любая ступень сборочного потока растрачивает единицу времени на свою работу, то выполнение команды на конвейере длиной в n ступеней займёт n единиц времени, но в самом оптимистичном случае итог Суперскалярная архитектура выполнения каждой последующей команды будет получаться через каждую единицу времени.

Вправду, при отсутствии сборочного потока выполнение команды займёт n единиц времени (потому что для выполнения команды как и раньше нужно делать подборку, дешифровку и т. д.), и для выполнения m команд пригодится единиц времени; при использовании сборочного потока Суперскалярная архитектура (в самом оптимистичном случае) для выполнения m команд пригодится всего только n + m единиц времени.

Причины, снижающие эффективность сборочного потока:

Обычной сборочного потока, когда некие ступени не употребляются (напр., адресация и подборка операнда из ОЗУ не необходимы, если команда работает с регистрами).

Ожидание: если последующая команда употребляет итог предшествующей, то последняя не Суперскалярная архитектура может начать производиться до выполнения первой (это преодолевается при использовании внеочередного выполнения команд — out-of-order execution).

Чистка сборочного потока при попадании в него команды перехода (эту делему удаётся сгладить, используя пророчество переходов).

Некие современные микропроцессоры имеют более 30 ступеней в конвейере, что наращивает производительность микропроцессора, но приводит к большенному Суперскалярная архитектура времени простоя (к примеру, в случае ошибки в пророчестве условного перехода). Не существует одного представления по поводу хорошей длины сборочного потока: разные программки могут иметь значительно разные требования.

Суперскалярная архитектура

Способность выполнения нескольких машинных инструкций за один такт микропроцессора методом роста числа исполнительных устройств. Возникновение этой технологии Суперскалярная архитектура привело к существенному повышению производительности. В то же время существует определенный предел роста числа исполнительных устройств, при превышении которого производительность фактически перестает расти, а исполнительные устройства простаивают. Частичным решением этой задачи являются, к примеру, разработка Hyper Threading.

CISC-процессоры

Complex instruction set computer — вычисления со сложным набором команд. Процессорная архитектура, основанная на усложнённом Суперскалярная архитектура наборе команд. Обычными представителями CISC являются процессоры семейства x86 (хотя уже много лет эти микропроцессоры являются CISC только по наружной системе команд: сначала процесса выполнения сложные команды разбиваются на более обыкновенные микрооперации (МОП'ы), исполняемые RISC-ядром).

RISC-процессоры

Reduced instruction set computer — вычисления с упрощённым набором команд (в литературе Суперскалярная архитектура слово «reduced» часто неверно переводят как «сокращённый»). Архитектура микропроцессоров, построенная на базе упрощённого набора команд, характеризуется наличием команд фиксированной длины, огромного количества регистров, операций типа регистр-регистр, также отсутствием косвенной адресации. Концепция RISC разработана Джоном Коком (John Cocke) из IBM Research, заглавие выдумано Дэвидом Паттерсоном (David Patterson Суперскалярная архитектура).

Упрощение набора команд призвано уменьшить сборочный поток, что дает возможность избежать задержек на операциях условных и бесспорных переходов. Однородный набор регистров упрощает работу компилятора при оптимизации исполняемого программного кода. Не считая того, RISC-процессоры отличаются наименьшим энергопотреблением и тепловыделением.

Посреди первых реализаций этой архитектуры были микропроцессоры MIPS, PowerPC, SPARC Суперскалярная архитектура, Alpha, PA-RISC. В мобильных устройствах обширно употребляются ARM-процессоры.

MISC-процессоры

Minimum instruction set computer — вычисления с наименьшим набором команд. Предстоящее развитие мыслях команды Чака Мура, который считает, что принцип простоты, изначальный для RISC-процессоров, очень стремительно отошёл на задний план. В пылу борьбы за наибольшее быстродействие, RISC догнал Суперскалярная архитектура и перегнал многие CISC микропроцессоры по трудности. Архитектура MISC строится на стековой вычислительной модели с ограниченным числом команд (приблизительно 20-30 команд).

VLIW-процессоры

[Very long instruction word — сверхдлинное командное слово. Архитектура микропроцессоров с очевидно выраженным параллелизмом вычислений, заложенным в систему команд микропроцессора. Являются основой для архитектуры EPIC. Главным различием от Суперскалярная архитектура суперскалярных CISC-процессоров будет то, что для их загрузкой исполнительных устройств занимается часть микропроцессора (планировщик), на что отводится довольно маленькое время, в то время как загрузкой вычислительных устройств для VLIW-процессора занимается компилятор, на что отводится значительно больше времени (качество загрузки и, соответственно, производительность на теоретическом уровне должны быть выше). Примером Суперскалярная архитектура VLIW-процессора является Intel Itanium.

Многоядерные микропроцессоры

Содержат несколько процессорных ядер в одном корпусе (на одном либо нескольких кристаллах).

Микропроцессоры, созданные для работы одной копии операционной системы на нескольких ядрах, представляют собой высокоинтегрированную реализацию мультипроцессорности.

Первым многоядерным процессором стал POWER4 от IBM, показавшийся в 2001 и имевший два ядра.

В октябре Суперскалярная архитектура 2004 Sun Microsystems выпустила двухъядерный микропроцессор UltraSPARC IV, который состоял из 2-ух измененных ядер UltraSPARC III. Сначала 2005 был сотворен двухъядерный UltraSPARC IV+.

14 ноября 2005 года Sun выпустила восьмиядерный UltraSPARC T1, каждое ядро которого делало 4 потока.

5 января 2006 года Intel представила 1-ый двухъядерный микропроцессор на одном кристалле Core Duo, для мобильной платформы

10 сентября 2007 года Суперскалярная архитектура были выпущены в продажу навивные (в виде 1-го кристалла) четырёхъядерные микропроцессоры для серверов AMD Opteron, имевшие в процессе разработки кодовое заглавие AMD Opteron Barcelona.[1] 19 ноября 2007 года вышел в продажу четырёхъядерный микропроцессор для домашних компов AMD Phenom.[2] Эти микропроцессоры реализуют новейшую микроархитектуру K8L (K10).

В октябре 2007 года в Суперскалярная архитектура продаже появились восьмиядерные UltraSPARC T2, каждое ядро делало 8 потоков.

В марте 2010 года компания AMD выпустила 1-ые в мире 12-ядерные серверные микропроцессоры Opteron 6100 архитектуры x86[3].

Сейчас массово доступны двух-, четырёх- и шестиядерные микропроцессоры, а именно Intel Core 2 Duo на 65-нм ядре Conroe (позже на 45-нм ядре Wolfdale) и Athlon 64 X2 на базе Суперскалярная архитектура микроархитектуры K8. В ноябре 2006 года вышел 1-ый четырёхъядерный микропроцессор Intel Core 2 Quad на ядре Kentsfield, представляющий из себя сборку из 2-ух кристаллов Conroe в одном корпусе. Потомком этого микропроцессора стал Intel Core 2 Quad на ядре Yorkfield (45 нм), архитектурно похожем с Kentsfield но имеющем больший объём кэша Суперскалярная архитектура и рабочие частоты.

Компания AMD пошла по собственному пути, изготовляя четырёхъядерные микропроцессоры единым кристаллом (в отличие от Intel, 1-ые четырехъядерные микропроцессоры которой представляют собой практически клейку 2-ух двухъядерных кристаллов). Невзирая на всю прогрессивность подобного подхода 1-ый «четырёхъядерник» компании, получивший заглавие AMD Phenom X4, вышел не очень удачным. Его отставание от современных Суперскалярная архитектура ему микропроцессоров соперника составляло от 5 до 30 и поболее процентов зависимо от модели и определенных задач.

К 1-2 кварталу 2009 года обе компании обновили свои линейки четырёхъядерных микропроцессоров. Intel представила семейство Core i7, состоящее из трёх моделей, работающих на различных частотах. Основными изюминками данного микропроцессора является внедрение трёхканального контроллера памяти (типа DDR Суперскалярная архитектура-3) и технологии эмулирования восьми ядер (полезно для неких специфичных задач). Не считая того, благодаря общей оптимизации архитектуры удалось существенно повысить производительность микропроцессора в почти всех типах задач. Слабенькой стороной платформы, использующей Core i7, является её чрезмерная цена, потому что для установки данного микропроцессора нужна дорогая материнская плата на чипсете Суперскалярная архитектура Intel X58 и трёхканальный набор памяти типа DDR3, также имеющий сейчас высшую цена.

Компания AMD в свою очередь представила линейку микропроцессоров Phenom II X4. При её разработке компания учла свои ошибки: был увеличен объём кэша (очевидно недостающий у первого «Фенома»), а создание микропроцессора было переведено на 45-нм техпроцесс, позволивший Суперскалярная архитектура понизить тепловыделение и существенно повысить рабочие частоты. В целом, AMD Phenom II X4 по производительности стоит вровень с микропроцессорами Intel предшествующего поколения (ядро Yorkfield) и очень существенно отстаёт от Intel Core i7[источник не указан 493 дня]. Но, с выходом микропроцессора AMD Phenom II X6 Black Thuban 1090T Суперскалярная архитектура ситуация существенно поменялось в пользу AMD. Этот микропроцессор по стоимости стоит на уровне intel core i7 930, но может потягаться с линейкой микропроцессоров intel core i7 в плане производительности. Его всеполноценных 6 ядер отлично подходят для сложных многопоточных задач.

Кэширование

Кэширование — это внедрение дополнительной быстродействующей памяти (кэша) для хранения копий блоков инфы из Суперскалярная архитектура основной (оперативной) памяти, возможность воззвания к которым в последнее время велика.

Различают кэши 1-, 2- и 3-го уровней (обозначаются L1, L2 и L3 — от Level 1, Level 2 и Level 3). Кэш 1-го уровня имеет меньшую латентность (время доступа), но малый размер, не считая того, кэши первого уровня нередко делаются многопортовыми. Так, микропроцессоры Суперскалярная архитектура AMD K8 умели создавать сразу 64-битные запись и чтение, или два 64-битных чтения за такт, AMD K8L может создавать два 128-битных чтения либо записи в хоть какой композиции. Микропроцессоры Intel Core 2 могут создавать 128-битные запись и чтение за такт. Кэш 2-го уровня обычно имеет существенно огромную латентность доступа, но его можно Суперскалярная архитектура сделать существенно больше по размеру. Кэш 3-го уровня наибольший по объёму и достаточно неспешный, но всё же он еще резвее, чем оперативка.

Гарвардская архитектура

Гарвардская архитектура отличается от архитектуры фон Неймана тем, что программный код и данные хранятся в разной памяти. В таковой архитектуре невозможны многие способы Суперскалярная архитектура программирования (к примеру, программка не может во время выполнения поменять собственный код; нереально динамически перераспределять память меж программным кодом и данными); зато гарвардская архитектура позволяет более отлично делать работу в случае ограниченных ресурсов, потому она нередко применяется во встраиваемых системах.


summa-chisel-let-sroka-poleznogo-ispolzovaniya.html
summa-dopolnitelno-vlozhennogo-kapitala.html
summa-kontrakta-i-poryadok-raschetov.html