Как узнать какая оперативная память: DDR, DDR2, DDR3 или DDR4. Современная память DDR2 Ddr2 что означает

Сейчас актуальным стандартом оперативной памяти является DDR4, но в использовании все еще находится множество компьютеров с DDR3, DDR2 и даже DDR. Из-за такого оперативной памяти многие пользователи путаются и забывают какая именно оперативная память используется на их компьютере. Решению этой проблемы и будет посвящена данная статья. Здесь мы расскажем, как узнать какая оперативная память используется на компьютере DDR, DDR2, DDR3 или DDR4.

Если у вас есть возможность открыть компьютер и осмотреть его комплектующие, то всю необходимую информацию вы можете получить с наклейки на модуле оперативной памяти.

Обычно на наклейке можно найти надпись с названием модуля памяти. Это название начинается с букв «PC» после которых идут цифры, и оно указывает на тип данного модуля оперативной памяти и его пропускную способность в мегабайтах за секунду (МБ/с).

Например, если на модуле памяти написано PC1600 или PC-1600, то это модуль DDR первого поколения с пропускной способностью в 1600 МБ/с. Если на модуле написано PC2‑ 3200, то это DDR2 с пропускной способностью в 3200 МБ/с. Если PC3 – то это DDR3 и так далее. В общем, первая цифра после букв PC указывает на поколение DDR, если этой цифры нет, то это простой DDR первого поколения.

В некоторых случаях на модулях оперативной памяти указывается не название модуля, а тип оперативной памяти и его эффективная частота. Например, на модуле может быть написано DDR3 1600. Это означает что это модуль DDR3 c эффективной частотой памяти 1600 МГц.

Для того чтобы соотносить названия модулей с типом оперативной памяти, а пропускную способность с эффективной частотой можно использовать таблицу, которую мы приводим ниже.

Название модуля	Тип оперативной памяти
PC-1600	DDR-200
PC-2100	DDR-266
PC-2400	DDR-300
PC-2700	DDR-333
PC-3200	DDR-400
PC-3500	DDR-433
PC-3700	DDR-466
PC-4000	DDR-500
PC-4200	DDR-533
PC-5600	DDR-700
PC2-3200	DDR2-400
PC2-4200	DDR2-533
PC2-5300	DDR2-667
PC2-5400	DDR2-675
PC2-5600	DDR2-700
PC2-5700	DDR2-711
PC2-6000	DDR2-750
PC2-6400	DDR2-800
PC2-7100	DDR2-888
PC2-7200	DDR2-900
PC2-8000	DDR2-1000
PC2-8500	DDR2-1066
PC2-9200	DDR2-1150
PC2-9600	DDR2-1200
PC3-6400	DDR3-800
PC3-8500	DDR3-1066
PC3-10600	DDR3-1333
PC3-12800	DDR3-1600
PC3-14900	DDR3-1866
PC3-17000	DDR3-2133
PC3-19200	DDR3-2400
PC4-12800	DDR4-1600
PC4-14900	DDR4-1866
PC4-17000	DDR4-2133
PC4-19200	DDR4-2400
PC4-21333	DDR4-2666
PC4-23466	DDR4-2933
PC4-25600	DDR4-3200

Использование специальных программ

Если же ваши модули оперативной памяти уже установлены в компьютер, то вы можете узнать к какому типу они относятся с помощью специальных программ.

Самый простой вариант - это воспользоваться бесплатной программой CPU-Z. Для этого запустите CPU-Z на своем компьютере и перейдите на вкладку «Memory». Здесь в левом верхнем углу окна будет указан тип оперативной памяти, который используется на вашем компьютере.

Также на вкладке «Memory» можно узнать эффективную частоту, на которой работает ваша оперативная память. Для этого нужно взять значение «DRAM Frequency» и умножить его два. Например, на скриншоте внизу указана частота 665.1 МГц, умножаем ее на 2 и получаем эффективную частоту 1330,2 МГц.

Если вы хотите узнать какие конкретно модули оперативной памяти установлены на вашем компьютере, то эту информацию можно получить на вкладке «SPD».

Здесь можно узнать, сколько модулей памяти установлено, кто их производитель, на каких частотах они могут работать и многое другое.

История оперативной памяти , или ОЗУ , началась в далёком 1834 году, когда Чарльз Беббидж разработал «аналитическую машину» - по сути, прообраз компьютера. Часть этой машины, которая отвечала за хранение промежуточных данных, он назвал «складом». Запоминание информации там было организовано ещё чисто механическим способом, посредством валов и шестерней.

В первых поколениях ЭВМ в качестве ОЗУ использовались электронно-лучевые трубки, магнитные барабаны, позже появились магнитные сердечники, и уже после них, в третьем поколении ЭВМ появилась память на микросхемах.

Сейчас ОЗУ выполняется по технологии DRAM в форм-факторах DIMM и SO-DIMM , это динамическая память, организованная в виде интегральных схем полупроводников. Она энергозависима, то есть данные исчезают при отсутствии питания.

Выбор оперативной памяти не является сложной задачей на сегодняшний день, главное здесь разобраться в типах памяти, её назначении и основных характеристиках.

Типы памяти

SO-DIMM

Память форм-фактора SO-DIMM предназначена для использования в ноутбуках, компактных ITX-системах, моноблоках - словом там, где важен минимальный физический размер модулей памяти. Отличается от форм-фактора DIMM уменьшенной примерно в 2 раза длиной модуля, и меньшим количеством контактов на плате (204 и 360 контактов у SO-DIMM DDR3 и DDR4 против 240 и 288 на платах тех же типов DIMM-памяти).
По остальным характеристикам - частоте, таймингам, объёму, модули SO-DIMM могут быть любыми, и ничем принципиальным от DIMM не отличаются.

DIMM

DIMM - оперативная память для полноразмерных компьютеров.
Тип памяти, который вы выберете, в первую очередь должен быть совместим с разъёмом на материнской плате. ОЗУ для компьютера делится на 4 типа – DDR , DDR2 , DDR3 и DDR4 .

Память типа DDR появилась в 2001 году, и имела 184 контакта. Напряжение питания составляло от 2.2 до 2.4 В. Частота работы – 400МГц . До сих пор встречается в продаже, правда, выбор невелик. На сегодняшний день формат устарел, - подойдёт, только если вы не хотите обновлять систему полностью, а в старой материнской плате разъёмы только под DDR.

Стандарт DDR2 вышел уже в 2003-ем, получил 240 контактов, которые увеличили число потоков, прилично ускорив шину передачи данных процессору. Частота работы DDR2 могла составлять до 800 МГц (в отдельных случаях – до 1066 МГц), а напряжение питания от 1.8 до 2.1 В – чуть меньше, чем у DDR. Следовательно, понизились энергопотребление и тепловыделение памяти.
Отличия DDR2 от DDR:

· 240 контактов против 120
· Новый слот, несовместимый с DDR
· Меньшее энергопотребление
· Улучшенная конструкция, лучшее охлаждение
· Выше максимальная рабочая частота

Также, как и DDR, устаревший тип памяти - сейчас подойдёт разве что под старые материнские платы, в остальных случаях покупать нет смысла, так как новые DDR3 и DDR4 быстрее.

В 2007 году ОЗУ обновились типом DDR3 , который до сих пор массово распространён. Остались всё те же 240 контактов, но слот подключения для DDR3 стал другим – совместимости с DDR2 нет. Частота работы модулей в среднем от 1333 до 1866 МГц . Встречаются также модули с частотой вплоть до 2800 МГц .
DDR3 отличается от DDR2:

· Слоты DDR2 и DDR3 несовместимы.
· Тактовая частота работы DDR3 выше в 2 раза – 1600 МГц против 800 МГц у DDR2.
· Отличается сниженным напряжением питания – порядка 1.5В, и меньшим энергопотреблением (в версии DDR3L это значение в среднем ещё ниже, около 1.35 В).
· Задержки (тайминги) DDR3 больше, чем у DDR2, но рабочая частота выше. В целом скорость работы DDR3 на 20-30% выше.

DDR3 - на сегодня хороший выбор. Во многих материнских платах в продаже разъёмы под память именно DDR3, и в связи с массовой популярностью этого типа, вряд ли он скоро исчезнет. Также он немного дешевле DDR4.

DDR4 – новый тип ОЗУ, разработанный только в 2012 году. Является эволюционным развитием предыдущих типов. Пропускная способность памяти снова повысилась, теперь достигая 25,6 Гб/с. Частота работы также поднялась – в среднем от 2133 МГц до 3600 МГц . Если же сравнивать новый тип с DDR3, который продержался на рынке целых 8 лет и получил массовое распространение, то прирост производительности незначителен, к тому же далеко не все материнские платы и процессоры поддерживают новый тип.
Отличия DDR4:

· Несовместимость с предыдущими типами
· Пониженно напряжение питания – от 1.2 до 1.05 В, энергопотребление тоже снизилось
· Рабочая частота памяти до 3200 МГц (может достигать 4166 МГц в некоторых планках), при этом, конечно, выросшие пропорционально тайминги
· Может незначительно превосходить по скорости работы DDR3

Если у вас уже стоят планки DDR3, то торопиться менять их на DDR4 нет никакого смысла. Когда этот формат распространится массово, и все материнские платы уже будут поддерживать DDR4, переход на новый тип произойдёт сам собой с обновлением всей системы. Таким образом, можно подытожить, что DDR4 – скорее маркетинг, чем реально новый тип ОЗУ.

Какую частоту памяти выбрать?

Выбор частоты нужно начинать с проверки максимально поддерживаемых частот вашим процессором и материнской платой. Частоту выше поддерживаемой процессором имеет смысл брать только при разгоне процессора.

На сегодняшний день не стоит выбирать память с частотой ниже 1600 МГц. Вариант 1333 МГц допустим в случае DDR3, если это не завалявшиеся у продавца древние модули, которые явно будут медленнее новых.

Оптимальный вариант на сегодня - это память с интервалом частот от 1600 до 2400 МГц . Частота выше почти не имеет преимущества, но стоит гораздо дороже, и как правило является разогнанными модулями с поднятыми таймингами. Для примера, разница между модулями в 1600 и 2133 Мгц в ряде рабочих программ будет не более 5-8 %, в играх разница может быть ещё меньше. Частоты в 2133-2400 Мгц стоит брать, если вы занимаетесь кодированием видео/аудио, рендерингом.

Разница же между частотами в 2400 и 3600 Мгц обойдётся вам довольно дорого, при этом не прибавив ощутимо скорости.

Какой объём оперативной памяти брать?

Объём, который вам понадобится, зависит от типа работы, производимой на компьютере, от установленной операционной системы, от используемых программ. Также не стоит упускать из виду максимально поддерживаемый объём памяти вашей материнской платой.

Объём 2 ГБ - на сегодняшний день, может хватить разве что только для просмотра интернета. Больше половину будет съедать операционная система, оставшегося хватит на неторопливую работу нетребовательных программ.

Объём 4 ГБ – подойдёт для компьютера средней руки, для домашнего пк-медиацентра. Хватит, чтобы смотреть фильмы, и даже поиграть в нетребовательные игры. Современные – увы, с потянет с трудом. (Станет лучшим выбором, если у вас 32-разрядная операционная система Windows, которая видит не больше 3 ГБ оперативной памяти)

Объём 8 ГБ (или комплект 2х4ГБ) – рекомендуемый объём на сегодня для полноценного ПК. Этого хватит для почти любых игр, для работы с любым требовательным к ресурсам софтом. Лучший выбор для универсального компьютера.

Объём 16 ГБ (или наборы 2х8ГБ , 4х4ГБ)- будет оправданным, если вы работаете с графикой, тяжёлыми средами программирования, или постоянно рендерите видео. Также отлично подойдёт для ведения онлайн-стримов – здесь с 8 ГБ могут быть подвисания, особенно при высоком качестве видео-трансляции. Некоторые игры в высоких разрешениях и с HD-текстурами могут лучше себя вести с 16 ГБ оперативной памяти на борту.

Объём 32 ГБ (набор 2х16ГБ , или 4х8ГБ)– пока очень спорный выбор, пригодится для каких-то совсем экстремальных рабочих задач. Лучше будет потратить деньги на другие комплектующие компьютера, это сильнее отразится на его быстродействии.

Режимы работы: лучше 1 планка памяти или 2?

ОЗУ может работать в одно-канальном, двух-, трёх- и четырёх-канальном режимах. Однозначно, если на вашей материнской плате есть достаточное количество слотов, то лучше взять вместо одной планки памяти несколько одинаковых меньшего объёма. Скорость доступа к ним вырастет от 2 до 4 раз.

Чтобы память работала в двухканальном режиме, нужно устанавливать планки в слоты одного цвета на материнской плате. Как правило, цвет повторяется через разъём. Важно при этом, чтобы частота памяти в двух планках была одинаковой.

- Single chanell Mode – одноканальный режим работы. Включается, когда установлена одна планка памяти, или разные модули, работающие на разной частоте. В итоге память работает на частоте самой медленной планки.
- Dual Mode – двухканальный режим. Работает только с модулями памяти одинаковой частоты, увеличивает скорость работы в 2 раза. Производители выпускают специально для этого комплекты модулей памяти , в которых может быть 2 или 4 одинаковых планки.
- Triple Mode – работает по тому же принципу, что и двух-канальный. На практике не всегда быстрее.
- Quad Mode - четырёх-канальный режим, который работает по принципу двухканального, соответственно увеличивая скорость работы в 4 раза. Используется, там где нужна исключительно высокая скорость - например, в серверах.

- Flex Mode – более гибкий вариант двухканального режима работы, когда планки разного объёма, а одинаковая только частота. При этом в двухканальном режиме будут использоваться одинаковые объёмы модулей, а оставшийся объём будет функционировать в одноканальном.

Нужен ли памяти радиатор?

Сейчас уже давно не те времена, когда при напряжении в 2 В достигалась частота работы в 1600 МГц, и в результате выделялось много тепла, которое надо было как-то отводить. Тогда радиатор мог быть критерием выживаемости разогнанного модуля.

В настоящее время же энергопотребление памяти сильно снизилось, и радиатор на модуле может быть оправдан с технической точки зрения, только если вы увлекаетесь оверклокингом, и модуль будет работать у вас на запредельных для него частотах. Во всех остальных случаях радиаторы можно оправдать, разве что, красивым дизайном.

В случае, если радиатор массивный, и заметно увеличивает высоту планки памяти – это уже существенный минус, поскольку он может помешать вам поставить в систему процессорный суперкулер. Существуют, кстати, специальные низкопрофильные модули памяти , предназначенные для установки в компактные корпуса. Они несколько дороже модулей обычного размера.

Что такое тайминги?

Тайминги , или латентность (latency) – одна из самых важных характеристик оперативной памяти, определяющих её быстродействие. Обрисуем общий смысл этого параметра.

Упрощённо оперативную память можно представить, как двумерную таблицу, в которой каждая ячейка несёт информацию. Доступ к ячейкам происходит по указанию номера столбца и строки, и указание это происходит при помощи стробирующего импульса доступа к строке RAS (Row Access Strobe ) и стробирующего импульса доступа к столбцу CAS (Acess Strobe ) путём изменения напряжения. Таким образом, за каждый такт работы происходят обращения RAS и CAS , и между этими обращениями и командами записи/чтения существуют определённые задержки, которые и называются таймингами.

В описании модуля оперативной памяти можно увидеть пять таймингов, которые для удобства записываются последовательностью цифр через дефис, например 8-9-9-20-27 .

· tRCD (time of RAS to CAS Delay) - тайминг, который определяет задержку от импульса RAS до CAS
· CL (timе of CAS Latency) - тайминг, определяющий задержку между командой о записи/чтении и импульсом CAS
· tRP (timе of Row Precharge) - тайминг, определяющий задержку при переходах от одной строки к следующей
· tRAS (time of Active to Precharge Delay) - тайминг, который определяет задержку между активацией строки и окончанием работы с ней; считается основным значением
· Command rate – определяет задержку между командой выбора отдельного чипа на модуле до команды активации строки; этот тайминг указывают не всегда.

Если говорить ещё проще, то о таймингах важно знать только одно – чем их значения меньше, тем лучше. При этом планки могут иметь одинаковую частоту работы, но разные тайминги, и модуль с меньшими значениями всегда будет быстрее. Так что стоит выбирать минимальные тайминги, для DDR4 ориентиром средних значений будут тайминги 15-15-15-36, для DDR3 - 10-10-10-30. Также стоит помнить, что тайминги связаны с частотой памяти, так что при разгоне скорее всего придётся поднять и тайминги, и наоборот - можно вручную опустить частоту, снизив при этом тайминги. Выгоднее всего обращать внимание на совокупность этих параметров, выбирая скорее баланс, и не гнаться за крайними значениями параметров.

Как определиться с бюджетом?

Располагая большей суммой, вы сможете позволить себе больший объём оперативной памяти. Основное отличие дешёвых и дорогих модулей будет в таймингах, частоте работы, и в бренде – известные, разрекламированные могут стоить немного дороже noname модулей непонятного производителя.
Кроме того, дополнительных денег стоит радиатор, установленный на модули. Далеко не всем планкам он нужен, но производители сейчас на них не скупятся.

Цена будет также зависеть от таймингов, чем они ниже- тем выше скорость, и соответственно, цена.

Итак, имея до 2000 рублей , вы сможете приобрести модуль памяти объёмом 4 ГБ, или 2 модуля по 2 ГБ, что предпочтительнее. Выбирайте в зависимости от того, что позволяет конфигурация вашего пк. Модули типа DDR3 обойдутся почти вдвое дешевле чем DDR4. При таком бюджете разумнее брать именно DDR3.

В группу до 4000 рублей входят модули объёмом в 8 ГБ, а также наборы 2х4 ГБ. Это оптимальный выбор для любых задач, кроме профессиональной работы с видео, и в любых других тяжёлых средах.

В сумму до 8000 рублей обойдётся объём памяти в 16 ГБ. Рекомендуется для профессиональных целей, или для заядлых геймеров - хватит даже про запас, в ожидании новых требовательных игр.

Если не проблема потратить до 13000 рублей , то самым лучшим выбором будет вложить их в набор из 4 планок по 4 ГБ. За эти деньги можно выбрать даже радиаторы покрасивее, возможно для последующего разгона.

Больше 16 ГБ без цели работы в профессиональных тяжёлых средах (да и то не во всех) брать не советую, но если очень хочется, то за сумму от 13000 рублей вы сможете залезть на Олимп, приобретя комплект на 32 ГБ или даже 64 ГБ . Правда, смысла для рядового пользователя или геймера в этом будет не много – лучше потратить средства, скажем, на флагманскую видеокарту.

Новые поколения процессоров стимулировали разработку более скоростной памяти SDRAM (Synchronous Dynamic Random Access Memory) с тактовой частотой 66 МГц, а модули памяти с такими микросхемами получили название DIMM(Dual In-line Memory Module).
Для использования с процессорами Athlon, а потом и с Pentium 4, было разработано второе поколение микросхем SDRAM - DDR SDRAM (Double Data Rate SDRAM). Технология DDR SDRAM позволяет передавать данные по обоим фронтам каждого тактового импульса, что предоставляет возможность удвоить пропускную способность памяти. При дальнейшем развитии этой технологии в микросхемах DDR2 SDRAM удалось за один тактовый импульс передавать уже 4 порции данных. Причем следует отметить, что увеличение производительности происходит за счет оптимизации процесса адресации и чтения/записи ячеек памяти, а вот тактовая частота работы запоминающей матрицы не изменяется. Поэтому общая производительность компьютера не увеличивается в два и четыре раза, а всего на десятки процентов. На рис. показаны частотные принципы работы микросхем SDRAM различных поколений.

Существуют следующие типы DIMM:

72-pin SO-DIMM (Small Outline Dual In-line Memory Module) - используется для FPM DRAM (Fast Page Mode Dynamic Random Access Memory) и EDO DRAM (Extended Data Out Dynamic Random Access Memory)

100-pin DIMM - используется для принтеров SDRAM (Synchronous Dynamic Random Access Memory)

144-pin SO-DIMM - используется для SDR SDRAM (Single Data Rate …) в портативних компьютерах

168-pin DIMM - используется для SDR SDRAM (реже для FPM/EDO DRAM в рабочих станциях/серверах

172-pin MicroDIMM - используется для DDR SDRAM (Double date rate)

184-pin DIMM - используется для DDR SDRAM

200-pin SO-DIMM - используется для DDR SDRAM и DDR2 SDRAM

214-pin MicroDIMM - используется для DDR2 SDRAM

204-pin SO-DIMM - используется для DDR3 SDRAM

240-pin DIMM - используется для DDR2 SDRAM, DDR3 SDRAM и FB-DIMM (Fully Buffered) DRAM

244-pin Mini-DIMM – для Mini Registered DIMM

256-pin SO-DIMM - используется для DDR4 SDRAM

284-pin DIMM - используется для DDR4 SDRAM

Чтобы нельзя было установить неподходящий тип DIMM-модуля, в текстолитовой плате модуля делается несколько прорезей (ключей) среди контактных площадок, а также справа и слева в зоне элементов фиксации модуля на системной плате. Для механической идентификации различных DIMM-модулей используется сдвиг положения двух ключей в текстолитовой плате модуля, расположенных среди контактных площадок. Основное назначение этих ключей - не дать установить в разъем DIMM-модуль с неподходящим напряжением питания микросхем памяти. Кроме того, расположение ключа или ключей определяет наличие или отсутствие буфера данных и т. д.

Модули DDR имеют маркировку PC. Но в отличие от SDRAM, где PC обозначало частоту работы (например PC133 – память предназначена для работы на частоте 133МГц), показатель PC в модулях DDR указывает на максимально достижимую пропускную способностью, измеряемую в мегабайтах в секунду.

DDR2 SDRAM

Название стандарта	Тип памяти	Частота памяти	Частота шины	Передача данных в секунду (MT/s)
PC2-3200	DDR2-400	100 МГц	200 МГц	400	3200 МБ/с
PC2-4200	DDR2-533	133 МГц	266 МГц	533	4200 МБ/с
PC2-5300	DDR2-667	166 МГц	333 МГц	667	5300 МБ/с
PC2-5400	DDR2-675	168 МГц	337 МГц	675	5400 МБ/с
PC2-5600	DDR2-700	175 МГц	350 МГц	700	5600 МБ/с
PC2-5700	DDR2-711	177 МГц	355 МГц	711	5700 МБ/с
PC2-6000	DDR2-750	187 МГц	375 МГц	750	6000 МБ/с
PC2-6400	DDR2-800	200 МГц	400 МГц	800	6400 МБ/с
PC2-7100	DDR2-888	222 МГц	444 МГц	888	7100 МБ/с
PC2-7200	DDR2-900	225 МГц	450 МГц	900	7200 МБ/с
PC2-8000	DDR2-1000	250 МГц	500 МГц	1000	8000 МБ/с
PC2-8500	DDR2-1066	266 МГц	533 МГц	1066	8500 МБ/с
PC2-9200	DDR2-1150	287 МГц	575 МГц	1150	9200 МБ/с
PC2-9600	DDR2-1200	300 МГц	600 МГц	1200	9600 МБ/с

DDR3 SDRAM

Название стандарта	Тип памяти	Частота памяти	Частота шины	Передач данных в секунду(MT/s)	Пиковая скорость передачи данных
PC3-6400	DDR3-800	100 МГц	400 МГц	800	6400 МБ/с
PC3-8500	DDR3-1066	133 МГц	533 МГц	1066	8533 МБ/с
PC3-10600	DDR3-1333	166 МГц	667 МГц	1333	10667 МБ/с
PC3-12800	DDR3-1600	200 МГц	800 МГц	1600	12800 МБ/с
PC3-14400	DDR3-1800	225 МГц	900 МГц	1800	14400 МБ/с
PC3-16000	DDR3-2000	250 МГц	1000 МГц	2000	16000 МБ/с
PC3-17000	DDR3-2133	266 МГц	1066 МГц	2133	17066 МБ/с
PC3-19200	DDR3-2400	300 МГц	1200 МГц	2400	19200 МБ/с

В таблицах указываются именно пиковые величины, на практике они могут быть недостижимы.
Для комплексной оценки возможностей RAM используется термин пропускная способность памяти. Он учитывает и частоту, на которой передаются данные и разрядность шины и количество каналов памяти.

Пропускная способность = Частота шины x ширину канала x кол-во каналов

Для всех DDR — количество каналов = 2 и ширина равна 64 бита.
Например, при использовании памяти DDR2-800 с частотой шины 400 МГц пропускная способность будет:

(400 МГц x 64 бит x 2)/ 8 бит = 6400 Мбайт/с

Каждый производитель каждому своему продукту или детали дает его внутреннюю производственную маркировку, называемую P/N (part number) — номер детали.
Для модулей памяти у разных производителей она выглядит примерно так:

Kingston KVR800D2N6/1G
OCZ OCZ2M8001G
Corsair XMS2 CM2X1024-6400C5

На сайте многих производителей памяти можно изучить, как читается их Part Number.

Kingston Part Number	Description
KVR1333D3D4R9SK2/16G	16GB 1333MHz DDR3 ECC Reg CL9 DIMM (Kit of 2) DR x4 w/TS

Теоретические основы и первые результаты низкоуровневого тестирования

DDR2 новый стандарт памяти, утвержденный (Joint Electronic Device Engineering Council), в состав которого входят многие производители микросхем и модулей памяти, а также чипсетов. Ранние версии стандарта были опубликованы уже в марте 2003 года, окончательно он был утвержден лишь в январе 2004 года и получил наименование DDR2 SDRAM SPECIFICATION, JESD79-2, ревизия A (). DDR2 основывается на хорошо известной и зарекомендовавшей себя технологии DDR (Double Data Rate). Можно даже сказать так: «DDR2 начинается там, где заканчивается DDR». Другими словами, первые DDR2 будут работать на частотах, являющихся пределом для текущего поколения памяти DDR-400 (стандарт PC3200, тактовая частота 200 МГц), а ее дальнейшие варианты существенно его превзойдут. Первым поколением памяти DDR2, уже производимым в настоящее время такими вендорами, как , и , являются ее разновидности DDR2-400 и DDR2-533, работающие на частотах 200 МГц и 266 МГц, соответственно. Далее ожидается появление нового поколения модулей DDR2-667 и DDR2-800, хотя отмечается, что они вообще вряд ли появятся и, тем более, получат широкое распространение даже к концу этого года.

Справедливости ради стоит заметить, что память типа DDR2, как таковая, появилась уже довольно давно конечно же, имеется в виду память на видеокартах. Тем не менее, эта разновидность DDR2 (называемая GDDR2), на самом деле, является особым типом памяти, разработанным специально для рынка видеокарт и слегка отличающимся от «десктопного» варианта DDR2, которому и посвящен настоящий обзор. Общая информация

Итак, «десктопная» DDR2-SDRAM рассматривается как эволюционная замена текущего поколения памяти DDR. Принцип ее функционирования абсолютно тот же передача данных (на уровне модуля памяти) осуществляется по 64-разрядной шине по обеим частям синхросигнала (восходящему «фронту», и нисходящему «срезу»), что обеспечивает удвоенную эффективную скорость передачи данных по отношению к ее частоте. Разумеется, при этом в DDR2 реализован ряд нововведений, которые позволяют осуществить скачок к гораздо более высоким частотам (а, следовательно, большей пропускной способности) и большим емкостям массивов микросхем, с одной стороны, и уменьшенному энергопотреблению модулей, - с другой. За счет чего это достигается, мы увидим позже, а пока обратимся к «макроскопическим» фактам. Модули памяти типа DDR2 производятся в новом форм-факторе, в виде 240-контактных модулей DIMM, электрически не совместимых со слотами для модулей памяти типа DDR (по количеству выводов, расстоянию между выводами и цоколевке модулей). Таким образом, стандарт DDR2 не предусматривает обратной совместимости с DDR.

В представленной ниже таблице приведены утвержденные соглашения о наименованиях и спецификации первых трех стандартов DDR2. Легко заметить, что DDR2-400 характеризуется такой же пропускной способностью, как и ныне существующий тип памяти DDR-400.

Первые модули памяти DDR2 будут поставляться в вариантах 256 МБ, 512 МБ и 1 ГБ. Тем не менее, стандарт предусматривает возможность построения модулей существенно большей емкости вплоть до 4 ГБ, которые, однако, являются специализированными модулями (не совместимыми с десктопными вариантами, по крайней мере, на данный момент). В дальнейшем ожидается появление модулей, обладающих еще большей емкостью.

Чипы DDR2 будут изготавливаться с использованием упаковки типа FBGA (Fine Ball Grid Array), более компактной, чем традиционный вариант TSOP-II, позволяющей достичь больших емкостей микросхем при меньшем размере и улучшенных электрических и термических характеристиках. Такой метод упаковки уже используется некоторыми производителями DDR в качестве варианта, но является рекомендованным к использованию с точки зрения стандарта JEDEC.

Потребляемое модулями DDR2 напряжение, согласно стандарту 1.8 V, что значительно меньше по сравнению с напряжением питания устройств DDR (2.5 V). Вполне ожидаемым (хотя и не столь очевидным) следствием этого факта является уменьшение энергопотребления, что важно для производителей, как ноутбуков, так и крупных рабочих станций и серверов, где проблема рассеиваемой модулями памяти мощности занимает далеко не последнее место. DDR2 изнутри

Стандарт DDR2 включает в себя несколько важных изменений спецификации DDR, связанных с передачей данных, которые позволяют достигать более высоких частот при более низкой потребляемой мощности. Как именно достигается снижение рассеиваемой мощности при одновременном увеличении скорости модулей, мы рассмотрим прямо сейчас.

Выборка данных

Главным изменением в DDR2 является возможность выборки сразу 4 бит данных за такт (4n-prefetch), в противоположность 2-битной выборке (2n-prefetch), реализованной в DDR. По существу, это означает, что на каждом такте шины памяти DDR2 осуществляет пересылку 4 бит информации из логических (внутренних) банков микросхемы памяти в буферы ввода-вывода по одной линии интерфейса данных, тогда как обычная DDR способна переслать лишь 2 бита за такт на линию. Довольно закономерно возникает вопрос если это так, то почему же тогда эффективная пропускная способность DDR2-400 оказывается такой же, как и у обычной DDR-400 (3.2 ГБ/с), а не удвоенной?

Для ответа на этот вопрос сначала рассмотрим, как работает обычная память типа DDR-400. В этом случае, как ядро памяти, так и буферы ввода-вывода функционируют на частоте 200 МГц, а «эффективная» частота внешней шины данных, благодаря технологии DDR, равна 400 МГц. По правилу 2n-prefetch, на каждом такте памяти (200 МГц) по каждой линии интерфейса данных в буфер ввода-вывода поступает 2 бита информации. Задачей этого буфера является мультиплексирование/демультиплексирование (MUX/DEMUX) потока данных по-простому, «перегонка» узкого высокоскоростного потока в широкий низкоскоростной, и наоборот. Поскольку в микросхеме памяти типа DDR SDRAM логические банки имеют ширину шины данных, соединяющую их и усилитель уровня, в два раза шире, чем от защелок на чтение до внешнего интерфейса, буфер данных включает в себя мультиплексор типа 2-1. В общем случае, поскольку микросхемы памяти, в отличие от модулей, могут иметь разную ширину шины данных обычно это x4/x8/x16/x32, применение такой схемы MUX/DEMUX (2-1), реализованной в DDR, означает, что внутренний поток данных шириной X и частотой передачи Y от массива преобразуется во внешний поток шириной X/2 и частотой 2Y. Это называется балансом по пиковой пропускной способности.

Рассмотрим теперь схему функционирования устройства микросхемы памяти типа DDR2 SDRAM, равночастотной и «равноширокой» (т.е. одинаковой ширины шины данных) относительно микросхемы DDR модуля памяти DDR-400. Прежде всего, отметим, что ширина внешней шины данных осталась абсолютно такой же 1 бит/линию, как и ее эффективная частота (в рассматриваемом примере 400 МГц). Собственно, этого уже достаточно для ответа на поставленный выше вопрос почему теоретическая ПСП равночастотных модулей памяти типа DDR2 и DDR равны между собой. Далее, очевидно, что использование мультиплексора типа 2-1, применяемого в DDR SDRAM, в случае DDR2 SDRAM, осуществляющей выборку данных по правилу 4n-prefetch, уже не подходит. Вместо этого требуется введение более сложной схемы с дополнительной ступенью преобразования мультиплексора типа 4-1. Это означает, что выход ядра стал шире в четыре раза внешнего интерфейса микросхемы и во столько же раз ниже по частоте функционирования. То есть, по аналогии с рассмотренным выше примером, в общем случае схема MUX/DEMUX 4-1 осуществляет преобразование внутреннего потока данных шириной X и частотой передачи Y от массива во внешний поток шириной X/4 и частотой 4Y.

Поскольку в этом случае ядро микросхем памяти синхронизируется на частоте, вдвое меньшей по отношению к внешней (100 МГц), тогда как в DDR синхронизация внутреннего и внешнего потока данных происходят на одной частоте (200 МГц), среди преимуществ такого подхода отмечается увеличение процента выхода годных чипов и снижение энергопотребления модулей. Кстати, это также позволяет объяснить, почему стандарт DDR2 предполагает существование модулей памяти с «эффективной» частотой 800 МГц что вдвое выше, чем у текущего поколения памяти типа DDR. Ведь именно такой «эффективной» частоты DDR2 можно достичь уже сейчас, имея чипы памяти DDR-400, работающие на собственной частоте 200 МГц, если осуществлять выборку данных по правилу 4n-prefetch по схеме, рассмотренной выше.

Таким образом, DDR2 означает отказ от экстенсивного пути развития чипов памяти в смысле, простого дальнейшего увеличения их частоты, которое существенно затрудняет производство стабильно работающих модулей памяти в большом количестве. На смену ему выдвигается интенсивный путь развития, связанный с расширением внутренней шины данных (что является обязательным и неизбежным решением при использовании более сложного мультиплексирования). Рискнем предположить, что в будущем вполне можно ожидать появление памяти типа «DDR4», осуществляющей выборку уже не 4-х, а сразу 8 бит данных из чипов памяти (по правилу 8n-prefetch, с использованием мультиплексора типа 8-1), и работающих на частоте уже не в 2, а в 4 раза меньшей по отношению к частоте буфера ввода-вывода:). Собственно, ничего нового в таком подходе нет подобное уже встречалось в микросхемах памяти типа Rambus DRAM . Тем не менее, нетрудно догадаться, что оборотной стороной такого пути развития является усложнение устройства MUX/DEMUX буфера ввода-вывода, который в случае DDR2 должен осуществлять сериализацию четырех бит данных, считываемых параллельно. Прежде всего, это должно сказаться на такой немаловажной характеристике памяти, как ее латентность, что мы и рассмотрим ниже.

Внутричиповое терминирование

Стандарт DDR2 включает в себя и ряд других усовершенствований, улучшающих различные характеристики нового типа памяти, в том числе электрические. Одним из таких новшеств является внутричиповое терминирование сигнала. Суть его заключается в том, что для устранения излишнего электрического шума (вследствие отражения сигнала от конца линии) на шине памяти для нагрузки линии используются резисторы не на материнской плате (как это было с предыдущими поколениями памяти), а внутри самих чипов. Эти резисторы деактивируются, когда чип находится в работе и, наоборот, активируются, как только микросхема входит в состояние ожидания. Поскольку гашение сигнала теперь осуществляется намного ближе к его источнику, это позволяет устранить электрические помехи внутри чипа памяти при передаче данных.

Кстати, в связи с технологией внутричипового терминирования нельзя не остановиться на таком моменте, как… тепловыделение модуля, на активное снижение которого, в общем-то, в первую очередь и рассчитан новый стандарт DDR2. Действительно, такая схема терминирования сигналов приводит к возникновению значительных статических токов внутри чипов памяти, что ведет к их разогреву. Что ж, это действительно так, хотя заметим, что мощность, потребляемая подсистемой памяти в целом , от этого вовсе не должна расти (просто тепло теперь рассеивается в другом месте). Проблема здесь немного в другом а именно, в возможности повышения частоты функционирования таких устройств. Весьма вероятно, что именно поэтому первым поколением памяти DDR2 являются модули вовсе не DDR2-800, а лишь DDR2-400 и DDR2-533, для которых тепловыделение внутри чипов пока что остается на приемлемом уровне.

Добавочная задержка

Добавочная задержка (также известная как «отложенная выдача CAS») еще одно усовершенствование, введенное в стандарт DDR2, которое призвано минимизировать простои планировщика команд при передаче данных из памяти/в память. Чтобы проиллюстрировать это (на примере чтения), рассмотрим для начала чтение данных с чередованием банков (Bank Interleave) из устройства типа DDR2 с добавочной задержкой, равной нулю, что эквивалентно чтению из обычной памяти типа DDR.

На первом этапе происходит открывание банка с помощью команды ACTIVATE вместе с подачей первой составляющей адреса (адреса строки), которая выбирает и активирует необходимый банк и строку в его массиве. В течение следующего цикла информация передается на внутреннюю шину данных и направляется на усилитель уровня. Когда усиленный уровень сигнала достигает необходимого значения (по истечении времени, именуемого задержкой между определением адреса строки и столбца, t RCD (RAS-to-CAS Delay) на исполнение может подаваться команда чтения с автоподзарядкой (READ with Auto-Precharge, RD_AP) совместно с адресом столбца, чтобы выбрать точный адрес данных, которые надо считать с усилителя уровня. После выставления команды чтения выполняется задержка строба выбора столбца t CL (задержка сигнала CAS, CAS Latency), в течение которой данные, выбранные из усилителя уровня, синхронизируются и передаются на внешние выводы микросхемы. При этом может возникнуть ситуация, когда следующая команда (ACTIVATE) не может быть отправлена на исполнение, поскольку в данный момент времени еще не закончилось исполнение других команд. Так, в рассматриваемом примере, активация 2-го банка должна быть отложена на один такт, поскольку в этот момент уже исполняется команда чтения с автоподзарядкой (RD_AP) из банка 0. В конечном счете, это приводит к разрыву в последовательности выдачи данных по внешней шине, что снижает реальную пропускную способность памяти.

Для устранения подобной ситуации и увеличения эффективности работы планировщика команд в DDR2 вводится понятие добавочной (дополнительной) задержки, t AL . При ненулевом значении t AL устройство памяти отслеживает команды READ (RD_AP) и WRITE (WR_AP), но откладывает их исполнение на время, равное величине добавочной задержки. Различия в поведении микросхемы памяти типа DDR2 с двумя различными величинами t AL приведены на рисунке.

Верхний рисунок описывает режим функционирования микросхемы DDR2 при t AL = 0, что эквивалентно функционированию устройства микросхемы памяти типа DDR; нижний соответствует случаю t AL = t RCD - 1, стандартному для DDR2. При такой конфигурации, как видно из рисунка, команды ACTIVATE и READ могут поступать на исполнение одна за другой. Фактическая реализация команды READ будет отложена на величину добавочной задержки, т.е. реально она будет исполнена в тот же момент, как и на диаграмме сверху.

На следующем рисунке приведен пример считывания данных из микросхемы DDR2 в предположении t RCD = 4 такта, что соответствует t AL = 3 тактам. В этом случае, благодаря введению дополнительной задержки, команды ACTIVATE/RD_AP могут исполняться подряд, в свою очередь, позволяя выдавать данные непрерывным образом и максимизировать реальную пропускную способность памяти.

Задержка выдачи CAS

Как мы видели выше, DDR2, с точки зрения частоты внешней шины, работает на более высоких скоростях, чем DDR SDRAM. В то же время, поскольку новый стандарт не предполагает каких-либо существенных изменений в технологии производства самих чипов, статические задержки на уровне устройства DRAM должны оставаться более-менее постоянными. Типичная величина собственной задержки устройств DRAM типа DDR 15 нс. Для DDR-266 (со временем цикла 7.5 нс.) это эквивалентно двум тактам, а для DDR2-533 (время цикла 3.75 нс.) четырем.

По мере дальнейшего увеличения частот памяти необходимо множить количество поддерживаемых значений задержки выдачи сигнала CAS (в сторону бо льших значений). Определенные стандартом DDR2 величины задержек CAS представлены в таблице. Они находятся в интервале целых чисел от 3 до 5 тактов; использование дробных задержек (кратных 0.5) в новом стандарте не допускается.

Задержки устройства DRAM выражаются размерностью цикла (t CK), т.е. равны произведению времени цикла на выбранное значение задержки CAS (t CL). Типичные значения задержек для устройств типа DDR2 попадают в интервал 12-20 нс., на основании которого и выбирается используемое значение задержки CAS. Использование бо льших величин задержки нецелесообразно из соображений производительности подсистемы памяти, а меньших ввиду необходимости стабильной работы устройства памяти.

Задержка записи

Стандарт DDR2 также вносит изменения в спецификацию задержки записи (команды WRITE). Различия в поведении команды записи в устройствах DDR и DDR2 представлены на рисунке.

DDR SDRAM имеет задержку записи, равную 1 такту. Это означает, что устройство DRAM приступает к «захвату» информации по шине данных в среднем через один такт после поступления команды WRITE. Тем не менее, учитывая возросшую скорость устройств DDR2, этот промежуток времени оказывается слишком малым для того, чтобы устройство DRAM (а именно, его буфер ввода-вывода) могло успешно подготовиться к «захвату» данных. В связи с этим, стандарт DDR2 определяет задержку записи как задержку выдачи CAS за вычетом 1 такта (t WL = t CL - 1). Отмечается, что привязка задержки WRITE к задержке CAS не только позволяет достичь более высоких частот, но и упрощает синхронизацию команд чтения и записи (настройку таймингов Read-to-Write).

Восстановление после записи

Процедура записи в память типа SDRAM аналогична операции чтения с разницей в дополнительном интервале t WR , характеризующем период восстановления интерфейса после проведения операции (обычно это двухтактная задержка между окончанием выдачи данных на шину и инициированием нового цикла). Этот временной интервал, измеряемый от момента окончания операции записи до момента вхождения в стадию регенерации (Auto Precharge), обеспечивает восстановление интерфейса после проведения операции записи и гарантирует корректность ее выполнения. Отметим, что стандарт DDR2 не вносит изменений в спецификацию периода восстановления после записи.

Таким образом, задержки устройств типа DDR2 в целом можно считать одной из немногих характеристик, по которой новый стандарт проигрывает спецификации DDR. В связи с чем совершенно очевидно, что использование равночастотной DDR2 вряд ли будет иметь какие-либо преимущества в плане скорости по отношению к DDR. Как это обстоит на самом деле как всегда, покажут результаты соответствующих тестов. Результаты тестирования в RightMark Memory Analyzer

Что ж, самое время теперь перейти к результатам тестирования, полученным в тестовом пакете версии 3.1. Напомним, что главными преимуществами этого теста по отношению к другим доступным тестам памяти является широкая функциональность, открытость методики (тест доступен всем желающим для ознакомления в виде ) и тщательно проработанная документация .

Конфигурации тестовых стендов и ПО

Тестовый стенд №1

Процессор: Intel Pentium 4 3.4 ГГц (ядро Prescott, Socket 478, FSB 800/HT, 1 МБ L2) на частоте 2.8 ГГц
Материнская плата: ASUS P4C800 Deluxe на чипсете Intel 875P
Память: 2x512 МБ PC3200 DDR SDRAM DIMM TwinMOS (тайминги 2.5-3-3-6)

Тестовый стенд №2

Процессор: Intel Pentium 4 3.4 ГГц (ядро Prescott, Socket 775, FSB 800/HT, 1 МБ L2) на частоте 2.8 ГГц
Материнская плата: Intel D915PCY на чипсете Intel 915
Память: 2x512 МБ PC2-4300 DDR2 SDRAM DIMM Samsung (тайминги 4-4-4-8)

Программное обеспечение

Windows XP Professional SP1
Intel Chipset Installation Utility 5.0.2.1003

Максимальная реальная пропускная способность памяти

Измерение максимальной реальной пропускной способности памяти проводилось с помощью подтеста Memory Bandwidth , пресеты Maximal RAM Bandwidth, Software Prefetch, MMX/SSE/SSE2 . Как говорит само название выбранных пресетов, в этой серии измерений используется стандартный метод оптимизации операций чтения из памяти Software Prefetch, суть которого заключается в предварительной выборке данных, которые будут востребованы позже из оперативной памяти в L2 кэш процессора. Для оптимизации записи в память используется метод прямого сохранения данных (Non-Temporal Store), позволяющий избежать «засорения» кэша. Результаты с использованием регистров MMX, SSE и SSE2 оказались практически идентичными для примера, ниже приведена картина, полученная на платформе Prescott/DDR2 с использованием SSE2.

Prescott/DDR2, максимальная реальная ПСП

Отметим, что существенных качественных отличий между DDR и DDR2 на равночастотных Prescott в этом тесте не наблюдается. Но более интересно то, что и количественные характеристики ПСП DDR-400 и DDR2-533 оказываются весьма близки! (см. таблицу). И это несмотря на то, что память типа DDR2-533 имеет максимальную теоретическую ПСП 8.6 ГБ/с (в двухканальном режиме). Собственно, ничего удивительного в полученном результате мы не видим ведь шина процессора это по-прежнему 800 МГц Quad-Pumped Bus, а ее пропускная способность 6.4 ГБ/с, поэтому именно она и является лимитирующим фактором.

Что касается эффективности операций записи, по отношению к чтению легко увидеть, что она осталась такой же. Впрочем, это вновь выглядит вполне естественно, поскольку в данном случае предел ПСП на запись (2/3 от ПСП на чтение) явно задается микроархитектурными особенностями процессора Prescott.

Латентность памяти

Прежде всего, остановимся несколько подробнее на том, как и почему мы измеряли «истинную» латентность памяти, поскольку ее измерение на платформах Pentium 4 на самом деле, далеко нетривиальная задача. А связано это с тем, что процессоры этого семейства, в частности, новое ядро Prescott, характеризуются наличием довольно «продвинутого» асинхронного аппаратного префетчера данных, весьма затрудняющего объективные измерения указанной характеристики подсистемы памяти. Очевидно, что использование методов последовательного обхода памяти (прямого либо обратного) для измерения ее латентности в данном случае совершенно не годятся алгоритм Hardware Prefetch в этом случае работает с максимальной эффективностью, «маскируя» латентности. Использование случайных режимов обхода гораздо более оправдано, однако, истинно случайный обход памяти имеет другой существенный недостаток. Дело в том, что такое измерение выполняется в условиях практически 100% промаха D-TLB, а это вносит существенные дополнительные задержки, о чем мы уже писали . Поэтому единственным возможным вариантом (среди реализованных в RMMA методов) является псевдослучайный режим обхода памяти, при котором загрузка каждой последующей страницы осуществляется линейно (сводя на нет промахи D-TLB), тогда как обход в пределах самой страницы памяти является истинно случайным.

Тем не менее, результаты наших прошлых измерений показали, что даже такая методика измерений довольно сильно занижает значения латентности. Мы считаем, что это связано с еще одной особенностью процессоров Pentium 4, а именно, возможностью «захвата» сразу двух 64-байтных строк из памяти в L2-кэш при каждом обращении к ней. Для демонстрации этого явления на представленном ниже рисунке приведены кривые зависимости латентности двух последовательных обращений к одной и той же строке памяти от смещения второго элемента строки относительно первого, полученные на платформе Prescott/DDR2 с помощью теста D-Cache Arrival , пресет L2 D-Cache Line Size Determination .

Prescott/DDR2, прибытие данных по шине L2-RAM

Из них видно (кривая случайного обхода является наиболее показательной), что доступ ко второму элементу строки не сопровождается какими-либо дополнительными задержками до 60 байт включительно (что отвечает истинному размеру строки L2-кэша, 64 байта). Область 64-124 байт соответствует чтению данных из следующей строки памяти. Поскольку величины латентности в этой области увеличиваются лишь незначительно, это означает, что последующая строка памяти действительно «подкачивается» в L2-кэш процессора сразу вслед за запрашиваемой. Какой же можно сделать из всего этого практический вывод? Самый прямой: для того, чтобы «обмануть» эту особенность алгоритма Hardware Prefetch, работающую во всех случаях обхода памяти, достаточно просто обходить цепочку с шагом, равным так называемой «эффективной» длине строки L2-кэша, которая в нашем случае составляет 128 байт.

Итак, перейдем непосредственно к результатам измерений латентности. Для наглядности, приведем здесь графики разгрузки шины L2-RAM, полученные на платформе Prescott/DDR2.

Prescott/DDR2, латентность памяти, длина строки 64 байта

Prescott/DDR2, латентность памяти, длина строки 128 байт

Как и в случае тестов реальной ПСП, кривые латентности на другой платформе Prescott/DDR на качественном уровне выглядят абсолютно так же. Несколько отличаются лишь количественные характеристики. Самое время обратиться к ним.

* латентность в условиях отсутствия разгрузки шины L2-RAM

Нетрудно заметить, что латентность DDR2-533 оказалась выше, чем у DDR-400. Впрочем, ничего сверхъестественного здесь нет согласно представленным выше теоретическим основам нового стандарта памяти DDR2, именно так оно и должно быть.

Различие в латентности между DDR и DDR2 почти незаметно при стандартном 64-байтном обходе памяти (3 нс. в пользу DDR), когда активно работает аппаратный префетчер, однако, при «двухстрочном» (128-байтном) обходе цепочки оно становится гораздо более заметным. А именно, минимум латентности DDR2 (55.0 нс) равен максимуму латентности DDR; если же сравнивать минимальные и максимальные латентности между собой, различие составляет примерно 7-9 нс (15-16%) в пользу DDR. В то же время, надо сказать, несколько удивляют практически равные значения «средней» латентности, полученные в условиях отсутствия разгрузки шины L2-RAM причем как в случае 64-байтного обхода (с префетчем данных), так и 128-байтного (без такового). Заключение

Главный вывод, который напрашивается на основании полученных нами результатов первого сравнительного тестирования памяти DDR и DDR2, в общем виде можно сформулировать так: «время DDR2 еще не настало». Основная причина заключается в том, что пока бессмысленно бороться за увеличение теоретической ПСП путем наращивания частоты внешней шины памяти. Ведь шина текущего поколения процессоров по-прежнему функционирует на частоте 800 МГц, что ограничивает реальную пропускную способность подсистемы памяти на уровне 6.4 ГБ/с. А это значит, что в настоящее время нет смысла устанавливать модули памяти, обладающие большей теоретической ПСП, поскольку ныне существующая и широко применяемая память типа DDR-400 в двухканальном режиме полностью себя оправдывает, да и вдобавок имеет меньшую латентность. Кстати, о последней увеличение частоты внешней шины памяти неизбежно связано с необходимостью введения дополнительных задержек, что, собственно, и подтверждают результаты наших тестов. Таким образом, можно считать, что использование DDR2 оправдает себя, как минимум, не ранее того момента, когда появятся первые процессоры с частотой шины 1066 МГц и выше, что позволит преодолеть ограничение, накладываемое скоростью шины процессора на реальную пропускную способность подсистемы памяти в целом.

Появлением на массовом рынке новых платформ все большую популярность приобретает память DDR2, которая постепенно начинает вытеснять память DDR. Первоначально существовала только память DDR2-400, на смену которой довольно быстро пришла память DDR2-533. А сейчас уже можно встретить память DDR2-667, DDR2-675, DDR2-750, DDR2-800, DDR2-900, DDR2-1000 и даже DDR2-1066. При этом отметим, что стандартизированной памятью в настоящее время является DDR2-533 и DDR2-667. В скором будущем будет также стандартизирована память DDR2-800, в связи с чем многие материнские платы уже поддерживают этот тип памяти. Остальные же типы памяти не стандартизированы, и не факт, что материнская плата способна поддержать эту память на заявленной тактовой частоте. Возникает вопрос: почему же производители памяти, соревнуясь друг с другом, стараются выпускать все более скоростную память? Ответ довольно прост это маркетинговый ход. Ведь, по мнению рядового покупателя, чем выше тактовая частота, тем лучше. Но так ли это на самом деле и действительно ли производительность памяти целиком и полностью определяется ее тактовой частотой? Действительно ли сегодня востребована скоростная память типа DDR2-1000 или же это не более чем соревнование между производителями памяти?

Оказывается, что тактовая частота далеко не единственная и даже не самая главная характеристика памяти, определяющая ее производительность. Куда более важной характеристикой является латентность памяти (тайминги памяти), и в этом смысле память DDR2-800 с большой латентностью будет менее производительной, чем память DDR2-667 с низкой латентностью.

Впрочем, чтобы разобраться во всех этих нюансах и выяснить, что такое латентность и почему эта характеристика более важна, чем тактовая частота, нам надлежит сначала понять, как работает оперативная память.

Что такое оперативная память

перативная память (или RAM-память Random Access Memory) это память с произвольным доступом.

Поскольку элементарной единицей информации является бит, оперативную память можно рассматривать как некий набор элементарных ячеек, каждая из которых способна хранить один информационный бит.

Элементарная ячейка оперативной памяти представляет собой конденсатор, способный в течение короткого промежутка времени сохранять электрический заряд, наличие которого можно ассоциировать с информационным битом. Проще говоря, при записи логической единицы в ячейку памяти конденсатор заряжается, при записи нуля разряжается. При считывании данных конденсатор разряжается через схему считывания, и если заряд конденсатора был ненулевым, то на выходе схемы считывания устанавливается единичное значение.

Поскольку элементарной единицей информации для современных компьютеров является байт (восемь бит), то для простоты можно считать, что элементарная ячейка памяти, которая может адресоваться, хранит не бит, а байт информации. Таким образом, доступ в памяти производится не побитно, а побайтно.

Микросхемы памяти организованы в виде матрицы, напоминающий лист бумаги в клетку, причем пересечение столбца и строки матрицы задает одну из элементарных ячеек. Кроме того, современные чипы памяти имеют несколько банков, каждый из которых можно рассматривать как отдельную матрицу со своими столбцами и строками.

На рис. 1 показана упрощенная схема чипа памяти, в котором имеется четыре банка, каждый из которых содержит 8192 строки и 1024 столбца. Таким образом, емкость каждого банка 8192x1024 = 8192 Кбайт = 8 Мбайт. Учитывая, что в чипе имеется четыре банка, получается, что полная емкость чипа составляет 32 Мбайт.

При обращении к той или иной ячейке памяти следует задать адрес нужной строки и столбца.

Для того чтобы получить доступ к ячейке памяти для записи или считывания информации, необходимо задать адрес этой ячейки. С учетом того, что в модуле памяти используется несколько чипов памяти, а в каждом чипе несколько банков памяти, прежде всего необходимо указать, в каком чипе и банке находится ячейка. Для этого используют специальные сигналы CS, BA0 и BA1.

Сигнал CS позволяет выбрать требуемый чип памяти. Когда сигнал активен, возможен доступ к чипу памяти, то есть чип активируется. В противном случае чип памяти недоступен.

Сигналы BA0 и BA1 позволяют адресовать один из четырех банков памяти. Учитывая, что каждый сигнал может принимать одно из двух значений: 0 или 1, комбинации 00, 01, 10 и 11 позволяют задать адрес четырех банков памяти.

Когда выбраны чип и банк памяти, можно получить доступ к требуемой ячейке памяти, задав адрес столбца и строки. Адрес строки и столбца передается по специальной мультиплексированной шине адреса MA (Multiplexed Address).

Для считывания адреса строки на входы матрицы памяти подается специальный стробирующий импульс RAS (Row Address Strobe). Если точнее, то этот импульс представляет собой изменение уровня сигнала с высокого на низкий, то есть при переходе сигнала RAS с высокого уровня на низкий возможно считывание адреса строки.

При этом отметим, что само считывание адреса строки происходит не в момент изменения RAS-сигнала, а синхронизовано с положительным фронтом тактирующего импульса.

Аналогичным образом считывание адреса столбца происходит при изменении уровня сигнала (стробирующего импульса) CAS# (Column Address Strobe) с высокого значения на низкое и синхронизовано с положительным фронтом тактирующего импульса.

Кстати, заметим, что, поскольку все события памяти (считывание адреса строки и столбца, выдача или запись данных) синхронизованы с фронтами тактирующего импульса, память называется синхронной.

Импульсы RAS# и CAS# подаются последовательно друг за другом, причем импульс CAS# всегда следует за импульсом RAS#, то есть сначала происходит выбор строки, а затем выбор столбца.

После считывания адреса строки и столбца ячейки памяти к ней возможен доступ для чтения или записи информации. Эти операции подобны друг другу, но для записи используется специальный разрешающий сигнал (стробирующий импульс) WE# (Write Enable). Если сигнал по напряжению меняется с высокого уровня на низкий, то в выбранную ячейку происходит запись информации. Если же сигнал WE# остается высоким, то происходит считывание информации с выбранной ячейки.

После того как все данные записаны или считаны с ячеек активной сроки, необходимо выполнить команду Precharge, которая закрывает активную строку и позволяет активировать следующую строку. Команды, используемые для записи или чтения, и соответствующие им состояния стробирующих импульсов представлены в табл. 1 и на рис. 2.

Таблица 1. Команды, используемые для записи или чтения ячеек памяти

Характеристики памяти

ак известно, главной характеристикой памяти является ее пропускная способность, то есть максимальное количество данных, которое можно считать из памяти или записать в память в единицу времени. Именно эта характеристика прямо или косвенно отражается в названии типа памяти.

Для того чтобы определить пропускную способность памяти, нужно умножить частоту системной шины на количество байт, передаваемых за один такт. Память SDRAM имеет 64-битную (8-байтную) шину данных.

К примеру, память DDR400 имеет пропускную способность 400 МГц x 8 байт = 3,2 Гбайт/с. Если память работает в двухканальном режиме, то теоретическая пропускная способность памяти удваивается, то есть для памяти DDR400 в двухканальном режиме она составляет 6,4 Гбайт/с. Теоретическая пропускная способность для различных типов памяти отображена в табл. 2.

Таблица 2. Соответствие типа памяти и теоретической пропускной способности

Казалось бы, чем больше пропускная способность памяти, тем лучше. Отчасти это справедливо, но лишь отчасти. Дело в том, что пропускная способность памяти должна быть сбалансирована с пропускной способностью процессорной шины. И если пропускная способность памяти превосходит пропускную способность процессорной шины, то именно процессорная шина становится узким местом в системе, ограничивая возможности памяти. Если рассматривать процессор Intel Pentium 4 или новые двухъядерные процессоры Intel Pentium D, то тактовая частота процессорной шины составляет 800 или 1066 МГц. Учитывая, что ширина шины составляет 64 бит (или 8 байт), получаем, что пропускная способность процессорной шины составляет 6,4 или 8,5 Гбайт/с. Из этого следует, что если в системе используется процессор с частотой FSB 800 МГц, то в одноканальном режиме для сбалансированного решения достаточно использовать память DDR2-800, а в двухканальном DDR2-400.

Аналогичным образом, если в системе используется процессор с частотой FSB 1066 МГц, то в одноканальном режиме для сбалансированного решения потребуется использовать память DDR2-1066, а в двухканальном достаточно памяти DDR2-533.

С учетом того, что типичной ситуацией является использование памяти в двухканальном режиме, память DDR2-533 вполне обеспечивает сбалансированное решение.

Возникает вопрос: если память DDR2-533 обеспечивает пропускную способность, согласующуюся с пропускной способностью процессорной шины, зачем тогда нужна более быстродействующая память? Дело в том, что до сих пор мы говорили лишь о теоретической, то есть о максимально возможной пропускной способности, которая реализуется только в случае последовательной передачи данных когда данные передаются с каждым тактом. В реальной ситуации теоретический предел недостижим, поскольку, кроме этого, необходимо учитывать и такты, которые необходимы для получения доступа к самой ячейке памяти, а также для настроек модуля памяти. В связи с этим другими важными характеристиками памяти являются тайминги памяти или ее латентность.

Под латентностью принято понимать задержку между поступлением команды и ее реализацией. В этом смысле латентность можно сравнить с телефонным звонком. Время, которое проходит от набора номера (вызова абонента) и до ответа в трубке, это и есть латентность телефонного вызова.

Латентность памяти, которая определяется ее таймингами, это задержки, измеряемые в количествах тактов, между отдельными командами. Рассмотрим тайминги памяти более подробно. На рис. 3 показана последовательность команд при чтении или записи данных в память. Первоначально происходит активация нужной строки памяти (команда ACTIVE), для чего сигнал RAS переводится в низкий уровень и происходит считывание адреса строки. Далее следует команда записи (WRITE) или чтения (READ) данных, для чего сигнал CAS переводится в низкий уровень и в надлежащий уровень устанавливается сигнал WE. При установке CAS в низкий уровень после прихода положительного фронта тактирующего импульса происходит выборка адреса столбца, наличествующего в данный момент на шине адреса, и открывается доступ к нужному столбцу матрицы памяти. Однако команда чтения или записи не может следовать непосредственно за командой активации требуется, чтобы между этими командами, то есть между импульсами RAS и CAS, существовал некий промежуток времени RAS to CAS Delay (задержка сигнала CAS относительно сигнала RAS). Эту задержку, измеряемую в тактах системной шины, принято обозначать tRCD.

После команды чтения (записи) данных и до выдачи первого элемента данных на шину (записи данных в ячейку памяти) проходит промежуток времени, который называется CAS Latency. Эта задержка измеряется в тактах системной шины и обозначается tCL. Каждый последующий элемент данных появляется на шине данных в очередном такте.

Завершение цикла обращения к банку памяти осуществляется подачей команды PRECHARGE, приводящей к закрытию строки памяти. После команды PRECHARGE и до поступления новой команды активации строки памяти должен пройти промежуток времени (tRP), называемый Row Precharge.

Еще один тип задержки, называемый ACTIVE to PRECHARGE delay, это промежуток времени между командой активации строки памяти и командой PRECHARGE. Эта задержка обозначается tRAS и измеряется в тактах системной шины.

Ну и последний тип задержки, который необходимо упомянуть, это скорость выполнения команд (Command Rate). Command Rate это задержка в тактах системной шины между командой CS# выбора чипа и командой активации строки. Как правило, задержка Command Rate составляет один или два такта (1T или 2T).

Описанные задержки RAS to CAS Delay (tRCD), CAS Latency (tCL) и Row Precharge (tRP) определяют тайминги памяти, записываемые в виде последовательности tCLtRCDtRPtRASCommand Rate. К примеру, для модуля DDR400 (PC3200) тайминги могут быть следующими: 2-3-4-5-(1T). Это означает, что для данного модуля CAS Latency (tCL) составляет 2 такта, RAS to CAS Delay (tRCD) 3 такта, Row Precharge (tRP) 4 такта, ACTIVE to PRECHARGE delay (tRAS) 5 тактов и Command Rate 1 такт.

Понятно, что чем меньше тайминги, тем более быстродействующей является память. Поэтому если сравнивать память с таймингом 3-3-3-5-(1T) и память с таймингом 3-2-2-5-(1T), то последняя оказывается более быстродействующей.

Память SDR

азобравшись с такими важными характеристиками памяти, как ее тайминги, можно перейти непосредственно к принципам работы памяти. Несмотря на то что данная статья посвящена современной памяти DDR2, рассмотрение принципов работы памяти мы начнем с синхронной SDRAM-памяти типа SDR (Single Data Rate).

В SDR SDRAM-памяти обеспечивается синхронизация всех входных и выходных сигналов с положительными фронтами импульсов тактового генератора. Весь массив памяти SDRAM-модуля разделен на два независимых банка. Такое решение позволяет совмещать выборку данных из одного банка с установкой адреса в другом банке, то есть одновременно иметь две открытые страницы. Доступ к этим страницам чередуется (bank interleaving), и соответственно устраняются задержки, что обеспечивает создание непрерывного потока данных.

Наиболее распространенными типами SDRAM-памяти до недавнего времени являлись PC100 и PC133. Цифры 100 и 133 определяют частоту системной шины в мегагерцах (МГц), которую поддерживает эта память. По внутренней архитектуре, способам управления и внешнему дизайну модули памяти PC100 и PC133 полностью идентичны.

В SDRAM-памяти организована пакетная обработка данных, что позволяет производить обращение по новому адресу столбца ячейки памяти на каждом тактовом цикле. В микросхеме SDRAM имеется счетчик для наращивания адресов столбцов ячеек памяти, чтобы обеспечить быстрый доступ к ним.

В SDRAM-памяти ядро и буферы обмена работают в синхронном режиме на одной и той же частоте (100 или 133 МГц). Передача каждого бита из буфера происходит с каждым тактом работы ядра памяти.

Временная диаграмма работы памяти SDR SDRAM показана на рис. 4.

Память DDR

амять DDR SDRAM, которая пришла на смену памяти SDR, обеспечивает в два раза большую пропускную способность. Аббревиатура DDR (Double Data Rate) в названии памяти означает удвоенную скорость передачи данных. В DDR-памяти каждый буфер ввода-вывода передает два бита за один такт, то есть фактически работает на удвоенной тактовой частоте, оставаясь при этом полностью синхронизированным с ядром памяти. Такой режим работы возможен в случае, если эти два бита доступны буферу ввода-вывода на каждом такте работы памяти. Для этого требуется, чтобы каждая команда чтения приводила к передаче из ядра памяти в буфер сразу двух бит. С этой целью используются две независимые линии передачи от ядра памяти к буферам ввода-вывода, откуда биты поступают на шину данных в требуемом порядке.

Поскольку при таком способе организации работы памяти происходит предвыборка двух бит перед передачей их на шину данных, его также называют Pre-fetch 2 (предвыборка 2).

Для того чтобы осуществить синхронизацию работы ядра памяти и буферов ввода-вывода, используется одна и та же тактовая частота (одни и те же тактирующие импульсы). Только если в самом ядре памяти синхронизация осуществляется по положительному фронту тактирующего импульса, то в буфере ввода-вывода для синхронизации используется как положительный, так и отрицательный фронт тактирующего импульса (рис. 5). Таким образом, передача двух бит в буфер ввода-вывода по двум раздельным линиям осуществляется по положительному фронту тактирующего импульса, а их выдача на шину данных происходит как по положительному, так и по отрицательному фронту тактирующего импульса. Это обеспечивает в два раза более высокую скорость работы буфера и соответственно вдвое большую пропускную способность памяти (см. рис. 5).

Все остальные принципиальные характеристики DDR-памяти не изменились: структура нескольких независимых банков позволяет совмещать выборку данных из одного банка с установкой адреса в другом банке, то есть можно одновременно иметь две открытые страницы. Доступ к этим страницам чередуется (bank interleaving), что приводит к устранению задержек и обеспечивает создание непрерывного потока данных.

Память DDR2

сли следовать терминологии SDR (Single Data Rate), DDR (Double Data Rate), то память DDR2 было бы логично назвать QDR (Quadra Data Rate), поскольку этот стандарт подразумевает в четыре раза большую скорость передачи, то есть в стандарте DDR2 при пакетном режиме доступа данные передаются четыре раза за один такт. Для организации данного режима работы памяти необходимо, чтобы буфер ввода-вывода работал на учетверенной частоте по сравнению с частотой ядра памяти. Достигается это следующим образом: ядро памяти, как и прежде, синхронизируется по положительному фронту тактирующих импульсов, а с приходом каждого положительного фронта по четырем независимым линиям в буфер ввода-вывода передаются четыре бита информации (выборка четырех битов за такт). Сам буфер ввода-вывода тактируется на удвоенной частоте ядра памяти и синхронизируется как по положительному, так и по отрицательному фронту этой частоты. Иными словами, с приходом положительного и отрицательного фронтов происходит передача битов в мультиплексном режиме на шину данных (рис. 6). Это позволяет за каждый такт работы ядра памяти передавать четыре бита на шину данных, то есть вчетверо повысить пропускную способность памяти.

По сравнению с памятью DDR, память DDR2 позволяет обеспечить ту же пропускную способность, но при вдвое меньшей частоте ядра. К примеру, в памяти DDR400 ядро функционирует на частоте 200 МГц, а в памяти DDR2-400 на частоте 100 МГц. В этом смысле память DDR2 имеет значительно большие потенциальные возможности для увеличения пропускной способности по сравнению с памятью DDR.

От теории к практике: память DDR2-667 Kingmax KLCD48F-A8EB5-ECAS

зучив теоретические аспекты функционирования современной памяти DDR2, перейдем от теории к практике. В качестве примера мы рассмотрим новую память SDRAM DDR2-667 компании Kingmax. Стенд для тестирования имел следующую конфигурацию:

процессор: Intel Pentium 4 570 (тактовая частота 3,8 ГГц, кэш L2 1 Мбайт);
частота FSB: 800 МГц;
материнская плата: MSI P4N Diamond;
чипсет: NVIDIA nForce4 SLI Intel Edition;
память: два модуля DDR2-667 Kingmax KLCD48F-A8EB5-ECAS объемом по 1 Гбайт каждый (двухканальный режим работы);
видеокарта: MSI NX6800 Ultra-T2D512E.

К сожалению, технической информации о модулях Kingmax KLCD48F-A8EB5-ECAS на сайте производителя маловато. Единственное, что удалось узнать, так это об организации модуля (8Ѕ128 Мбайт) и о значении параметра CAS Latency, которое составляет 5 тактов.

Для тестирования памяти мы использовали тестовый пакет RightMark Memory Analyzer v 3.55 и набор игровых бенчмарков: Half-Life 2, DOOM 3, FarCry 1.3, Unreal Tournament 2004 и 3DMark 2003. С целью увеличения нагрузки на процессор и память при тестировании использовалось разрешение 640Ѕ480 точек, а драйвер видеокарты настраивался на максимальную производительность.

Как выяснилось в процессе тестирования, модули памяти KLCD48F-A8EB5-ECAS имеют тайминги по умолчанию (by SPD) и составляют последовательность 5-5-5-13-(2T). Таким образом:

CAS Latency (tCL) 5T;

RAS to CAS delay (tRCD) 5T;

Row Precharge (tRP) 5T;

Active to Precharge (tRAS) 13T;

Command Rate 2T.

Для того чтобы оценить потенциальные возможности модулей памяти по разгону (но без ущерба для стабильности), мы также провели тестирование в режиме с наименьшими таймингами, которые были определены методом проб и ошибок. Как выяснилось, минимальные тайминги, которые поддерживают данные модули памяти на тактовой частоте 667 МГц, составляют последовательность 4-3-3-5-(2T). Кроме того, мы провели разгон памяти по тактовой частоте, чтобы оценить максимально возможную тактовую частоту, поддерживаемую данными модулями при работе в двухканальном режиме.

Для тестирования с использованием тестового пакета RightMark Memory Analyzer v 3.55 использовались встроенные в бенчмарк пресеты:

RAM Performance Stream;

Average Memory Bandwidth, SSE2;

Maximal RAM Bandwidth, Software Prefetch, SSE2;

Average RAM Latency;

Minimal RAM Latency, 16 Mbyte Block, L1 Cache line.

С подробным описанием каждого пресета можно ознакомиться на сайтах www.rightmark.org или www.ixbt.com .

Результаты тестирования с использованием тестового пакета RightMark Memory Analyzer v 3.55 представлены в табл. 3.

с использованием тестового пакета RightMark Memory Analyzer v 3.55

Как следует из результатов тестирования, тайминги по умолчанию (by SPD) являются сильно завышенными. Уменьшение таймингов не оказывает влияния на стабильность работы модулей памяти, однако приводит к значительному увеличению пропускной способности памяти и к снижению латентности. Так, максимальная пропускная способность памяти при таймингах 5-5-5-13-(2T) составляет 5967,3 Мбайт/с (операция чтения, пресет Maximal RAM Bandwidth, Software Prefetch, SSE2). В то же время при уменьшении таймингов до 4-3-3-5-(2T) пропускная способность увеличивается до 6294,9 Мбайт/с, то есть на 5,5%. Отметим, что значение 6294,9 Мбайт/с близко к теоретическому пределу пропускной способности процессорной шины, которая в данном случае составляет 6,4 Гбайт/с.

Увеличение тактовой частоты до 710 МГц не оказывает влияния на стабильность в работе памяти, однако добиться значительного увеличения производительности памяти в данном случае не удается, что еще раз подтверждает тот факт, что изменение таймингов памяти оказывает существенно большее влияние на производительность памяти, нежели увеличение тактовой частоты.

Теперь обратимся к результатам игровых тестов (табл. 4). Как видите, уменьшение таймингов памяти позволяет (хотя и незначительно) увеличить результаты во всех игровых тестах. В то же время увеличение тактовой частоты памяти никак не отражается на результатах теста.

***

Итак, если говорить о рассмотренных модулях памяти Kingmax KLCD48F-A8EB5-ECAS, то можно констатировать, что в сочетании с материнской платой MSI P4N Diamond, а следовательно, и с чипсетом NVIDIA nForce4 SLI Intel Edition, эти модули обеспечивают гарантированно стабильную работу и прекрасно разгоняются путем уменьшения таймингов. Именно поэтому мы решили присвоить модулям Kingmax KLCD48F-A8EB5-ECAS знак «Редакция рекомендует».

Редакция выражает признательность компании Kingmax (www.kingmax.com ) за предоставление модулей памяти Kingmax KLCD48F-A8EB5-ECAS.