На что влияет оперативная система. Скорость оперативной памяти: мифы и факты

Сейчас, в характеристиках смартфонов не редко указываются очень большие объемы оперативной памяти. Например, сейчас обычным объемом оперативной памяти для среднего смартфона считается 3-4 Гб, в то время как флагманские смартфоны вообще получают по 6 или больше гигабайт памяти. Но, далеко не все пользователи понимают, на что влияет оперативная память в смартфоне и зачем ее так много. В данном материале мы попробуем разобраться с этими вопросами.

Длят того чтобы разобраться с тем, что такое оперативная память смартфона, нужно сначала дать общее определение оперативной памяти.

Чипы оперативной памяти для смартфонов

(оперативно запоминающее устройство) – это тип памяти, который присутствует в любой компьютерной технике. Это энергозависимая память, которая используется для хранения нужных в работе компьютера данных. Плюсом данной памяти является то, что она очень быстрая. Оперативная память намного быстрее жестких дисков и флеш-накопителей. Благодаря этому обмен данными между оперативной памятью и процессором происходит очень быстро. Минусом данного типа памяти является то, что она зависит от энергоснабжения. Другими словами, она не может хранить данные без постоянного снабжения электроэнергией. Как только пропадает энергоснабжение, все содержимое оперативной памяти стирается. Поэтому оперативная память не используется для долговременного хранения данных (как жесткие диски или флеш-накопители), а только для временного хранения тех данных, которые нужны компьютеру прямо сейчас.

В смартфоне оперативная память выполняет точно те же функции, что и в любом другом компьютере. В ней хранятся данные, которые нужны смартфону для работы прямо сейчас. Это данные запущенных приложений, данные операционной системы, открытые файлы, загруженные веб-страницы и т.д. Никаких принципиальных отличий в использовании оперативной памяти на смартфоне нет.

Чем отличается оперативная память от встроенной памяти

Как уже было сказано выше, оперативная память смартфона – это очень быстрая энергозависимая память, содержимое которой удаляется при выключении питания (например, при выключении смартфона). В связи с этим характеристиками, оперативная память может использовать только для временного хранения данных, с которыми смартфон работает в текущий момент.

Встроенная память (которую также называют постоянной или внутренней) – это память, которая построена на совершенно других принципах. Данная память не зависит от энергопитания и продолжает хранить записанные в нее данные даже после полного отключения питания. Именно встроенную память используют для хранения файлов операционной системы (Android, iOS), файлов приложений и пользовательских данных.

На что влияет оперативная память в смартфоне

В характеристиках смартфонов часто указываются большие объемы оперативной памяти. Сейчас, обычным объемом считается 3-4 Гб, а флагманские смартфоны вообще получают по 6 или больше гигабайт памяти. Но, далеко не все пользователи понимают, на что влияет оперативная память в смартфоне и зачем ее так много.

Если коротко, то всей системы смартфона. Во-первых, влияет скорость самой оперативной памяти. Оперативная память может работать на разной частоте и чем она быстрее, тем быстрее процессор получает нужные ему данные и быстрее выполняет нужные операции. В более современных смартфонах устанавливается более быстрая память, что ускоряет работу всего смартфона в целом.

Во-вторых, влияет объем оперативной памяти. Чем больше объем оперативной памяти, тем реже приходится обращаться к медленной встроенной памяти. Это экономит время и позволяет процессору выполнять работу быстрее.

Все это сказывается на пользовательском опыте работы. Более быстрая память с большим объемом позволяет смартфону более быстро реагировать на действия пользователя. В частности, уменьшаются задержки при запуске приложений, переключении между вкладками в браузере и т.д.

Как узнать сколько оперативной памяти на смартфоне

Объем оперативной памяти смартфона в программе AIDA64

Самый простой способ узнать, сколько оперативной памяти на смартфоне, это ввести название смартфона в поисковую систему и посмотреть технические характеристики на любом сайте. Но, если вы не знаете точного названия модели вашего смартфона, то можно установить специальное приложение для просмотра технических характеристик.

Например, если у вас смартфон с операционной системой Android, то вы можете воспользоваться бесплатным приложением AIDA64. Запустите данное приложение на своем смартфоне и перейдите в раздел «Система». Здесь среди прочих характеристик смартфона будет указан и объем оперативной памяти (ОЗУ).

В данном случае у смартфона 2 Гб оперативной памяти типа LPDDR3.

Как увеличить оперативную память на смартфоне

После ознакомления описанной выше информацией, у вас может возникнуть вопрос, а можно ли увеличить оперативную память смартфона. К сожалению, это практически невозможно. Оперативная память смартфона распаяна на плате и ее замена пользователем не предусмотрена.

Конечно, теоретически можно найти подходящие чипы памяти и в условиях сервисного центра запаять их на плату. Но, на практике реализовать подобный апгрейд смартфона вряд ли получится. Для этого нужно убедиться, что процессор смартфона поддерживает больший объем памяти, найти подходящие чипы, найти сервисный центр и т.д. И в итоге процедура выйдет дороже чем покупка нового смартфона.

Со встроенной памятью ситуация чуть лучше. Если смартфон поддерживает карты памяти microSD, то вы можете установить в смартфон такую карту и увеличить объем встроенной памяти. Это позволит освободить внутреннюю память от хранения фотографий, музыки и других файлов пользователя.

Большинство пользователей представляют себе, на что влияет скорость оперативной памяти . Она отвечает за передачу данных, и чем эта комплектующая часть будет мощнее, тем быстрее будут работать приложения, а особенно игры. При ее недостаточном объеме, все процессы, программы будут загружаться довольно долго, а то и вовсе вылетать, вплоть до незапланированной перезагрузки ОС, что будет вызывать неподдельное раздражение у пользователя.

Принцип работы и основные характеристики ОЗУ

  1. Объем памяти

Оперативная память представляет собой микросхему, в которой отсутствует автономное питание. Иными словами, если компьютер выключается, то и вся информация, хранившаяся в ОЗУ стирается. Взаимодействие оперативки с процессором осуществляется посредством кэш или память нулевого уровня.

Быстродействие ОЗУ зависит от нескольких параметров, среди которых можно выделить тип, а также частоту. При этом, наиболее важным показателем является объем. Для современных компьютеров, минимальный порог должен составлять 2 гигабайта. Это связано с тем, что начиная с версии Windows Vista, операционная система забирает под свои нужды 1 Гб, а соответственно для полноценной работы приложений необходимо иметь хотя бы такой же размер. Меньший объем конечно же встречается (хотя в магазинах таких планок уже нет), но эти компьютеры уже безнадежно устаревшие и на них практически невозможно установить , а также ресурсоемкие программы.

Наиболее оптимальным вариантом на данный момент для бюджетного компьютера будет установка 4-х гигабайт ОЗУ. Это обеспечит нормальную и быструю работу в интернете, даст возможность смотреть видео различного качества и устанавливать современные игры с использованием средних настроек (хотя видео и игры еще зависят и от ).

Для более продвинутых пользователей, которые работают с графикой или редактируют аудио- видео- потоки, необходим объем оперативки, который должен составлять от 8-ми до 16-ти Гб, при этом не нужно забывать, что в этом случае необходима и хорошая графическая карта c чипсетом GDDR5 и в которой будет не менее 4-х Гб оперативки. При установке большего объема ОЗУ, например 32 Гб, об установке дополнительных планок, в свободные слоты для нее (если таковые будут), можно за быть на несколько лет.

Примечание: при установке большего количества оперативной памяти, не стоит думать, что компьютер будет после этого летать, ведь быстродействие зависит и от процессора, и от иных комплектующих. К тому же, не нужно забывать, что 32-х битные версии операционных систем могут использовать лишь 3,2 Гб ОЗУ, остальной объем будет простаивать.

  1. Тип оперативной памяти

От этого параметра также зависит скорость передачи данных. В современных компьютерах уже нигде не используется DDR тип, а только лишь с индексами 2,3 или 4. Это обязательно стоит учитывать, если пользователь решил докупить и установить в свободный слот дополнительную планку, потому как хоть по длине и ширите они одинаковы, на соединении с материнской размещена прорезь, которая располагается на различных расстояниях (см. скриншот), а соответственно не смогут быть установлены.

Стоит отметить, что DDR 2 уже редко можно встретить и на данный момент, практически везде устанавливается тип DDR 3. Наиболее современный тип оперативной памяти DDR 4 встречается крайне редко, в основном на тех компьютерах, которые были приобретены или модернизированы относительно недавно. А если учесть то, что на все материнские платы, поддерживающие DDR 4, можно установить лишь процессоры Intel, которые в значительной степени дороже AMD, это тоже влияет на популяризацию современного типа памяти. Хотя можно с уверенностью утверждать, что с DDR 4, эффективность возрастет в 1,5-2 раза.

  1. Частота

Этот параметр также напрямую связан с . Чем выше частота, тем быстрее производится скорость обмена данных. Среди вышеупомянутых типов ОЗУ уже нет таких планок, в которых частота была бы ниже 1600 МГц, однако эта величина на последних моделях может достигать отметки 3200 МГц.

Опять же, если владелец компьютера решил приобрести оперативку и установить ее в дополнительный слот, ему следует учесть следующее:

  • частота новой планки должна быть идентична той, которая уже установлена, в противном случае они не смогут параллельно работать;
  • желательно устанавливать ОЗУ от одного производителя, ведь случаются ситуации, когда некоторые планки с одинаковой частотой, но разных брендов могут конфликтовать между собой и компьютер попросту не будет запускаться;
  • также может быть ограничена этим параметром: перед тем, как приобретать новую оперативку, просмотрите характеристики материнки, чтобы все нюансы были соблюдены и компьютер работал;
  1. Увеличение эффективности работы

Иногда у пользователя установлено достаточное количество оперативной памяти, при этом компьютер подтормаживает и человек принимает решение докупать ОЗУ. В некоторых случаях это может совершенно не понадобиться, можно лишь выполнить оптимизацию:

  • просмотрите в диспетчере задач, насколько загружена оперативная память, и если здесь имеется достаточный запас, тогда, скорее всего, дело не в ОЗУ и дополнительная планка проблему не решит;

  • выгрузите приложения, которые в данный момент не используются, а также проверьте список программ, которые расположены в автозапуске. Если в нем будут находиться такие приложения, которые довольно редко и точно не нужны при старте компьютера, также удалите их из этого списка;
  • , ведь иногда некоторые процессы могут подвисать в оперативной памяти и загромождать ее, что и может приводить к торможениям и фризам.

Можно также попробовать разогнать оперативку. Это можно сделать из-под БИОС. Но при этом стоит помнить, что некоторые магазины в подобных случаях могут отказать в гарантийном обслуживании (обмене), да и срок службы будет меньше, чем без выполнения этого действия.


Что такое оперативная память (оперативка)? Оперативная память компьютера или ноутбука – это важнейший элемент системы, который напрямую отвечает за быстродействие приложений. Именно в ней хранятся временные данные и команды, которые необходимы процессору в его работе для выполнения конкретных операций. В этой статье речь пойдет о том, какой бывает “оперативка”. Мы проясним некоторые аспекты тестирования ОЗУ и разгона модулей памяти. Расскажем, как правильно установить ее в компьютер или ноутбук.

Существуем множество видов оперативной памяти, которые предназначены для своих собственных направленных задач. Мы же остановимся на самых актуальных. Понимание этого, поможет вам определить, какая именно ОЗУ стоит в вашем системном блоке и при необходимости .


Тип и объем оперативной памяти

  • Дустов

  • ольга

    Здравствуйте! Купила ноутбук, и только начав на нем работать увидела, что он тормозит. Оперативка 2GB DDR3 L Memory. Открыто две страницы. Это означает что оперативка слабая или в ней брак? Память ноута 370 свободно из 500.

  • Олег

    Здравствуйте, скажите пожалуйста, какие проблемы могут возникнуть при использовании карт памяти не из списка VQL для установленной материнской платы? Купил память, но не проверил сразу на совместимость. Компьютер включается, всё работает но хочется знать, что я теряю с такой памятью.

  • Мейлис

  • 70oleg

    Добрый день! Приобрел HP p161nr Intel Core i7 4510u CPU 2GHz 2.6GHz ОЗУ 4 ГБ, 64 разрядная операционная система процессор X64, Intel Core i5-2430M с частотой 2,4 ГГц, 8 ГБ оперативной памяти, жесткий диск объёмом 750 ГБ и производительная видеокарта GeForce GT840M с 2048 МБ установлена W 8.1; раньше был ASUS к53s Intel Core i5-2430M с частотой 2,4 ГГц, 16 ГБ (ставил дополнительно) оперативной памяти, видеокарта GeForce GT540M с 2048 МБ, но такое ощущение что новый работает медленнее в играх и программах. Кроме этого если включаешь какую нибудь игру вентилятор как пропеллер визжит. Это из-за оперативки?

  • Ната

    Здравствуйте! Выбираю ноутбук с диагональю 11″
    Про оперативную память там написано:
    Тип оперативной памяти DDR3
    Объём оперативной памяти 4096 МБ
    Частота оперативной памяти, МГц 1600
    Количество слотов оперативной памяти Один

    Не могу понять, это слабый ноут?

  • Ермак

    Здравствуйте. У меня такая проблема: мой процессор такой:с возможностью поддержки 32 и 64-х разрядной ОС, Intel Core i3 3.10 GHz, ОЗУ 2Gb, видеокарта GT440 1Gb, ОС WINDOWS7 32-х разрядная. В последнее время стало выкидывает из игры Euro Truck Simulator 2, хотя раньше эта игра запускалась без проблем и не было таких проблем, а требование игры такие:ОЗУ 2ГБ 2.3GHz. Но на других играх и приложениях такой проблемы не наблюдал.Не скажите в чём может быть проблема?

  • Юрий

    Добрый день! Такой вопрос-ноутбук с оперативкой 4+2гб. 4 распаяны на материнке и планка на 2 в слоте. Если в слот поставить планку на 8гб будет ли память работать в двухканальном режиме или из-за разности объемов (4-8) не будет и лучше поставить планку на 4гб? Спасибо!

  • Юрий

  • toijim

    aser aspire v5-132p-10192g32nss
    intel 1019Y
    2gb ddr3 low voltage memory(впаянная и пустой слот)
    как мне выбрать оперативную память куда и на какие цифры смотреть спс

  • Андрей

    здравствуйте! подскажите пожалуста у меня через не которое время зависает на мертво комп,выкл. только пренудительно. часто бывает когда качаю что то через торрент.бывает проподает языковая раскладка((((бида полнейшая(

  • Димон

    Здравствуйте, такая проблема: Мой друг купил компьютер и там стоит оперативка, но только одна. Его компьютер просто выключается, когда он заходит в любую игру.Может быть такое, что при покупке, в его компьютере поставили только одну оперативку, и из-за этого он выключается?

  • lili

  • Roman777

  • Веталь

    я брал в МОЙО httр://www.moyo.ua/comp-and-periphery/periphery-and-compon/memory2/ Kingston DDR3 1600 8GB для Apple , теперь летает без малейших намеков на глюки. Скажите, это самый лучший вариант для моего ноута?

  • пп

    Здравствуйте. Вопрос «чайника». Хочу купить новый ноутбук исключительно для просмотр-прослушивание….. по ИНТЕРНЕТУ: 1) кинофильмы. 2)онлайн-ТВ, т.ч. зарубежных. 3) видео, с возможностью записи на винчестер понравившиеся видеоклипы — концерты-музыку…. . И обязательно с установкой сабвуфер с колонками. Дабы хоть немного насладиться музыкой в исполнении известных исполнителей, оркестров, … Посоветуйте, с какими теххарактеристиками следует купить ноутбук. И это как я понимаю, в первую очередь 1) частота, 2)объем ОЗУ 3) какие то параметры так называемой видеокарты, 4) и прочие. С уважением, Петрович

  • пп

    Доп. к предыдущему. И обязательно установить только Виндовс ХР. То что предлагают продавцы — виндовс 7 и 8, мне очень не нравится. Хочу и далее работать с моей привычной программой — Windows XP/

  • Иван

    День добрый, я тут столкнулся с одной очень деликатной проблемой зависания компа. В целом комп работает отлично и никаких глюков-вылетов и артефактов не выдает, но во время просмотра через любой браузер видео в развёрнутом виде виснет если смотреть не в маленьком виде ничего не виснет. Да не просто виснет а так что полностью перестает реагировать на мышь, клавиатуру, кнопку выключения. Он стабильно показывает статическую картинку и мерно гудит себе. Причём когда играю в онлаин игру например ворлд оф танкс ничего не зависает. Стоит только включить онлайн просмотор в развёрнутом виде всё полный ступор. Перезагрузить его удается только варварским ресетом. Но когда я просматриваю фильмы скаченные через проигрыватель то всё идёт и не дёргается даже.

  • Один из частых вопросов, который задают новички при выборе своего первого персонального компьютера или мобильной вычислительной системы - это «на что влияет оперативная память?». Действительно, на что?

    Если с все относительно просто - чем выше частота, тем быстрее выполняются арифметические действия (это слишком смелое обобщение, но для примера подойдет), то в отношении объема памяти не все так очевидно.

    В результате покупатель, который не знает, на что влияет оперативная память, чаще всего приобретает систему либо с недостаточным объемом, желая сэкономить несколько десятков долларов, либо - другая крайность - с огромным запасом на будущее. Увы, прежде чем это время настает, компьютер несколько раз меняют на более новую модель. Вывод: каждому начинающему пользователю необходимо хорошо разбираться в вопросе «на что влияет оперативная память».

    Ответ прост - она определяет в целом. И вот почему. Данные, считываемые с попадают не сразу на обработку в вычислительный блок, а сначала закачиваются в оперативную память.

    Оттуда их «забирает» процессор, выполняет необходимые математические операции и отправляет опять в модули. Таким образом, из вышесказанного можно сделать два вывода. Первый: даже самая современная система не может работать без оперативной памяти. Второй: параметры модулей непосредственно влияют на скорость работы компьютера, так как являются неотъемлемой частью логической цепочки.

    Наиболее очевидная характеристика - это объем. В современных модулях он измеряется в гигабайтах (раньше были килобайты и мегабайты). Единица информации - бит. Один байт состоит из восьми таких единиц (двоичных разрядов). Соответственно, «кило» - тысяча, «мега» - миллион и т. д. Общее правило: чем больше, тем лучше. Но, не полностью понимая, на что влияет оперативная память, нельзя ему слепо следовать. Дело в том, что есть ряд важных оговорок. К примеру, для центрального малопроизводительного процессора нет смысла подключать 8 Гб оперативной памяти, так как их потенциал все равно не будет полностью реализован.

    Это важный момент. Для пояснения воспользуемся аналогией: ничего не мешает установить на бюджетном легковом автомобиле двигатель от спортивного болида F-1, но вполне понятно, что скорость, которую он помогает развить машине, будет недостижимой, потому что все другие узлы окажутся самыми настоящими «путами», ограничивающими потенциал. Как правило, для вычислительных систем, основными задачами которых является работа с офисными приложениями, серфинг в Интернете, просмотр видео, вполне достаточным считается объем в 2 Гб, а идеальным (с запасом, не слишком «бьющим по кошельку») - в 4 Гб. Совершенно другая ситуация с мощными игровыми компьютерами - для них нормой стало 8 Гб оперативной памяти. Сейчас уже никого не удивляет даже 16 Гб, ведь нет предела совершенству.

    Чтобы приобрести хорошие модули (планки), понадобится программа тестирования памяти. Их довольно много, но одна из лучших - это TestMem, работающая в ДОС (необходима загрузочная флешка или диск). Нужно не полениться, а сразу после покупки протестировать модули на наличие ошибок. Выявив сбойную планку, ее можно легко поменять.

    Последний совет, который, увы, часто игнорируется: имеет смысл приобрести два модуля меньшего объема, чем один вместительный. При таком подключении задействуется увеличивающий пропускную способность подсистемы.

    анонс новой утилиты измерения производительности с точки зрения приложений, зависимых от скорости работы памяти

    Как правило, при тестировании производительности платформ акцент делается на процессорозависимые приложения. Но скорость системы зависит не только от центрального процессора. И сейчас мы даже не вспоминаем о графически насыщенных приложениях и использовании GPU для вычислений общего назначения, в которых значимую роль играет выбор видеокарты. Речь, как нетрудно догадаться, пойдет о влиянии производительности памяти, и нашей попытке количественно оценить это влияние.

    Зависимость общей производительности системы от памяти имеет сложный характер, что затрудняет прямую оценку скорости памяти, то есть сравнения различных модулей. Например, память с частотой 1600 МГц имеет вдвое большую пропускную способность, чем 800-мегагерцовая. И синтетические тесты памяти прилежно выведут столбик в два раза выше. Но если вы протестируете целую систему с этими двумя видами памяти с помощью популярных тестовых приложений, на которых обычно тестируют процессоры, то и близко не получите двухкратной разницы в производительности. Интегральный индекс быстродействия может отличаться максимум на несколько десятков процентов.

    Это делает синтетические тесты памяти малоинформативными с практической точки зрения. Нельзя, однако, поручиться и за то, что подход с применением реальных приложений дает нам стопроцентно достоверную картину, поскольку велика вероятность, что какие-то режимы, где производительность памяти действительно критична, остались без внимания и не были учтены.

    Краткая теория

    Чтобы понять специфику проблемы, рассмотрим принципиальную схему взаимодействия приложения, ЦП и подсистемы памяти. Уже давно для описания работы центрального процесса считается удачной аналогия с заводским конвейером. И движутся по этому конвейеру инструкции из программного кода, а функциональные модули процессора обрабатывают их словно станки. Тогда современные многоядерные ЦП будут подобны заводам с несколькими цехами. Например, работу технологии Hyper-Threading можно сравнить с конвейером, по которому едут вперемешку детали сразу нескольких автомобилей, и умные станки обрабатывают их одновременно, по метке на деталях определяя, к какой модели машины они относятся. Например, собирается красная и синяя машины, тогда красящий станок использует красную краску для деталей красной машины и синюю краску для синей. И поток деталей сразу для двух моделей позволяет лучше загрузить станки. А если аппарат для покраски будет иметь два распылителя, и сможет красить одновременно две детали в разные цвета, конвейер сможет работать на полную мощность вне зависимости от того, в каком порядке будут поступать детали. Наконец, последний писк моды, реализуемый в будущих процессорах AMD, в которых различные ядра ЦП будут иметь некоторые общие функциональные блоки, можно сравнить с идеей сделать часть особо громоздких и дорогих станков общей для двух цехов, чтобы сэкономить заводскую площадь и сократить капитальные затраты.

    С точки зрения данной аналогии, системная память будет являться внешним миром, который поставляет на завод сырье и принимает готовый продукт, а кэш-память - это некий склад непосредственно на заводской территории. Чем больше у нас системной памяти, тем больший виртуальный мир мы можем обеспечивать выпускаемой продукцией, и чем больше частота ЦП и количество ядер, тем мощнее и производительнее наш завод. А чем больше размер кэш-памяти, то есть заводского склада, тем меньше будет обращений в системную память - запросов на поставку сырья и комплектующих.

    Производительность памяти в этой аналогии будет соответствовать скорости транспортной системы по доставке сырья и отправке деталей во внешний мир. Допустим, доставка на завод осуществляется при помощи грузовиков. Тогда параметрами транспортной системы будут вместимость грузовика и скорость движения, то есть время доставки. Это хорошая аналогия, так как работа ЦП с памятью осуществляется с помощью отдельных транзакций с блоками памяти фиксированного размера, причем данные блоки расположены рядом, в одном участке памяти, а не произвольно. И для общей производительности завода важна не только скорость работы конвейера, но и оперативность подвоза компонентов и вывоза готовых изделий.

    Произведение объема кузова на скорость движения, то есть количество грузов, которые можно перевезти в единицу времени, будет соответствовать пропускной способности памяти (ПСП). Но очевидно, что системы с одинаковой ПСП не обязательно равноценны. Важно значение каждого компонента. Скоростной маневренный грузовичок может оказаться лучше, чем большой, но медленный транспорт, так как необходимые данные могут лежать в различных участках памяти, расположенных далеко друг от друга, а вместимость грузовика (или объем транзакции) много меньше общего объема (памяти), и тогда даже большому грузовику придется совершить два рейса, и его вместимость не будет востребована.

    Другие же программы имеют так называемый локальный доступ к памяти, то есть они читают или пишут в близко расположенные ячейки памяти - им относительно безразлична скорость случайного доступа. Это свойство программ объясняет эффект от наращивания объемов кэш-памяти в процессорах, которая, благодаря близкому расположению к ядру, в десятки раз быстрее. Даже если программа требует, например, 512 МБ общей памяти, в каждый отдельный небольшой промежуток времени (например, миллион тактов, то есть одна миллисекунда), программа может работать только с несколькими мегабайтами данных, которые успешно помещаются в кэше. И потребуется только обновлять время от времени содержимое кэша, что, в общем, происходит быстро. Но может быть и обратная ситуация: программа занимает всего 50 МБ памяти, но постоянно работает со всем этим объемом. А 50 МБ значительно превышают типичный размер кэша существующих настольных процессоров, и, условно говоря, 90% обращений к памяти (при размере кэша в 5 МБ) не кэшируются, то есть 9 из 10 обращений идут непосредственно в память, так как необходимых данных нет в кэше. И общая производительность будет почти полностью лимитирована скоростью памяти, так как процессор практически всегда будет находиться в ожидании данных.

    Время доступа к памяти в случае, когда данных нет в кэше, составляет сотни тактов. И одна инструкция обращения к памяти по времени равноценна десяткам арифметических.

    «Памятенезависимые» приложения

    Позволим себе один раз использовать такой корявый термин для приложений, производительность в которых на практике не зависит от смены модулей на более высокочастотные и низколатентные. Откуда вообще такие приложения берутся? Как мы уже отметили, все программы имеют различные требования к памяти, в зависимости от используемого объема и характера доступа. Каким-то программам важна только общая ПСП, другие, наоборот, критичны к скорости доступа к случайным участкам памяти, которая иначе называется латентностью памяти. Но очень важно также, что степень зависимости программы от параметров памяти во многом определяется характеристиками центрального процессора - прежде всего, размером его кэша, так как при увеличении объема кэш-памяти рабочая область программы (наиболее часто используемые данные) может поместиться целиком в кэш процессора, что качественно ускорит программу и сделает её малочувствительной к характеристикам памяти.

    Кроме того, важно, как часто в коде программы встречаются сами инструкции обращения к памяти. Если значительная часть вычислений происходит с регистрами, велик процент арифметических операций, то влияние скорости памяти снижается. Тем более что современные ЦП умеют изменять порядок выполнения инструкций и начинают загружать данные из памяти задолго до того, как те реально понадобятся для вычислений. Такая технология называется предвыборкой данных (prefetch). Качество реализации данной технологии также влияет на памятезависимость приложения. Теоретически, ЦП с идеальным prefetch не потребуется быстрая память, так как он не будет простаивать в ожидании данных.

    Активно развиваются технологии спекулятивной предвыборки, когда процессор, даже ещё не имея точного значения адреса памяти, уже посылает запрос на чтение. Например, процессор для номера некоторой инструкции обращения к памяти запоминает последний адрес ячейки памяти, которая читалась. И когда ЦП видит, что скоро потребуется исполнить данную инструкцию, он посылает запрос на чтение данных по последнему запомненному адресу. Если повезет, то адрес чтения памяти не изменится, или изменится в пределах читаемого за одно обращение к памяти блока. Тогда латентность доступа к памяти отчасти скрадывается, поскольку параллельно с доставкой данных процессор исполняет инструкции, предшествующие чтению из памяти. Но, разумеется, такой подход не является универсальным и эффективность предвыборки сильно зависит от особенностей алгоритма программы.

    Однако разработчики программ также в курсе характеристик современного поколения процессоров, и зачастую в их силах (при желании) оптимизировать объем данных таким образом, чтобы он помещался в кэш-памяти даже бюджетных процессоров. Если мы работаем с хорошо оптимизированным приложением - для примера можно вспомнить некоторые программы кодирования видео, графические или трехмерные редакторы, - у памяти, с практической точки зрения, не будет такого параметра, как производительность, будет только объем.

    Еще одна причина, по которой пользователь может не обнаружить разницы при смене памяти, состоит в том, что она и так слишком быстрая для используемого процессора. Если бы сейчас все процессоры вдруг замедлились в 10 раз, то для производительности системы в большинстве программ стало бы абсолютно все равно, какой тип памяти в ней установлен - хоть DDR-400, хоть DDR3-1600. А если бы ЦП радикально ускорились, то производительность значительной части программ наоборот стала бы гораздо существеннее зависеть от характеристик памяти.

    Таким образом, реальная производительность памяти есть величина относительная, и определяется в том числе и используемым процессором, а также особенностями ПО.

    «Памятезависимые» приложения

    А в каких пользовательских задачах производительность памяти имеет большее значение? По странной, но на самом деле имеющей глубокие основания причине - в случаях, которые сложно тестировать.

    Тут сразу вспоминаются игрушки-стратегии со сложным и «медленным» искусственным интеллектом (ИИ). Ими никто не любит тестировать ЦП, так как инструменты для оценки либо отсутствуют, либо характеризуются большими погрешностями. На скорость выработки решения алгоритмом ИИ влияют множество факторов - например, иногда закладываемая в ИИ вариативность решений, чтобы сами решения выглядели более «человеческими». Соответственно, и реализация различных вариантов поведения занимает разное время.

    Но это не значит, что у системы в данной задаче нет производительности, что она не определена. Просто её сложно точно вычислить, для этого потребуется собрать большое количество статистических данных, то есть провести множество испытаний. Кроме того, такие приложения сильно зависят от скорости памяти из-за использования сложной структуры данных, распределенных по оперативной памяти зачастую непредсказуемым образом, поэтому упомянутые выше оптимизации могут просто не работать или действовать неэффективно.

    Достаточно сильно от производительности памяти могут зависеть и игры других жанров, пусть не со столь умным искусственным интеллектом, зато с собственными алгоритмами имитации виртуального мира, включая физическую модель. Впрочем, они на практике чаще всего упираются в производительность видеокарты, поэтому тестировать на них память также бывает не очень удобно. Кроме того, важным параметром комфортного игрового процесса в трехмерных играх от «первого лица» является минимальное значение fps: его возможное проседание в пылу жестокой битвы может иметь самые плачевные для виртуального героя последствия. А минимальный fps тоже, можно сказать, невозможно измерить. Опять же - из-за вариативного поведения ИИ, особенностей расчета «физики» и случайных системных событий, которые тоже могут приводить к проседанию. Как прикажете в таком случае анализировать полученные данные?

    Тестирование скорости игр в демо-роликах имеет ограниченное применение еще и потому, что не все части игрового движка бывают задействованы для воспроизведения демки, и в реальной игре на скорость могут влиять иные факторы. Причем даже в таких наполовину искусственных условиях минимальный fps непостоянен, и его редко приводят в отчетах о тестировании. Хотя, повторимся, это наиболее важный параметр, и в тех случаях, когда идет обращение к данным, проседание fps весьма вероятно. Ведь современные игры, в силу своей сложности, разнообразия кода, включающего помимо поддержки физического движка и искусственного интеллекта также подготовку графической модели, обработку звука, передачу данных через сеть и пр., очень зависят как от объема, так и от производительности памяти. Кстати, будет заблуждением считать, что графический процессор обрабатывает сам всю графику: он только рисует треугольники, текстуры и тени, а формированием команд все равно занимается ЦП, и для сложной сцены это вычислительно емкая задача. К примеру, когда вышел Athlon 64 с интегрированным контроллером памяти, наибольший прирост в скорости по сравнению со старым Athlon был именно в играх, хотя там не использовались 64-битность, SSE2 и другие новые «фишки» Athlon 64. Именно существенное повышение эффективности работы с памятью благодаря интегрированному контроллеру сделало тогдашний новый процессор AMD чемпионом и лидером по производительности в первую очередь в играх.

    Многие другие сложные приложения, прежде всего серверные, в случае которых имеет место обработка случайного потока событий, также существенно зависят от производительности подсистемы памяти. Вообще, используемое в организациях ПО, с точки зрения характера кода программы, зачастую не имеет аналогов среди популярных приложений для домашних персоналок, и поэтому весьма существенный пласт задач остается без адекватной оценки.

    Ещё одним принципиальным случаем усиленной зависимости от памяти является режим многозадачности, то есть запуск нескольких ресурсоемких приложений одновременно. Вспомним снова все тот же AMD Athlon 64 с интегрированным контроллером памяти, который к моменту анонса Intel Core выпускался уже в двухъядерном варианте. Когда вышел Intel Core на новом ядре, процессоры AMD стали проигрывать везде, кроме SPEC rate - многопоточном варианте SPEC CPU, когда запускается столько копий тестовой задачи, сколько ядер в системе. Новое интеловское ядро, обладая большей вычислительной мощностью, тупо затыкалось в этом тесте в производительность памяти, и даже большой кэш и широкая шина памяти не помогали.

    Но почему это не проявлялось в отдельных пользовательских задачах, в том числе многопоточных? Главной причиной было то, что большинство пользовательских приложений, которые в принципе хорошо поддерживают многоядерность, всячески оптимизированы. Вспомним в очередной раз пакеты для работы с видео и графикой, которые больше всех получают прирост от многопоточности - всё это оптимизированные приложения. К тому же объем используемой памяти меньше, когда код параллелится внутри программы - по сравнению с вариантом, когда запускаются несколько копий одной задачи, а тем более - разные приложения.

    А вот если запустить на ПК сразу несколько различных приложений, нагрузка на память возрастет многократно. Это произойдет по двум причинам: во-первых, кэш-память будет поделена между несколькими задачами, то есть каждой достанется только часть. В современных ЦП кэш L2 или L3 - общий для всех ядер, и если одна программа использует много потоков, то они все могут выполняться на своем ядре и работать с общим массивом данных в L3-кэше, а если программа однопоточна, то ей достается весь объем L3 целиком. Но если потоки принадлежат различным задачам, объем кэша будет вынужденно делиться между ними.

    Вторая причина заключается в том, что большее количество потоков создаст больше запросов на чтение-запись памяти. Возвращаясь к аналогии с заводом, понятно, что если на заводе работают все цеха на полную мощность, то сырья потребуется больше. А если они делают различные машины, то заводской склад будет переполнен различными деталями, и конвейер каждого цеха не сможет воспользоваться деталями, предназначенными для другого цеха, так как они от разных моделей.

    Вообще, проблемы с ограниченной производительностью памяти - главная причина низкой масштабируемости многоядерных систем (после, собственно, приципиальных ограничений возможности распараллеливания алгоритмов).

    Типичным примером такой ситуации на ПК будет одновременный запуск игры, «скайпа», антивируса и программы кодирования видеофайла. Пусть не типичная, но совсем не фантастическая ситуация, в которой очень сложно корректно измерить скорость работы, так как на результат влияют действия планировщика в составе ОС, который при каждом замере может по-иному распределять задачи и потоки по разным ядрам и давать им различные приоритеты, временны́е интервалы и делать это в разной последовательности. И опять-таки, наиболее важным параметром будет пресловутая плавность работы - характеристика, по аналогии с минимальным fps в играх, которую в данном случае измерить еще сложнее. Что толку от запуска игры или какой-то другой программы одновременно с кодированием видеофайла, если поиграть нормально не удастся из-за рывков изображения? Пусть даже видеофайл быстро сконвертируется, поскольку многоядерный процессор в данном случае может быть и недогружен. Здесь нагрузка на систему памяти будет гораздо больше, чем при исполнении каждой из перечисленных задач по отдельности.

    В случае использования ПК как рабочей станции, ситуация одновременного исполнения нескольких приложений даже более типична, чем для домашнего ПК, и сама скорость работы ещё более важна.

    Проблемы тестирования

    Сразу целая группа факторов снижает чувствительность ЦП-ориентированных тестов к скорости памяти. Очень чувствительные к памяти программы представляют собой плохие тесты ЦП - в том смысле, что они слабо реагируют на модель ЦП. Такие программы могут различать процессоры с контроллером памяти, снижающим латентность доступа к памяти, и без оного, но при этом в пределах одного семейства почти не реагировать на частоту процессора, показывая сходные результаты при работе на частоте 2500 и 3000 МГц. Часто такие приложения отбраковываются как тесты ЦП, ибо тестеру просто непонятно, что лимитирует их производительность, и кажется, что дело в «чудачествах» самой программы. Будет удивительно, если все процессоры (и AMD, и Intel) покажут в тесте одинаковый результат, но такое вполне возможно для приложения, очень сильно зависимого от памяти.

    Чтобы избежать упреков в необъективности и вопросов, почему выбрана та или иная программа, в тесты стараются включать только наиболее популярные приложения, которыми все пользуются. Но такая выборка не совсем репрезентативна: наиболее популярные приложения из-за своей массовости часто очень хорошо оптимизированы, а оптимизация программы начинается с оптимизации её работы с памятью - она важнее, например, чем оптимизация под SSE1-2-3-4. Но совсем не все на свете программы так хорошо оптимизируются; попросту на все программы не хватит программистов, которые умеют писать быстрый код. Опять возвращаясь к популярным программам кодирования, многие из них были написаны при непосредственном активном участии инженеров фирм-изготовителей ЦП. Как и некоторые другие популярные ресурсоемкие программы, в частности медленные фильтры двухмерных графических редакторов и движки рендеринга студий трехмерного моделирования.

    В свое время было популярно сравнивать компьютерные программы с дорогами. Эта аналогия потребовалась, чтобы объяснить, почему на некоторых программах быстрее работает Pentium 4, а на некоторых Athlon. Интеловский процессор не любил ветвления и быстрее «ехал» по прямым дорогам. Это очень упрощенная аналогия, но она удивительно хорошо передает суть. Особенно интересно, когда две точки на карте соединяют две дороги - «оптимизированная» прямая качественная дорога и «неоптимизированная» кривая ухабистая. В зависимости от выбора одной из дорог, ведущих к цели, выигрывает тот или иной процессор, хотя в каждом случае они делают одно и тоже. То есть на неоптимизированном коде выигрывает Athlon, а при простой оптимизации приложения выигрывает Pentium 4 - и сейчас мы даже не говорим о специальной оптимизации под архитектуру Netburst: в таком случае Pentium 4 мог бы посоревноваться даже с Сore. Другое дело, что хорошие «оптимизированные» дороги строить дорого и долго, и это обстоятельство во многом предопределило печальную участь Netburst.

    Но если мы отойдем от популярных наезженных трасс, то окажемся в лесу - там вообще нет никаких дорог. И немало приложений написаны безо всякой оптимизации, что почти неминуемо влечет сильную зависимость от скорости памяти в случае, если объем рабочих данных превышает размер кэша ЦП. К тому же множество программ пишутся на языках программирования, которые в принципе не поддерживают оптимизацию.

    Специальный тест памяти

    Для того чтобы корректно оценить влияние скорости памяти на производительность системы в случае, когда память имеет значение (для упомянутых «памятезависимых» приложений, мультизадачности и т. п.), исходя из всех вышеперечисленных обстоятельств и решено было создать специальный тест памяти, который по структуре кода представляет собой некое обобщенное сложное, зависимое от памяти приложение и имеет режим запуска нескольких программ.

    Какие плюсы есть у такого подхода? Их очень много. В отличие от «натуральных» программ, возможен контроль над объемом используемой памяти, контроль над её распределением, контроль над количеством потоков. Специальное контролируемое выделение памяти позволяет нивелировать влияние особенностей менеджера памяти программы и операционной системы на производительность, чтобы результаты были не зашумлены, и можно было корректно и быстро тестировать. Точность измерения позволяет производить тест за относительно небольшое время и оценить большее количество конфигураций.

    Тест основан на измерении скорости работы алгоритмов из типичных для сложных приложений программных конструкций, работающих с нелокальными структурами данных. То есть данные распределены в памяти достаточно хаотично, а не составляют один небольшой блок, и доступ в память не является последовательным.

    В качестве модельной задачи была взята модификация теста Astar из SPEC CPU 2006 Int (кстати, предложенный для включения в этот пакет автором статьи; для теста памяти использован адаптированный для графов алгоритм) и задача сортировки данных с помощью различных алгоритмов. Программа Astar имеет сложный алгоритм с комплексным доступом к памяти, а алгоритмы сортировки числового массива - базовая задача программирования, использующаяся во множестве приложений; она включена, в том числе, для дополнительного подтверждения результатов сложного теста данными производительности простой, но распространенной и классической задачи.

    Интересно, что существует несколько алгоритмов сортировки, но они отличаются по типу шаблона доступа к памяти. В некоторых доступ к памяти в целом локален, а другие используют сложные структуры данных (например, бинарные деревья), и доступ к памяти хаотичен. Интересно сравнить, насколько параметры памяти влияют при различном типе доступа - при том, что обрабатывается одинаковый размер данных и количество операций не сильно отличается.

    Согласно исследованиям набора тестов SPEC CPU 2006, тест Astar - один из нескольких, в наибольшей мере коррелирующих с общим результатом пакета на x86-совместимых процессорах. Но в нашем тесте памяти объем используемых программой данных был увеличен, так как со времени выпуска теста SPEC CPU 2006 типичный объем памяти возрос. Также программа приобрела внутреннюю многопоточность.

    Программа Astar реализует алгоритм нахождения пути на карте с помощью одноименного алгоритма. Сама по себе задача типична для компьютерных игр, прежде всего стратегий. Но используемые программные конструкции, в частности множественное применение указателей, также типичны для сложных приложений - например, серверного кода, баз данных или просто кода компьютерной игры, не обязательно искусственного интеллекта.

    Программа осуществляет операции с графом, соединяющим пункты карты. То есть каждый элемент содержит ссылки на соседние, они как бы соединены дорогами. Есть два подтеста: в одном граф строится на основе двухмерной матрицы, то есть плоской карты, а во втором - на основе трехмерной матрицы, которая представляет собой некий сложный массив данных. Структура данных аналогична так называемым спискам - популярному способу организации данных в программах с динамическим созданием объектов. Такой тип адресации в целом характерен для объектно-ориентированного ПО. В частности, это практически все финансовые, бухгалтерские, экспертные приложения. И характер их обращений к памяти разительно контрастирует с типом доступа у оптимизированных на низком уровне вычислительных программ, вроде программ видеокодирования.

    Каждый из подтестов имеет два варианта реализации многопоточности. В каждом из вариантов запускается N потоков, но в одном каждая из нитей осуществляет поиск пути на собственной карте, а в другом все нити ищут пути одновременно на одной карте. Так получаются несколько различных шаблонов доступа, что делает тест более показательным. Объем используемой памяти по умолчанию в обоих вариантах одинаков.

    Таким образом, в первой версии теста получается 6 подтестов:

    • Поиск пути на 2D-матрице, общая карта
    • Поиск пути на 2D-матрице, отдельная карта для каждого потока
    • Поиск пути на 3D-матрице, общая карта
    • Поиск пути на 3D-матрице, отдельная карта для каждого потока
    • Сортировка массива с использованием алгоритма quicksort (локальный доступ к памяти)
    • Сортировка массива с использованием алгоритма heapsort (сложный доступ к памяти)

    Результаты теста

    Результаты теста отражают время нахождения заданного количества путей и время сортировки массива, то есть меньшее значение соответствует лучшему результату. В первую очередь качественно оценивается: реагирует ли в принципе данный процессор на заданной частоте на изменение частоты памяти или её настройки, частоту шины, тайминги и т. п. То есть отличаются ли результаты теста на данной системе при использовании различных типов памяти, или процессору хватает минимальной скорости.

    Количественные результаты в процентах относительно конфигурации по умолчанию дают оценку прироста или падения скорости работы памятезависимых приложений или мультизадачной конфигурации при использовании различных типов памяти.

    Тест сам по себе не предназначен для точного сравнения различных моделей ЦП, так как из-за того, что организация кэшей и алгоритмы предвыборки данных могут у них существенно отличаться, тест может отчасти благоволить определенным моделям. Но качественная оценка семейств ЦП между собой вполне возможна. А память производства различных компаний устроена одинаково, поэтому здесь субъективная составляющая исключена.

    Также тест может быть использован для оценки масштабируемости процессоров по частоте при разгоне или внутри модельного ряда. Он позволяет понять, с какой частоты процессор начинает «затыкаться» в память. Часто процессор формально разгоняется сильно, и синтетические тесты, основанные на выполнении простых арифметических операций, показывают соответствующий изменению частоты прирост, но в памятезависимом приложении прироста может и не быть вообще из-за отсутствия соответствующего прироста в скорости памяти. Другая причина заключается в том, что ядро ЦП теоретически может потреблять больше энергии в случае сложного приложения и начнет либо сбоить, либо само снижать частоту, что не всегда возможно выявить в простых арифметических тестах.

    Заключение

    Если бы платформы и сокеты не менялись столь часто, то всегда можно было бы рекомендовать покупать самую быструю память, так как после апгрейда на новый более мощный и быстрый процессор возрастут и требования к памяти. Однако оптимальной стратегией все же является покупка сбалансированной конфигурации, поскольку сама память тоже прогрессирует, пусть и не так быстро, но ко времени смены процессора, вполне возможно, потребуется обновить и память. Поэтому тестирование производительности подсистемы памяти в сочетании с разными процессорами, в том числе в режиме разгона, остается актуальной и даже насущной задачей, которая позволит выбрать оптимальную связку, не переплачивая за лишние мегагерцы.

    На самом деле, проблема ускорения доступа к данным - краеугольный камень современного процессоростроения. Узкое место здесь будет всегда, если только, конечно, сам процессор не будет состоять полностью из кэш-памяти, что, кстати, недалеко от истины - львиную долю площади кристаллов современных ЦП занимает как раз кэш-память разных уровней. (В частности, Intel заработал свои рекордные миллиарды, в том числе, благодаря тому, что в свое время разработал метод более плотного размещения кэшей на кристалле, то есть на единицу площади кристалла помещается больше ячеек кэша и больше байт кэш-памяти.) Однако всегда будут существовать приложения, которые либо невозможно оптимизировать таким образом, чтобы данные умещались в кэш-памяти, либо этим просто некому заниматься.

    Поэтому быстрая память зачастую является столь же практичным выбором, как покупка внедорожника для человека, который хочет иметь возможность с комфортом передвигаться как по асфальту, так и по дорогам с «неоптимизированным» покрытием.

    Статьи по теме: