Карта0
Карта1
Карта2
Карта3
Карта4
Карта5
Карта6
Карта7
Карта8
Карта9
Карта10
Карта11
Карта12
Карта13
Карта14
Карта15
Карта16
Карта17
Карта18
Карта19
Карта20
Карта21
Карта22
Карта23
Карта24
Карта25
Карта26
Карта27
Карта28
Карта29
Карта30
Карта31
Карта32
Карта33
Карта34
Карта35
Карта36
Карта37
Карта38
Карта39


Наш форум » Информация » Новости » Nehalem за два месяца до анонса – все, что необходимо знать о новой архитектуре Intel

Новости Новостной раздел.

Ответ
Старый 29.09.2008, 00:07   #1 (permalink)
Вот так я модерирую мир..
 
Аватар для Мaster
 
Регистрация: 06.07.2007
Адрес: Москва
Возраст: 24
Сообщений: 1,127
Репутация: 215
Провайдер: Билайн
Почетный модератор Злодей TF2 Игровой эксперт 
Сообщение Nehalem за два месяца до анонса – все, что необходимо знать о новой архитектуре Intel


Вступление
Более двух лет прошло с момента анонса микроархитектуры Intel Core. Тогда, 13 июля 2006 года, официально представленные процессоры Conroe семейства Core 2 Duo вывели корпорацию Intel в явные технологические лидеры. Отказ от откровенно неудачной для своего времени длинноконвейерной NetBurst в пользу переработанной коренным образом архитектуры P6, позволил наголову превзойти как результаты собственных процессоров предыдущих поколений, так и разгромить конкурирующие решения от AMD. Полученное серьезное преимущество в производительности означало для Intel доминирующую позицию на рынке – отныне роадмэп корпорации был составлен в первую очередь исходя из собственных соображений и возможностей.

Следящие за индустрией читатели прекрасно помнят, как Intel наступала по всем фронтам – начавшаяся с CPU среднего уровня экспансия архитектуры Core 2 затронула все рыночные ниши, от бюджетных Celeron до доступных лишь единицам Extreme Edition. Отличная масштабируемость Core и адекватная ценовая политика позволили Intel совершить революции во многих сегментах – чего стоит одно лишь создание первых потребительских процессоров с четырьмя ядрами – Core 2 Quad, или оснащение парой ядер даже самых доступных Celeron.

Месяц за месяцем Intel представляла новые модели Core 2, переводила ядра на новые степпинги, повышала штатные частоты FSB, объявляла снижения цен. Совершенствовались чипсеты для платформы LGA775 и материнские платы, предоставлявшие все более качественную элементную базу и растущие возможности разгона. Так незаметно прошел год, а вместе с ним, согласно новой концепции Intel, и время 65нм первенцев Core. 12 ноября 2007 г. Intel представила процессоры поколения Penryn – 45нм версию Conroe, получившую минимальные архитектурные изменения и название Wolfdale. Несмотря на несильно возросшую производительность (инструкции SSE 4.1 и увеличенный кэш, конечно, давали прибавку в скорости, но не столь существенную), обновленные CPU стали еще одним прорывом для Intel. Слишком высокой оказалась сложность освоения более тонкого техпроцесса – потребовались серьезные научные исследования, применение новых материалов и немалые материальные затраты для достижения поставленных целей. Однако результат в виде улучшившегося частотного потенциала, меньшего нагрева и увеличившегося транзисторного бюджета того стоил.

Но и век Penryn недолог. Сегодня процессоры E8xxx или Q9xxx находятся на острие прогресса, однако и их дни будут скоро сочтены. На смену Penryn идет новая архитектура Nehalem и ее первые представители – CPU с кодовым названием Bloomfield. Им уже дано розничное обозначение, на коробках с такими процессорами будет красоваться логотип Core i7. По последним неофициальным данным из достаточно достоверных источников известно, что микроархитектура Intel Nehalem будет анонсирована в конце ноября. Доверять этой информации можно – на прошедшей сессии Intel Developer Forum 2008 (IDF) новая архитектура была рассмотрена во всех подробностях, а прессе была предоставлена возможность протестировать вполне работоспособные семплы.

Итак, чего же ждать от новых CPU? Что за изменения и доработки скрываются под новым именем? Правдивы ли новости, словно из рога изобилия начавшиеся сыпаться за несколько месяцев до анонса? На все эти вопросы ответит наш сегодняшний материал, посвященный анализу архитектуры, процессоры которой уже совсем скоро станут стандартом для производительных ПК энтузиастов, а немного позже придут и в мейнстрим-сегмент – Intel Nehalem.

На заметку…
Внимательные читатели могли заметить закономерность – примерно год просуществовал Core, также порядка года было отведено и Penryn. Сколько же будет считаться топовым процессором Nehalem? Официальных заявлений на этот счет сделано пока не было, а планы компании по развитию десктопных CPU, доступные для обозрения любому посетителю официального сайта Intel, заканчиваются на сегодняшних процессорах компании, ни слова не говоря даже о готовящемся Nehalem.


Как и всегда, исправить положение помогают неофициальные источники. Согласно информации, размещенной на многочисленных интернет-ресурсах, Intel придерживается схемы, построенной на двух принципах:

- Раз в два года принципиально новая архитектура,
- Раз в два года новый техпроцесс и небольшое обновление архитектуры.
Причем происходит чередование, тем самым раз в год меняются либо проектные нормы, либо архитектура. Таким образом, вводя новую архитектуру, Intel задействует отлаженный технологический процесс, снижая риски при производстве (схожим образом поступает NVIDIA – новый чип – старый техпроцесс, перевод старого чипа на новый техпроцесс, новый чип и т.д.). На схеме это выглядит так:


Очень просто и логично, не так ли?

Первый взгляд на Nehalem
Давайте для начала перед тем, как говорить непосредственно о герое нашего сегодняшнего обзора, снова вспомним немного истории. Первые двухъядерные процессоры Intel под названием Pentium D представляли собой «склейку» из пары независимых CPU класса Pentium 4, расположенных на одной подложке (под одним теплораспределителем). Между собой раздельные кристаллы могли общаться только через FSB, пусть и достаточно широкую для обеспечения необходимой пропускной способности и отсутствия проблем в реальных приложениях. В арсенале AMD тогда уже присутствовали Athlon 64 X2, два ядра которых располагались на одном кристалле. К сожалению, даже эти процессоры не обладали архитектурой истиной многоядерности. Первым CPU, в котором были заложены идеи более глубокие, чем объединение под одной крышкой нескольких не связанных друг с другом процессоров, стал мобильный Yonah, фактически удвоенный Pentium M Banias/Dothan с общим кэшем второго уровня. Кстати, CPU архитектуры Core Duo (без двоечки посередине, не следует путать с Conroe/Penryn) также базировались на принципах P6, впервые заложенных еще в Pentium Pro, получивших развитие в Pentium 2 и 3, а затем и в M. Венцом развития этой ветви технологий и стал Core 2 Duo, где интеграция ядер достигла еще большего уровня. Однако выводя на рынок уже упомянутые выше Core 2 Quad, Intel снова применила способ объединения пары теперь уже двухъядерных кристаллов Core 2 Duo. Реальных объяснений этому два – экономическая целесообразность (чем больше площадь кристалла, а 4 ядра, очевидно, занимают площади существенно больше, нежели 2, тем ниже процент выхода годных кристаллов и тем выше себестоимость производства) и недостаточная модульность ядра архитектуры Core/Penryn. Вряд ли можно назвать серьезным недостатком компоновку CPU Core 2 Quad с учетом отличных результатов при распараллеленных вычислениях, однако тот факт, что C2Q не является истинным четырехъядерным процессором, многим не нравился. AMD же удавалось удачно использовать рекламный слоган “Native Quad-Core Design” для своих Phenom X4, говорящий об изначальном упоре на многоядерный дизайн при проектировке K10.

Все эти данные мы приводим затем, чтобы не потребовалось объяснять основную философию архитектуры Nehalem. Дело в том, что во главу угла при создании нового поколения CPU инженеры Intel поставили модульность и гранулярность архитектуры. Наши постоянные читатели прекрасно помнят, что представляет собой сегодняшний флагман NVIDIA – GT200. Это блочный чип, легко изменяя количество составных частей которого можно получать решения различных уровней производительности. Таких возможностей недоставало Core/Penryn – высокая сложность внутренних связей блоков процессора не позволила в рамках одного поколения CPU малой кровью интегрировать на кристалл, например, еще пару ядер. Такие возможности теперь есть у Nehalem. Взяв лучшие идеи из мира графических ускорителей, Intel создала настоящий конструктор, первый вариант сборки которого (Bloomfield) мы и будем тестировать всего через несколько месяцев.
Еще одной парой важнейших нововведений стала интеграция контроллера памяти в кристалл процессора, и, соответственно, реализация абсолютно новой шины Quick Path Interconnect вместо Quad Pumped Bus, служившей верой и правдой много лет начиная с Pentium 4 и кончая Core 2. Подробности новые технологии мы обсудим несколько позже, сейчас же стоит отметить, что обозначенные нововведения стали возможными именно благодаря модульности Nehalem. В разных вариантах CPU встроено разное количество линков QPI (по аналогии с HyperTransport, используемой AMD), в серверах для многопроцессорных конфигураций их количество будет большим по сравнению с десктопными процессорами. Рискнем предположить, что в бюджетных вариантах Nehalem Intel может отказаться и от встроенного КП памяти для экономии транзисторного бюджета. В ожидаемом Bloomfield будет присутствовать пара линков QPI и встроенный трехканальный контроллер памяти.

На заметку…
Помимо выпуска решений, направленных на планомерное увеличение производительности, Intel представляет и CPU для сегментов рынка, в которых скорость выполнения расчетов не является определяющим фактором выбора пользователей. Так, на растущем рынке нетбуков Intel Atom предлагает привлекательное сочетание достаточной, пусть и не рекордной, производительности и крайне малого энергопотребления/тепловыделения, что в результате дает длительное время автономной работы. Достичь такого компромисса помогло разумное упрощение ядра и минимизация площади кристалла. При наличии лишь 47млн. транзисторов против 781млн. у Nehalem, площадь ядра Atom менее 25кв. мм., тогда как у Bloomfield – 270кв. мм. Заметная разница, не правда ли? Конечно, при этом учитывается огромная кэш-память и целых четыре ядра Nehalem против одного у Atom, но и одно ядра Bloomfield занимает целых 88млн. транзисторов или 31 кв. мм. Если сравнивать напрямую диаграммы ядер становится понятно, как смогли получить столь малый размер Atom – все дело в строго очередном исполнении команд!


Bloomfield – отнюдь не новый Conroe
Если сравнивать напрямую микроархитектуры Core 2 Duo и Pentium 4, можно сказать, что это буквально день и ночь. Процессоры Core не имеют почти ничего общего с NetBurst, все реализовано иначе. Для того чтобы по-настоящему воспользоваться преимуществами Pentium 4 и поучить полную отдачу от процессора, программистам требовалось проводить каждый раз огромную работу по оптимизации приложений. Однако мало кто будет специально затачивать код под аппаратную часть только одного производителя, пусть и самого крупного, если при этом на решениях конкурента скорость работы только снизится. В результате длинный конвейер P4 немалую толику времени просто простаивал, только нагревая воздух и потребляя лишнюю энергию. Инженеры усвоили урок, и Core был спроектирован так, чтобы программистам не требовалось переписывать заново огромные части программ, и уже существующий код работал быстро, причем преемственность сохранялась и для будущих архитектур. Эту традицию продолжает и Nehalem.

Одной из фундаментальных характеристик для CPU служит возможность одновременного исполнения нескольких команд. Conroe стал первым процессором Intel, поддерживающим исполнение до четырех команд за единый такт. Зачастую такие возможности были даже избыточными, и не было никаких причин делать кардинальный редизайн ядра для того, чтобы расширить и без того беспроблемный участок.

Приятной мелочью является расширение списка стандартных x86 микроопераций, которые могут быть объединены для совместного исполнения. Механизм такой работы чем-то напоминает MAD+MUL у NVIDIA, две команды декодируются и исполняются как одна, что в некоторых случаях позволяет существенно повысить скорость CPU.

Еще одним улучшением является то, что отныне вместе могут соединяться и 64-битные инструкции, когда ранее такая возможность была предусмотрена только в стандартном 32-битном режиме. Это вполне может дать прибавку скорости в вычислениях с удвоенной точностью. К сожалению, о количестве исполняемых команд за такт в 64-битном режиме ничего сказано не было. Видимо, как и ранее у Core2, вместо четырех полноценных команд Nehalem может обработать лишь три. Это не является серьезной проблемой, но, может создать условия для потерь производительности.

Блок предсказания ветвлений и серверная направленность Nehalem
Заметные изменения в Nehalem претерпела логика предсказания ветвлений. Отныне в процессоре данная структура представлена сложным двухуровневым механизмом. Фактически теперь иерархия этого блока похожа на организацию многоуровнего кэша современных CPU – самый быстрый и маленький – первого уровня, медленнее и больше – второго, и т.д. Причем даже значимые параметры в какой-то мере похожи на таковые у быстрой интегрированной памяти процессора – величина и скорость работы. Блок предсказания ветвлений второго уровня производит анализ по большим частям кода, чем основная логика первого уровня, однако при этом и работает медленнее.

Нельзя не отметить и улучшения, коснувшиеся стек-буфера, также напрямую относящиеся к предсказанию ветвлений. Ранее при ошибках в предсказаниях, которые случались даже несмотря на сложные алгоритмы, в возвратный стек Penryn (структура, следящая за тем, в какой области памяти должно начаться исполнение после обработки функции) попадали неверные данные. Теперь же обновленный возвратный буфер стал интеллектуальнее и препятствует неверному заполнению данных, тем самым удается избежать лишних ошибок и простоя при неверном предсказании условных переходов.

Следует заметить, что все вышеназванные усовершенствования направлены в первую очередь на улучшение работы процессора в тяжелых серверных приложениях (Intel приводит пример баз данных), где особо критичны неверное предсказание ветвлений или лишние исполненные такты, пропущенные блоком LSD. Дело в том, что уже с моменты выхода K8 позиции Intel в серверном сегменте не были однозначно убедительными, и если превосходство Core 2 в десктопном сегменте было неоспоримо, консервативные корпоративные пользователи продолжали доверять AMD, выбирая серверы на K10. Nehalem призван исправить такой порядок вещей, и, несмотря на то, что произведенные модернизации несомненно окажут положительный эффект на быстродействие процессора при выполнении стандартных “домашних” задач, продиктованы они были именно серверными нуждами.

К слову, этот момент достаточно интересен. Ведь если вспомнить историю, в большинстве поколений изначально все нововведения делались с оглядкой на наиболее производительные серверные решения. Затем новинки переходили в разряд стандартов для десктопов. С Core же ситуация абсолютно иная, как мы уже говорили, истоки архитектуры восходят к Pentium M, т.е. серверные решения стали следствиями нововведений в мобильной сфере. Теперь все снова возвращается “на круги своя” и серверный Nehalem становится законодателем мод для обычных ПК.

Немаловажным достоинством архитектуры Nehalem является неукоснительное следование инженерами Intel золотому правилу соотношения производительности на ватт при проектировке CPU, которое они сами для себя же и установили при разработке Core. В цифрах выражается это правило просто – 1% рост энергопотребления должен соответствовать как минимум 2% повешения производительности. При этом если задуманное улучшение не соответствует таким пропорциям, от его введения либо полностью отказываются, либо кардинально перерабатывают. Правила жесткие, однако это позволяет избежать неконтролируемого роста потребляемой мощности при несоразмерном улучшении производительности, как в свое время было с Pentium 4 Prescott.

Новое поколение Hyper Threading

Много времени утекло с того момента, когда корпорация Intel впервые представила процессоры Pentium 4 с первой версией технологии Hyper Threading. Когда еще не было прямых предпосылок к увеличению количества ядер в домашних ПК, Intel уже предопределяла будущее индустрии микропроцессоров, подготавливая программистов к “параллельному” будущему.

HT – маркетинговое название технологии SMT (Simultaneous Multi-Threading, одновременная многопоточность), предполагающей благодаря специальным механизмам исполнение за один такт инструкций из двух потоков. Операционная система определяет ПК с Hyper Threading как многопроцессорную конфигурацию, разделяя команды в несколько линий (в случае с P4 – одно ядро могло обрабатывать две линии). При проектировании Core от HT решено было отказаться, ведь даже сейчас для большинства домашних потребностей достаточно и двух ядер.

Сегодня Hyper Threading возвращается в Nehalem (опять же – серверная ориентация, только профессиональные приложения получают существенный прирост даже от увеличения количества физических ядер), однако теперь производительность новой инкарнации HT будет на порядок выше первой версии. На это есть несколько причин:

Nehalem обладает куда большей пропускной способностью памяти и размерами кэшей, нежели Pentium 4 в свое время. Это дает возможность доставить данные в ядро для обработки намного быстрее и более предсказуемо;
Архитектура Nehalem намного шире и масштабнее P4. Она изначально заточена на получение преимуществ от запуска нескольких потоков на одном ядре. В соответствии с этим были, например, расширены внутренние буферы, о которых шла речь ранее – это автоматически означает большее количество инструкция для декодирования, максимальная загруженность конвейера, большее количество инструкций, порядок которых изменяется блоком внеочередного исполнения команд, в конце концов, большее количество единовременно исполняемых инструкций.
Нижеследующая таблица отражает увеличение производительности, которое получает Nehalem при активации HT (как и ранее, два потока на одно ядро, соответственно 8 виртуальных потоков и при 4 физических ядрах):

Вспоминая о золотом правиле процессоростроения Intel, нельзя не отметить насколько энергетически эффективной является интеграция в Nehalem Hyper Threading. Ведь в хорошо распараллеленных приложениях прирост от технологии очевиден, а с учетом особенности новой реализации HT, он будет проявляться в большем числе приложений, чем в случае с Pentium 4.


Иерархия кэш-памяти
Вообще говоря, красноречиво говорит за себя данный слайд:


Как и в случае с AMD Phenom, у Nehalem в наличии трехуровневый кэш. У каждого ядра выделена своя собственная память первого уровня в 64 Кб (по равным 32 Кб на данные и на инструкции) и 256 Кб L2, а целых 8 Мб кэша третьего уровня разделяно между всеми ядрами.

Кэш ядер L1 располагает таким же объемом, как и Penryn, однако скорость его работы снижена (3 такта против 4). Intel пришлось замедлить кэш L1, так как он серьезно ограничивал общую тактовую частоту CPU. Конечно, такое решение было принято после многочисленных исследований производительности. С учетом большой площади кристалла процессора и его общей сложности оказалось, что намного лучше принести в жертву низкие задержки кэша, нежели ограничивать верхнюю планку частоту. По данным Intel увеличение задержек L1 на треть приводит к потери всего 2-3% производительности. Придется проверить на слово, инструментов для проверки таких заявлений нет.

L2 сравнивать напрямую с предшественниками особого смысла нет, ведь в предыдущих реализациях архитектуры Core основной массив набортной памяти ядер являлся как раз общим кэшем второго уровня, теперь же такую функцию выполняет L3, а L2 является локальным для каждого ядра, урезан с 6 Мб до 256 Кб и обладает задержкой в 10 тактов. Фактически, L2 является неким дополнительным буфером кэша L3, который сдерживает при нехватке данных одновременное обращение всех ядер в L3 (мгновенная потребность в огромной внутренней ПСП вполне может привести у резкому падению производительности).

Как мы уже упоминали, L3 является общим для всех ядер и выполняет старые функции L2. В первых процессорах Core i7 его объем будет составлять 8 Мб, однако Intel уже сейчас говорит о том, что эта характеристика будет варьироваться в зависимости от количества процессорных ядер. В Bloomfield наличие 8 Мб L3 оправдано тем, что многопоточные приложения всегда получают прирост от большого объема кэша, доступ к которому есть у всех ядер.

Следуя традициям, Intel сохраняет инклюзивную структуру кэша в Nehalem. Иными словами, в L3 содержатся все данные из L1 и L2. Очевидным достоинством такого подхода является то, что данные L1+L2 пропорционально занимают не так много места с учетом большого объема L3, при этом если ядро обращаясь в L3 не находит там нужных данных, не происходит дополнительных запросов в L1 и L2 других ядер. Это не только повышает производительность, но и снижает энергопотребление CPU. К тому же не стоит забывать, что если бы кэш третьего уровня был не инклюзивным, уже в Quad-Core процессоре каждое ядро искало бы данные в памяти трех других, что уж говорить о 8ми-ядерных конфигурациях Nehalem.

Интегрированный контроллер памяти
Nehalem – первый процессор Intel со встроенным контроллером памяти. Наконец-то этот модуль убран с материнской платы и из северного моста чипсета – помимо нескольких ядер и общего кэша на кристалле отныне располагаются несколько КП DDR3, в частности в Bloomfield контроллер трехканальный. Это означает, что для достижения пиковой пропускной способности необходимо будет установить три планки памяти в материнскую плату. Уже сейчас есть информация, что производители памяти в скором времени только по этой причине начнут продажу китов из трех модулей. Впоследствии Intel планирует выпустить и более дешевые версии Nehalem с двумя каналами контроллера памяти, но high-end и серверные модификации сохранят три канала.


Обладая тремя каналами быстрой DDR3, Nehalem, несомненно, не будет испытывать недостатка в пропускной способности, и данные будут попадать к мощным ядрам процессора без задержек. Побочный эффект столь серьезного увеличения ПСП состоит в том, что блоки предвыборки данных процессора смогут работать эффективнее, что также сможет положительно повлиять на производительность.

Несколько страниц мы уже не упоминали о серверной направленности Nehalem, сейчас самое время снова вспомнить об этом. В серверах используется дорогая буферизированная и достаточно медленная память с коррекцией ошибок ECC, поэтому применение агрессивных алгоритмов предвыборки данных в Xeon’ах, построенных на базе ядер Core, не всегда оправданно. Получается, что и так небольшая ПСП еще сильнее уменьшается, когда по шине прокачиваются необходимые блокам предварительной выборки данные. Приложения, которым нужна большая пропускная способность от такого только страдают.

С учетом огромной ПСП Nehalem, абсолютно излишней в домашних условиях, эта проблема отпадает сама собой – пропускной способности в буквальном смысле хватит на всех.


Quick Path Interconnect
Естественно, что с отказом от чипсетного контроллера памяти и соответственно шины FSB, Intel было необходимо разработать новый интерфейс связи вроде Hyper Transport, используемой AMD. Такой шиной и стала новая Quick Path Interconnect (QPI).

Каждый линк QPI является двунаправленным и поддерживает до 6.4 Гб/с в одну сторону. При этом каждый линк обладает шириной в 2 байта, что дает 12.8 Гб/с, а в сумме получаются внушительные 25.6 Гб/с.


При этом самые производительные процессоры и серверные варианты на первых порах будут иметь два линка QPI, домашние пользователи же обойдутся одним каналом.

Разработчики серверных приложений теперь будут беспокоиться о корректной работе софта на мульти-сокетных платформах Intel, ведь у каждого CPU в наличие свой собственный массив памяти, и программы при работе должны будут четко различать с каким процессором, и, соответственно областью памяти они работают во избежание возникновения коллизий. Как и в случае со встроенным контроллером памяти, AMD ввела шину HT намного раньше Intel. В каком-то смысле это сейчас сыграло на руку Intel, так как приложения, оптимизированные для HT, будут работать на Nehalem с QPI существенно быстрее, чем работали на старых Xeon.


Турбо-режим
Фактически, это последнее из рассматриваемых нами сегодня нововведений уже было представлено в мобильной версии Penryn. Идея так называемого “турбо-режима” состоит в том, что если двухъядерный CPU работает в однопоточном приложении и второе ядро не задействовано таким образом вообще, общий TDP чипа соответственно снижается относительно допустимого. Эти условия можно использовать для некоторого поднятия частоты активного ядра, и, соответственно, производительности. TDP в таком случае все равно останется низким, а неоптимизированное под многоядерность приложение будет работать быстрее. К сожалению, эта функция не особо хорошо работала в мобильных Penryn, так как у них не было выделенного блока PCU, а Vista, установленная на большинстве ноутбуков, постоянно перекидывала задачи с ядра на ядро в попытках более равномерно загрузить процессор.

Nehalem в этом отношении работает намного лучше. PCU не только способствует более корректному управлению энергопитанием и степенью активности ядер, но и может включать Turbo Mode при целом комплексе условий, а не только, когда, например, 2 ядра из 4 не заняты работой.


В Nehalem все процессорные ядра могут повышать частоту одновременно на одну ступень (133 МГц) даже при полной нагрузке, если PCU определит, что таким образом TDP не будет существенно превзойден. Если уровень TDP существенно ниже стандартного, например, при полной загрузке одного ядра и средней остальных трех, автоматический разгон может поднять частоту CPU на 2 ступени, то есть на 266 МГц.

Конечно, технология эта предназначена для неискушенных пользователей, которые не хотят рисковать вручную разгонять процессор, и будут рады даже 5% бесплатной прибавки скорости. Для таких покупателей приятная новость может состоять в том, что 266 МГц Intel ограничиваться не собирается и в будущих процессорах количество ступеней поднятия частоты будет увеличено.

Все-таки даже автоматические системы разгона из BIOS материнских плат достигают более значимых результатов, чего уж говорить о нормальном подконтрольном человеку режиме оверклокинга. Как раз для таких случаев, кстати, турбо-режим можно отключить.

Кстати говоря, если тестеры будут оставлять данную технологию включенной, процессоры Intel будут соревноваться с конкурентами не совсем честно – схожие методы были у ATI с введением VPU Overdrive, автоматически повышающей частоты видеочипа на безопасные величины. Конечно, пока AMD не в состоянии противопоставить CPU Core/Nehalem ничего существенного, но факт остается фактом, ведь зачастую процессоры с повышенной даже на 100 МГц тактовой частотой стоят уже существенно дороже своих младших собратьев.


Стартовые частоты и прогнозы по производительности
Уже сейчас достоверно известно, что стартовыми моделями Nehalem будут три процессора Core i7 с частотами в 2.66, 2.93 и 3.2 ГГц. Точные индексы – 920, 940 и 960 соответственно. Все процессоры получат 8 Мб кэша L3, и будут четырехъядерными (как раз такими, как сфотографированный в начале статьи). Конструктивно CPU будут выполнены в форм-факторе LGA1366 (3х канальный контроллер DDR3 и 2 линка QPI), тактовый генератор, заменяющий стандартную частоту FSB, будет работать на 133 МГц. Материнская плата потребуется с соответствующим сокетом, а первый настольный чипсет для Bloomfield будет называть Tylesberg (X58 в рознице). Когда ждать домашние процессоры, не нацеленные в первую очередь на энтузиастов, с сокетом LGA1160, парой каналов DDR3 и одним линком QPI пока неизвестно.

Турбо-режим будет представлен лишь двумя ступенями с возможным повышением частоты либо на 133 МГц в худшем случае, либо на 266 в лучшем – в зависимости от условий.

О ценах пока говорить сложно, во всяком случае, рекомендуемые величины не будут сильно завышены относительно четырехъядерных Penryn.

Что касается производительности, несмотря на NDA данные уже просачиваются в сеть. Конечно, согласно нашему рассказу об архитектуре, наибольшее влияние будет заметно в серверных приложениях, однако существует и много домашних отлично распараллеленных приложений, в которых эффект от доработок также не замедлит сказаться. Кодирование видео, 3D-рендеринг, архивация, программы, предъявляющие существенные требования к ПСП – все это работает на Bloomfield существенно быстрее, чем на Penryn.

Если же разработчики не утруждались распределением потоков вычислений по нескольким ядрам, стоит ожидать небольшого увеличения скорости до 15% в сравнении со старыми Core в зависимости от приложения.

Частотный потенциал процессоров радует – эксперименты по разгоны показывают, что Bloomfield, несмотря на намного более сложный по сравнению с Penryn кристалл, свободно работает на частотах около 4 ГГц при воздушном охлаждении. При этом не стоит забывать, что тестируются до сих пор инженерные степпинги B0 на ранних версиях BIOS материнских плат, да и нюансы оверклокинга новых CPU не изучены. Первым серийным станет лишь степпинг B2, который принесет по обещаниям Intel как некоторый прирост производительности, так и частоты с пониженным энергопотреблением.


Выводы и финальные слова

Итак, Nehalem собирается стать главным процессорным событием года. В ближайшие месяцы новая платформа Intel уже будет доступна на рынке. Для работы Bloomfield потребуется новая материнская плата, сам CPU, возможно новая память. Однако, покупая такой комплект для использования в хорошо отлаженных распараллеленных приложениях, вы точно не будете разочарованы.

Будучи спроектированным с прицелом на устранение слабостей Intel на серверном рынке, не вызывает недоумения факт, что первые версии Nehalem выходят именно в многоядерном исполнении, с большим кэшем и трехканальным контроллером памяти. Взятый вектор нововведений, сделанных в готовящемся CPU от Intel, напоминает курс AMD с ее Barcelona (K10).

Благодаря тому, что среди основных тенденций последнего времени в десктопных приложениях одной из наиболее значимых является переход к параллельным вычислениям, и здесь Nehalem окажется кстати, пусти проявив свои достоинства и в меньшей мере.

Самые значимые изменения, которые произошли в Nehalem, как и в случае с Penryn, фактически являются скрытыми от глаз простого пользователя. Корпорация подготовила себе базу для дальнейших резких скачков в производительности, и возможно даже общей смене концепции привычных нам CPU. При этом фундаментальные решения, принятые Intel при проектировании нового процессора, полностью соответствуют правилу, что любое энергетически-затратное нововведение должно незамедлительно отразиться на производительности. Ядра Nehalem – самые производительные и совершенные изо всех, которые когда-либо были спроектированы в Intel.

Конечно, переход на Nehalem с Core отнюдь не так впечатляющ, как в свое время прыжок Net Burst на Core. Однако видя небольшие изменения сейчас, мы задаемся вопросом – а что же дальше? Ведь если говорить грубо, наибольший выигрыш в производительности Nehalem получает от возросшей ПСП и встроенного КП, а не от каких-либо фундаментальных изменений в архитектуре ядер, слабо отличающихся от Penryn/Conroe. А ведь встроить контроллер памяти в ядро можно только единожды, дальше придется искать новые способы повышения производительности.

В 2009 году основные силы Intel будут брошены на Larrabee, а Nehalem лишь перейдет на более тонкий техпроцесс. В 2010 стоит ждать кардинально измененный Sandy Bridge, а до того времени именно сегодняшней эволюционировавшей от Core архитектуре в разных вариация придется защищать честь Intel на рынке центральных процессоров.

Пожалуй, сейчас наибольшие опасения вызывают только несколько готовящихся сокетов от Intel. Ведь если вспомнить недавние ошибки AMD с 754/939/940/AM2/AM2+, не хочется повторения такой же “мыльной оперы” с Nehalem, процесс миграции с сокета на сокет болезнен. Будем надеяться, что корпорация усвоила уроки, данные AMD, а вот свои подлости из прошлого, когда, казалось бы, подходившая по всем параметрам материнская плата могла не принимать новые процессоры только лишь по причине не соответствия ее PWM новым формальным требованиям Intel, забудет, обеспечив долгую жизнь LGA1366 и LGA1160.

Вот, пожалуй, и все, что можно сказать о Nehalem на сегодня. Мы знаем чего ждать, знаем, что изменилось, знаем положительные и отрицательные стороны архитектуры. Остается только провести полный анализ производительности CPU, подкрепив теорию практикой, а это станет возможным уже совсем скоро.

Источник www.nix.ru
__________________
Нужный человек не в том месте может перевернуть мир...

Последний раз редактировалось Мaster, 29.09.2008 в 00:14.
Мaster вне форума   Ответить с цитированием
Старый 29.09.2008, 00:08   #2 (permalink)
Вот так я модерирую мир..
 
Аватар для Мaster
 
Регистрация: 06.07.2007
Адрес: Москва
Возраст: 24
Сообщений: 1,127
Репутация: 215
Провайдер: Билайн
Почетный модератор Злодей TF2 Игровой эксперт 
Восклицание Турбо-режим процессоров Nehalem будет называться "Dynamic Speed Technology"


Уже известно, что процессоры Nehalem будут поддерживать турбо-режим (Turbo Mode). В этом режиме производительность одного или двух ядер автоматически повышается таким образом, чтобы общие энергопотребление и тепловыделение остались в пределах базовых характеристик. Например, если активный процесс использует только одно или два ядра процессора, то бездействующие ядра будут отключены, а работающее ядро разогнано, за счёт чего выполнение задачи ускорится. Разумеется, такой "разгон" возможен только при выполнении программ, не рассчитанных на многоядерные процессоры.

Как сообщает источник, компания Intel обнародовала официальное название турбо-режима: Dynamic Speed Technology (технология динамического изменения скорости). Насколько этот режим (или технология, раз уж так угодно Intel) будет повышать производительность процессоров, мы увидим после выпуска процессоров Core i7.
__________________
Нужный человек не в том месте может перевернуть мир...
Мaster вне форума   Ответить с цитированием
Старый 29.09.2008, 00:08   #3 (permalink)
Вот так я модерирую мир..
 
Аватар для Мaster
 
Регистрация: 06.07.2007
Адрес: Москва
Возраст: 24
Сообщений: 1,127
Репутация: 215
Провайдер: Билайн
Почетный модератор Злодей TF2 Игровой эксперт 
Хорошо Первые процессоры Core i7 появятся в ноябре


Источник сообщает, что первое поколение процессоров Nehalem, Core i7 под кодовым именем Bloomfield, будет выпущено между 10 и 14 ноября. Вдобавок ходят слухи, что в Японии эти процессоры появятся на неделю раньше, и, возможно, к началу продаж Bloomfield в Европе уже появятся отзывы пользователей.

К этому же времени многие производители материнских плат собираются выпустить платы на X58, предназначенные для процессоров Bloomfield.
__________________
Нужный человек не в том месте может перевернуть мир...
Мaster вне форума   Ответить с цитированием
Старый 29.09.2008, 00:10   #4 (permalink)
Вот так я модерирую мир..
 
Аватар для Мaster
 
Регистрация: 06.07.2007
Адрес: Москва
Возраст: 24
Сообщений: 1,127
Репутация: 215
Провайдер: Билайн
Почетный модератор Злодей TF2 Игровой эксперт 
Злость Игры не ускорятся на Nehalem?


После выпуска процессоров i7 не стоит ожидать потрясающего прироста производительности во всех играх. Часть игр ускорится на 10-15%, но у большей части игр прирост будет меньше 10%.

Причина этого заключается в том, что большая часть игр не может использовать все возможности, предоставленные четырёхъядерным процессором Nehalem. Четырёхъядерный процессор, у которого включен HyperThreading, способен одновременно обрабатывать восемь вычислительных потоков, и так как написать код, использующий сразу все восемь потоков достаточно сложно, то многие игры будут идти на четырёхъядерном процессоре почти так же, как на двухъядерном.

В будущем это может стать проблемой для Intel. Если производители игр, предназначенных для супермощных ПК, не будут писать код, использующий все возможности четырёхъядерников, процессоры Core i7 будут непопулярны, а будущие процессоры с 16 и 32 ядрами могут быть в принципе не востребованы. Сейчас в большей части игр нет заметного различия в производительности двухъядерного и четырёхъядерного процессоров Intel с частотой 3.0ГГц
__________________
Нужный человек не в том месте может перевернуть мир...
Мaster вне форума   Ответить с цитированием
Старый 06.11.2008, 22:33   #5 (permalink)
Вот так я модерирую мир..
 
Аватар для Мaster
 
Регистрация: 06.07.2007
Адрес: Москва
Возраст: 24
Сообщений: 1,127
Репутация: 215
Провайдер: Билайн
Почетный модератор Злодей TF2 Игровой эксперт 


Ну что же могу поздравить всех, вчера большинство "железных" сайтов thg.ru, Fcenter.ru, http://www.overclockers.ru/ и прочие опубликовали первы тесты Нехалемов(корей и7). Данная архитектура убрала потенциально узкое место "старых" C2D/C2Q, коим среди прочих можно считать FSB - дада северного моста больше нет, и частоты всей системы задаются в одном генераторе, а потом множителями доводятс ядо нужных значений! Но не радуйтесь преимущество новых процессоров и возможностей трехканального режима памяти пока дало очень малое преимущество над существующими моделями. Ждем новых резивий процессоров, материнских плат, модуелй памяти и конечено же приложений способных раскрыть потенциал фактически 8 ядерных процессоров.
__________________
Нужный человек не в том месте может перевернуть мир...
Мaster вне форума   Ответить с цитированием
Ответ




Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 
Опции темы
Опции просмотра

Ваши права в разделе
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Trackbacks are Вкл.
Pingbacks are Вкл.
Refbacks are Вкл.



Не знаете, возможна ли комната отдыха в офисе? С компанией W-G-C нет ничего невозможного!
При копировании информации ссылка на источник обязательна!

Часовой пояс GMT +4, время: 10:06.
vBulletin® Version 3.8.2.Copyright ©2000 - 2012, Jelsoft Enterprises Ltd. Перевод: zCarot
Template-Modifications by TMS