· Начало · Отвђтить · Статистика · Поиск · FAQ · Правила · Установки · Язык · Выход · WASM.RU · Noir.Ru ·

 WASM Phorum —› WASM.HEAP —› Intel Pentium4 NetBurst

<< . 1 . 2 . 3 . >>

Посл.отвђт Сообщенiе


Дата: Сен 29, 2004 18:25:32

leo

Возможно, сейчас эти сведения устарели. Несколько лет назад официальный представитель фирмы intel сказал мне лично следующее:
"intel тратит 10% прибыли на branding".

Ты читаешь руководства intel глазами программиста, а взгляни на них по-другому - поищи скрытую рекламу, сравни различая между старыми и новыми доками - некоторые вещи "почему-то" исчезли.
Например раскладки по времени выполнения команд.
Почему ??
"Реклама - это только правда, ещё раз правда, ничего кроме правды, но.. не вся правда".

Но хватит лирики :)
Сравним для начала количество декодеров ;-)
Для NetBurst, кстати отдельный раздел - есть в оглавлении optimization manual.
А вот для Pentium M в том же оглавлении его почему-то нет (в моей книжке) - но инфа эта есть, замаскированная в другом разделе.

Ребята из AMD не обязательно умнее. У них нет накатанной маркетологами дорожки, по которой процы идут к покупателям.
Они просто вынуждены делать что-то лучше.

Да, некоторое время назад intel приходилось тратить дополнительные средства на инновации, а AMD экономили "просто повторяя" их. Сейчас уже я так не могу сказать. Именно intel сделали новый процессор, который совместим с AMD x86-64.

> „А интелы уверяют, что конвеер NetBurst способен работать на частотах до 10GHz“

Вот только в кремнии мы всё это наврядли увидим ;-)
Вообще, красиво сказано, с "запасом". Ключевое слово здесь - „до“ :-)


Про длину конвеера - как и зачем, semen в общем-то сказал, добывитььтут что-то сложно.
Его удлиняют не от хорошей жизни, но он отрицательно сказывается на скорости.


semen > „Сделай сравнения еще раз. Я недавно сравнивал AMD ATHLON XP 2400+ "Thoroughbred" (2000MHz) и 2.40GHz Intel Pentium4 (512k,800MHz) на своем AC3 декодере, который оптимизирован и туда и туда по максиуму.“

Возможно проблема моя как раз в том и была, что не было достаточного количества времени работать на PIV, возможно потому что под AMD я смотрел pipline в CodeAnalyst, а под всё делал "на глаз" по TSC..
Ирония судьбы - все более менее мощные компы, к которым сейчас у меня есть (может появиться) доступ - это athlon.
Так что сейчас я тут могу только "по ля-ля" (чем и занимаюсь :-)

И вроде, процы не равнозначные - частота разная, FSB разная, кеш у athlon меньше.


Вобще-то я и не имел ввиду, что NetBurst - это плохо.
Плохо то, что если взять готовый код заточенный (или не заточенный) под какой-нибудь blended model, то этот код на athlon как правило начинает работать быстрее, а на NetBurst - как правило медленнее и требует "доработок" для улучшения результата. Сколько команд добавили в категорию "не рекомендуется использовать" :(

intel ведёт стратегию огня и движения - заставляет всех плясать под их дудку.


ЗЫ
Всё это не для "разжигания" спора. Я так же не являюсь сторонником конкретных производителей, но за абстрактных попугаев производительности я плачу совсем не абстрактные деньги, которые я с бОльшим удовольствием вложу в нелишние 2 дюйма монитора - это если я хочу что-то увидеть. А если хочу скорость по-больше, то лучше добавлю памяти ;-)


ЗЫЫ
Помню, как-то спросил кто-то про восстановление ntfs, дык потом 5 страниц был flame war CRT vs LCD =)


Дата: Сен 29, 2004 19:27:39 · Поправил: semen

S_T_A_S_
Вот что у интела нет Latency&Troughput для всех комад - меня тоже напрягает, хотя там не так и много осталось... У интела мне нравицца описание найденных ошибок в процессорах - у AMD такого нет - если не прав - поправьте... Ааа - насчет кеша - я же говорю что тест был проведен что все вмещалось в кеш, а потом проведен потоковый тест, где декодировалось куча фреймов, но P4 выиграл еще сильнее из-за 800Mhz FSB, а так у атлона зато кеш первого уровня 128кб и 256L2 - IMHO это круче, чем 16L1 + 512L2 у P4...

Что до остального я хз... на скрытую рекламу, если таковая есть я не обращаю внимания - хотя некая правда в этом есть - в документах расписывается это так, что NetBrust это как миниум пуп земли :)... - мне важен конечный результат... хотя по большому счету я бы сказал - пофигу - все равно все летает... единственно напрягает несовместимость типа push cs...


Дата: Сен 29, 2004 19:58:59

Вообще не понимаю что вы тут все обсуждаете ;-)
я вот сижу на Athlon 1133 и ничего, и памяти у меня 128Мб тоже терпимо %) Вполне можно ещё годик на такой конфигурации просидеть, до снижения цен на 64 битные процы :-)


Дата: Сен 29, 2004 20:03:11

semen
> У интела мне нравицца описание найденных ошибок в процессорах - у AMD такого нет - если не прав - поправьте...

Прав, у AMD "такого" нет, в смысле - ошибок ;-)


Дата: Сен 29, 2004 21:10:18

Asterix
„Прав, у AMD "такого" нет, в смысле - ошибок ;-)“
Если ты в смысле что в проце ошибок нет - то ты ошибаешься :)


Дата: Сен 29, 2004 21:48:22

а вот про то что у интела кэш L2 дает латентность в 1.5 раз большую чем L1 забыли упомянуть. то есть у атлона Л2 тормознее Л1 а у П4 и П3 - скорость при выходе из Л1 _не падает_.


Дата: Сен 29, 2004 22:07:26

semen > „Вот что у интела нет Latency&Troughput для всех комад - меня тоже напрягает, хотя там не так и много осталось...“

У меня откуда-то смутное подозрение, что на тех командах которых нет, цифры эти просто ужастные :-)
Про LEA же пишут - "не очень быстро" а вот на сколько ?

> „У интела мне нравицца описание найденных ошибок в процессорах - у AMD такого нет“

Я как-то видел на оффсайте в разделе документации, но не качал и внимания вообще мало обратил - не знаю зачем мне это. щас в goole набрал amd athlon errata дык глаза разбежались 8-() Вроде бы только, некоторые вещи умалчивают (кое что исправляется обновлением микрокода).

На счёт кеша сложно судить.. система многопоточная, контексты переключаются и большой L2 IMHO помогает.
Насколько - сложно сказать. У меня на одной машине различные показатели у элементарных тестов - большие блоки обрабатываются быстрее под XP, маленькие под мастдаем.
До 20% разница, это видимо выше моего понимания :-)

> „на скрытую рекламу, если таковая есть я не обращаю внимания“

Это IMHO только кажется ;-) Я иной раз так зачитывался, что из-за этого забывал зачем в доку полез :)))


Про 64бит: указатели мне такие даром не нужны, а вот для данных не помешает иной раз (даже для обработки текста это может прогодиться), спасает MMX конечно.. Самое главное - регистров общего назначения удвоилось в количестве - их порой хочется по-больше (хотя иногда опять MMX спасает, если FPU не используется). Хотя IMHO тут и минусы - много архитектур это плохо, так мы придём к 8-ми вариантам одного экзешника :-)

Мне почему-то кажется, когда AMD-64 упадёт в цене, их будут использовать большей частью на 32х битном коде, но по 2 проца - вот тут-то сильно скажутся плюсы интегрированого контроллера памяти..


Asterix > „Вообще не понимаю что вы тут все обсуждаете ;-)“

Ну надо же что-то обсуждать, что бы мозги отдыхали. Я тут уже который день репу чесал над одним примитивным вопросом, пока не понял, что это сделать в принципе невозможно :)))) Хотя надо ещё подумать..


Дата: Сен 29, 2004 23:58:13 · Поправил: semen

S_T_A_S_
„У меня откуда-то смутное подозрение, что на тех командах которых нет, цифры эти просто ужастные :-)
Про LEA же пишут - "не очень быстро" а вот на сколько ? “


Слющай, а тэбе нэ все равно?(шутка - взьми да померяй) - реальная прога работает так что инструкций сходит больше чем тактов. Протестированный сегодня на работе кодер AAC работает аналогично. А мне как я уже сказал важен результат.

„Я как-то видел на оффсайте в разделе документации, но не качал и внимания вообще мало обратил - не знаю зачем мне это. щас в goole набрал amd athlon errata дык глаза разбежались 8-() Вроде бы только, некоторые вещи умалчивают (кое что исправляется обновлением микрокода). “

Хы - нашел - в Athlon багов чуть ли не больше чем в P2!!!

„На счёт кеша сложно судить.. система многопоточная, контексты переключаются и большой L2 IMHO помогает.


Насчет кеша я уже говорил - все помещалось в L1 на обоих процах, первый цикл опускался, MSRы показывали что кэш промахов почти не было. А латентность L2 - намного больше!!!

„У меня на одной машине различные показатели у элементарных тестов - большие блоки обрабатываются быстрее под XP, маленькие под мастдаем.
До 20% разница, это видимо выше моего понимания :-) “


У меня такое тоже было - алигн данных проверял?

„Это IMHO только кажется ;-) Я иной раз так зачитывался, что из-за этого забывал зачем в доку полез :))) “

Ты меня так хорошо знаешь? Железно - на меня это не влияет.

„Хотя IMHO тут и минусы - много архитектур это плохо, так мы придём к 8-ми вариантам одного экзешника :-) “

100% верно. Да и вообще все тяжелое наследие x86 не в плюс. А насчет AMD-64 - поживем увидим, потрогать руками нада.


Дата: Сен 30, 2004 13:16:54

semen > „Слющай, а тэбе нэ все равно?(шутка - взьми да померяй) - реальная прога работает так что инструкций сходит больше чем тактов.“

Да померь-то я могу, но тока на atlone. А на PIV скорость инструкции этой не постоянна, а зависит как я понял от операндов - множителей, кол-ва регистров.
А то что инструкций больше чем тактов - это не потолок. Их может быть больше в 2-3 раза.

> „алигн данных проверял?“

Дык! прога одна и таже, выравнивание данных - страница. И на столько примитивная, что дальше некуда - просто память копирует.
А потом в лом стало разбираться с этим - всё равно мастдай умер, щас занимаюсь другими вещами, если где и приходится оптимизировать, то по размеру, ибо структура данных такова, что через медленную шину памяти плохо проходит :/


Дата: Сен 30, 2004 15:58:13 · Поправил: semen

b]S_T_A_S_[/b]
„Да померь-то я могу, но тока на atlone. А на PIV скорость инструкции этой не постоянна, а зависит как я понял от операндов - множителей, кол-ва регистров. “

Да - мерять надо для всех видов операндов...

„Дык! прога одна и таже, выравнивание данных - страница. И на столько примитивная, что дальше некуда - просто память копирует.
А потом в лом стало разбираться с этим - всё равно мастдай умер, щас занимаюсь другими вещами, если где и приходится оптимизировать, то по размеру, ибо структура данных такова, что через медленную шину памяти плохо проходит :/“


Ну да - надо разбираться - и причина где-то есть - факт :) у меня это было из-за алигна, и проявлялось не только призапуске из разных ОС, но и при запуске из фара и експлорера. Так что проверить MSRами кол-во неалигненных загрузок не помешает.


Дата: Сен 30, 2004 18:20:48

у интела инфу видел - латентность кэша Л1-4 такта, Л2-6 тактов. макс задержка из Л2 +2 такта на запись модифицированной стоки кэша при условии что очередь записи не полна. а если полна, то и атлон загнется.

а вообще мне интел не нравицца и атлон тоже. ну... тяжолые процы пошли, RISC красявше. альфа например, и SIMD на альфе - это вообще сказка. инструкций - тьма.

кстати кто нить может подсказать - есть ли в России конторы печетающие микрухи по заказ?


Дата: Сен 30, 2004 18:45:55

Ни FAR, ни эксплорер тут ни причём. Невыровненный доступ к памяти тоже отсутствует в принципе.

Принцип такой: считываю 128Кб данных в кеш, потом этот блок перекидываю в другое место, и так пока 16 метров не перекидаю.
В XP bandwidth (DDR266) ~1820 Mb/sec, а в мастдае ~1535 Mb/sec.
Вот, я тест этот выкладывал.

А причина IMHO проста - мастдаевский sheduler мой процесс чаще прерывает, соответственно содержимое кеша портится - эффект от такого метода копирования снижается.. И неичего тут не сделаешь, т.к. обычные способы (не через кеш) дают скорость в 2-3 раза меньше. Может, я и ощибаюсь


Дата: Сен 30, 2004 18:55:03

Narkomanius > „а вообще мне интел не нравицца и атлон тоже. ну...“

Во-во! :)

[offtop]

Умирает старый пасечник, сто лет прожил.
Собрались вокруг дети, внуки, правнуки - ждут, последних слов.
А он:
- Прожил я долгую жизнь, много чего повидал, и скажу я вам: деньги это фигня, женщины.. женщины тоже.. .. вот пчёлы..
и теряет сознание. Все ждут продолжения. Проходит час, другой, и он продолжил: пчёлы тоже фигня.


Дата: Сен 30, 2004 19:20:57 · Поправил: semen

Narkomanius
Насчет кеша у тебя нифа левая - даже на моем буке с Mobile P4 1.7 латентность L1 2 такта.

Насчет Альфы[проглючил - имеется ввиду PowerPC] - это тааа, - нет наследия тяжелого прошлого. Но непосредственные сравнения реальных прог, компиленых gcc показали что реальная скорость не сильно отличается от того-же P4, короче я хз - тесты были проведены не особо крутые.

S_T_A_S_
Я и не говорил что у тебя фар при чем-то - я говорил как у меня было... А насчет шедулера может ты и прав - я тоже попробую, тока не помню чтоб было большое различие в частоте вызова шедулера...


Дата: Сен 30, 2004 20:17:18

Narkomanius
„альфа например“
Альфа? Тот, про который HP объявила, что продолжения не будет?! Нечто подобное про RISC утверждал небезизвестный Стив из Apple, но потом признал свою ошибку :-)

<< . 1 . 2 . 3 . >>


Powered by miniBB 1.6 © 2001-2002
Время загрузки страницы (сек.): 0.169