|
|
| Посл.отвђт | Сообщенiе |
|
|
Дата: Сен 29, 2004 18:25:32 leo Возможно, сейчас эти сведения устарели. Несколько лет назад официальный представитель фирмы intel сказал мне лично следующее: "intel тратит 10% прибыли на branding". Ты читаешь руководства intel глазами программиста, а взгляни на них по-другому - поищи скрытую рекламу, сравни различая между старыми и новыми доками - некоторые вещи "почему-то" исчезли. Например раскладки по времени выполнения команд. Почему ?? "Реклама - это только правда, ещё раз правда, ничего кроме правды, но.. не вся правда". Но хватит лирики :) Сравним для начала количество декодеров ;-) Для NetBurst, кстати отдельный раздел - есть в оглавлении optimization manual. А вот для Pentium M в том же оглавлении его почему-то нет (в моей книжке) - но инфа эта есть, замаскированная в другом разделе. Ребята из AMD не обязательно умнее. У них нет накатанной маркетологами дорожки, по которой процы идут к покупателям. Они просто вынуждены делать что-то лучше. Да, некоторое время назад intel приходилось тратить дополнительные средства на инновации, а AMD экономили "просто повторяя" их. Сейчас уже я так не могу сказать. Именно intel сделали новый процессор, который совместим с AMD x86-64. > А интелы уверяют, что конвеер NetBurst способен работать на частотах до 10GHz Вот только в кремнии мы всё это наврядли увидим ;-) Вообще, красиво сказано, с "запасом". Ключевое слово здесь - до :-) Про длину конвеера - как и зачем, semen в общем-то сказал, добывитььтут что-то сложно. Его удлиняют не от хорошей жизни, но он отрицательно сказывается на скорости. semen > Сделай сравнения еще раз. Я недавно сравнивал AMD ATHLON XP 2400+ "Thoroughbred" (2000MHz) и 2.40GHz Intel Pentium4 (512k,800MHz) на своем AC3 декодере, который оптимизирован и туда и туда по максиуму. Возможно проблема моя как раз в том и была, что не было достаточного количества времени работать на PIV, возможно потому что под AMD я смотрел pipline в CodeAnalyst, а под всё делал "на глаз" по TSC.. Ирония судьбы - все более менее мощные компы, к которым сейчас у меня есть (может появиться) доступ - это athlon. Так что сейчас я тут могу только "по ля-ля" (чем и занимаюсь :-) И вроде, процы не равнозначные - частота разная, FSB разная, кеш у athlon меньше. Вобще-то я и не имел ввиду, что NetBurst - это плохо. Плохо то, что если взять готовый код заточенный (или не заточенный) под какой-нибудь blended model, то этот код на athlon как правило начинает работать быстрее, а на NetBurst - как правило медленнее и требует "доработок" для улучшения результата. Сколько команд добавили в категорию "не рекомендуется использовать" :( intel ведёт стратегию огня и движения - заставляет всех плясать под их дудку. ЗЫ Всё это не для "разжигания" спора. Я так же не являюсь сторонником конкретных производителей, но за абстрактных попугаев производительности я плачу совсем не абстрактные деньги, которые я с бОльшим удовольствием вложу в нелишние 2 дюйма монитора - это если я хочу что-то увидеть. А если хочу скорость по-больше, то лучше добавлю памяти ;-) ЗЫЫ Помню, как-то спросил кто-то про восстановление ntfs, дык потом 5 страниц был flame war CRT vs LCD =) |
|
|
Дата: Сен 29, 2004 19:27:39 · Поправил: semen S_T_A_S_ Вот что у интела нет Latency&Troughput для всех комад - меня тоже напрягает, хотя там не так и много осталось... У интела мне нравицца описание найденных ошибок в процессорах - у AMD такого нет - если не прав - поправьте... Ааа - насчет кеша - я же говорю что тест был проведен что все вмещалось в кеш, а потом проведен потоковый тест, где декодировалось куча фреймов, но P4 выиграл еще сильнее из-за 800Mhz FSB, а так у атлона зато кеш первого уровня 128кб и 256L2 - IMHO это круче, чем 16L1 + 512L2 у P4... Что до остального я хз... на скрытую рекламу, если таковая есть я не обращаю внимания - хотя некая правда в этом есть - в документах расписывается это так, что NetBrust это как миниум пуп земли :)... - мне важен конечный результат... хотя по большому счету я бы сказал - пофигу - все равно все летает... единственно напрягает несовместимость типа push cs... |
|
|
Дата: Сен 29, 2004 19:58:59 Вообще не понимаю что вы тут все обсуждаете ;-) я вот сижу на Athlon 1133 и ничего, и памяти у меня 128Мб тоже терпимо %) Вполне можно ещё годик на такой конфигурации просидеть, до снижения цен на 64 битные процы :-) |
|
|
Дата: Сен 29, 2004 20:03:11 semen > У интела мне нравицца описание найденных ошибок в процессорах - у AMD такого нет - если не прав - поправьте... Прав, у AMD "такого" нет, в смысле - ошибок ;-) |
|
|
Дата: Сен 29, 2004 21:10:18 Asterix Прав, у AMD "такого" нет, в смысле - ошибок ;-) Если ты в смысле что в проце ошибок нет - то ты ошибаешься :) |
|
|
Дата: Сен 29, 2004 21:48:22 а вот про то что у интела кэш L2 дает латентность в 1.5 раз большую чем L1 забыли упомянуть. то есть у атлона Л2 тормознее Л1 а у П4 и П3 - скорость при выходе из Л1 _не падает_. |
|
|
Дата: Сен 29, 2004 22:07:26 semen > Вот что у интела нет Latency&Troughput для всех комад - меня тоже напрягает, хотя там не так и много осталось... У меня откуда-то смутное подозрение, что на тех командах которых нет, цифры эти просто ужастные :-) Про LEA же пишут - "не очень быстро" а вот на сколько ? > У интела мне нравицца описание найденных ошибок в процессорах - у AMD такого нет Я как-то видел на оффсайте в разделе документации, но не качал и внимания вообще мало обратил - не знаю зачем мне это. щас в goole набрал amd athlon errata дык глаза разбежались 8-() Вроде бы только, некоторые вещи умалчивают (кое что исправляется обновлением микрокода). На счёт кеша сложно судить.. система многопоточная, контексты переключаются и большой L2 IMHO помогает. Насколько - сложно сказать. У меня на одной машине различные показатели у элементарных тестов - большие блоки обрабатываются быстрее под XP, маленькие под мастдаем. До 20% разница, это видимо выше моего понимания :-) > на скрытую рекламу, если таковая есть я не обращаю внимания Это IMHO только кажется ;-) Я иной раз так зачитывался, что из-за этого забывал зачем в доку полез :))) Про 64бит: указатели мне такие даром не нужны, а вот для данных не помешает иной раз (даже для обработки текста это может прогодиться), спасает MMX конечно.. Самое главное - регистров общего назначения удвоилось в количестве - их порой хочется по-больше (хотя иногда опять MMX спасает, если FPU не используется). Хотя IMHO тут и минусы - много архитектур это плохо, так мы придём к 8-ми вариантам одного экзешника :-) Мне почему-то кажется, когда AMD-64 упадёт в цене, их будут использовать большей частью на 32х битном коде, но по 2 проца - вот тут-то сильно скажутся плюсы интегрированого контроллера памяти.. Asterix > Вообще не понимаю что вы тут все обсуждаете ;-) Ну надо же что-то обсуждать, что бы мозги отдыхали. Я тут уже который день репу чесал над одним примитивным вопросом, пока не понял, что это сделать в принципе невозможно :)))) Хотя надо ещё подумать.. |
|
|
Дата: Сен 29, 2004 23:58:13 · Поправил: semen S_T_A_S_ У меня откуда-то смутное подозрение, что на тех командах которых нет, цифры эти просто ужастные :-) Про LEA же пишут - "не очень быстро" а вот на сколько ? Слющай, а тэбе нэ все равно?(шутка - взьми да померяй) - реальная прога работает так что инструкций сходит больше чем тактов. Протестированный сегодня на работе кодер AAC работает аналогично. А мне как я уже сказал важен результат. Я как-то видел на оффсайте в разделе документации, но не качал и внимания вообще мало обратил - не знаю зачем мне это. щас в goole набрал amd athlon errata дык глаза разбежались 8-() Вроде бы только, некоторые вещи умалчивают (кое что исправляется обновлением микрокода). Хы - нашел - в Athlon багов чуть ли не больше чем в P2!!! На счёт кеша сложно судить.. система многопоточная, контексты переключаются и большой L2 IMHO помогает. Насчет кеша я уже говорил - все помещалось в L1 на обоих процах, первый цикл опускался, MSRы показывали что кэш промахов почти не было. А латентность L2 - намного больше!!! У меня на одной машине различные показатели у элементарных тестов - большие блоки обрабатываются быстрее под XP, маленькие под мастдаем. До 20% разница, это видимо выше моего понимания :-) У меня такое тоже было - алигн данных проверял? Это IMHO только кажется ;-) Я иной раз так зачитывался, что из-за этого забывал зачем в доку полез :))) Ты меня так хорошо знаешь? Железно - на меня это не влияет. Хотя IMHO тут и минусы - много архитектур это плохо, так мы придём к 8-ми вариантам одного экзешника :-) 100% верно. Да и вообще все тяжелое наследие x86 не в плюс. А насчет AMD-64 - поживем увидим, потрогать руками нада. |
|
|
Дата: Сен 30, 2004 13:16:54 semen > Слющай, а тэбе нэ все равно?(шутка - взьми да померяй) - реальная прога работает так что инструкций сходит больше чем тактов. Да померь-то я могу, но тока на atlone. А на PIV скорость инструкции этой не постоянна, а зависит как я понял от операндов - множителей, кол-ва регистров. А то что инструкций больше чем тактов - это не потолок. Их может быть больше в 2-3 раза. > алигн данных проверял? Дык! прога одна и таже, выравнивание данных - страница. И на столько примитивная, что дальше некуда - просто память копирует. А потом в лом стало разбираться с этим - всё равно мастдай умер, щас занимаюсь другими вещами, если где и приходится оптимизировать, то по размеру, ибо структура данных такова, что через медленную шину памяти плохо проходит :/ |
|
|
Дата: Сен 30, 2004 15:58:13 · Поправил: semen b]S_T_A_S_[/b] Да померь-то я могу, но тока на atlone. А на PIV скорость инструкции этой не постоянна, а зависит как я понял от операндов - множителей, кол-ва регистров. Да - мерять надо для всех видов операндов... Дык! прога одна и таже, выравнивание данных - страница. И на столько примитивная, что дальше некуда - просто память копирует. А потом в лом стало разбираться с этим - всё равно мастдай умер, щас занимаюсь другими вещами, если где и приходится оптимизировать, то по размеру, ибо структура данных такова, что через медленную шину памяти плохо проходит :/ Ну да - надо разбираться - и причина где-то есть - факт :) у меня это было из-за алигна, и проявлялось не только призапуске из разных ОС, но и при запуске из фара и експлорера. Так что проверить MSRами кол-во неалигненных загрузок не помешает. |
|
|
Дата: Сен 30, 2004 18:20:48 у интела инфу видел - латентность кэша Л1-4 такта, Л2-6 тактов. макс задержка из Л2 +2 такта на запись модифицированной стоки кэша при условии что очередь записи не полна. а если полна, то и атлон загнется. а вообще мне интел не нравицца и атлон тоже. ну... тяжолые процы пошли, RISC красявше. альфа например, и SIMD на альфе - это вообще сказка. инструкций - тьма. кстати кто нить может подсказать - есть ли в России конторы печетающие микрухи по заказ? |
|
|
Дата: Сен 30, 2004 18:45:55 Ни FAR, ни эксплорер тут ни причём. Невыровненный доступ к памяти тоже отсутствует в принципе. Принцип такой: считываю 128Кб данных в кеш, потом этот блок перекидываю в другое место, и так пока 16 метров не перекидаю. В XP bandwidth (DDR266) ~1820 Mb/sec, а в мастдае ~1535 Mb/sec. Вот, я тест этот выкладывал. А причина IMHO проста - мастдаевский sheduler мой процесс чаще прерывает, соответственно содержимое кеша портится - эффект от такого метода копирования снижается.. И неичего тут не сделаешь, т.к. обычные способы (не через кеш) дают скорость в 2-3 раза меньше. Может, я и ощибаюсь |
|
|
Дата: Сен 30, 2004 18:55:03 Narkomanius > а вообще мне интел не нравицца и атлон тоже. ну... Во-во! :) [offtop] Умирает старый пасечник, сто лет прожил. Собрались вокруг дети, внуки, правнуки - ждут, последних слов. А он: - Прожил я долгую жизнь, много чего повидал, и скажу я вам: деньги это фигня, женщины.. женщины тоже.. .. вот пчёлы.. и теряет сознание. Все ждут продолжения. Проходит час, другой, и он продолжил: пчёлы тоже фигня. |
|
|
Дата: Сен 30, 2004 19:20:57 · Поправил: semen Narkomanius Насчет кеша у тебя нифа левая - даже на моем буке с Mobile P4 1.7 латентность L1 2 такта. Насчет Альфы[проглючил - имеется ввиду PowerPC] - это тааа, - нет наследия тяжелого прошлого. Но непосредственные сравнения реальных прог, компиленых gcc показали что реальная скорость не сильно отличается от того-же P4, короче я хз - тесты были проведены не особо крутые. S_T_A_S_ Я и не говорил что у тебя фар при чем-то - я говорил как у меня было... А насчет шедулера может ты и прав - я тоже попробую, тока не помню чтоб было большое различие в частоте вызова шедулера... |
|
|
Дата: Сен 30, 2004 20:17:18 Narkomanius альфа например Альфа? Тот, про который HP объявила, что продолжения не будет?! Нечто подобное про RISC утверждал небезизвестный Стив из Apple, но потом признал свою ошибку :-) |
|
Powered by miniBB 1.6 © 2001-2002
Время загрузки страницы (сек.): 0.169 |