· Начало · Отвђтить · Статистика · Поиск · FAQ · Правила · Установки · Язык · Выход · WASM.RU · Noir.Ru ·

 WASM Phorum —› WASM.HEAP —› AMD vs intel- есть предложение завестись конкреTно

. 1 . 2 . >>

Посл.отвђт Сообщенiе


Дата: Окт 6, 2003 06:07:49 · Поправил: Безпощадный даос

у меня duron-1200 morgan, 128k L1, 64k L2, а у моего друга celeron 1200, насчет кэша я не помню. так вот решили мы как-то протестить что быстрее. Так вот в тестах типа пустой цикл и т. д... в общем CPU все примерно одинаково.
Но я написал тест в духе:
sin64:
  fsin  [esp+4]
  ret   4

cos64:
  fcos  [esp+4]
  ret   4


Тестер делал цикл из 1 000 000 итераций для каждой функции. Ну и мой проц дал где-то 1.5 млн. вызовов цикла в секунду, а celeron 0.5 млн. вызовов. Почему такая разница???


Дата: Окт 6, 2003 10:37:14

Поищи здесь, может что найдешь :)))

http://forum.ixbt.com/0035/001057.html
http://forum.ixbt.com/0015/041551.html


Дата: Окт 6, 2003 11:11:27

П4( и Цел судя по всему) хуже работает с булькающей запятой, чем Атлон/Дюрон даже с гораздо меньшей частотой последних, сам проверял. Причину лень было искать.


Дата: Окт 6, 2003 19:32:55

У AMD и Intel разные архитектуры процессоров, т.к. они (процессоры) предназначены для разных целей. Под AMD быстрее идут игры и некоторые офисные приложения, зато Pentium быстрее работает с архивами и мультимедиа.

Все что я написал, я сегодня вычитал в "КомпьюТерре" за 30 сентября :)


Дата: Окт 6, 2003 19:39:44

Pentium быстрее работает с архивами и мультимедиа
Да, но только за счет SSE2.

вычитал в "КомпьюТерре"
Желтая пресса и то лучше, что это :)


Дата: Окт 6, 2003 19:46:50

с булькающей запятой

прикольная фраза :)


Дата: Окт 7, 2003 14:17:36

"с булькающей запятой" не правильный перевод :-)
Булькает - значит утонуло и не плавает.

По поводу скорости скажу следующее.
У Celeron Intel обрезает некоторые возможности.
Предсказание ветвления, переименование регистров, спекулятивное выполнение итд.

Кроме этого, эсли тестирование проводилось под Windows
с переключение задач, то сказалась длина конвеера у Intel.


Дата: Окт 7, 2003 15:21:56

masquer
Да, но только за счет SSE2
Воо, еще один вспомнил это волшебное слово :)
Если ты в этом шаришь, может быть глянешь сюда


Дата: Окт 7, 2003 17:29:24

Max
еще один вспомнил это волшебное слово :)
Что значит - еще один?
Я с SSE2 не оптимизирую, т.к. рядом П4/П3 нет.


Дата: Окт 7, 2003 18:54:11

Что значит - еще один?
да просто никто не может объяснить мне, в чем фишка того, что я написал - почему SSE2 работает медленее, чем FPU, хотя код для FPU длинее.
Я понимаю, что есть спаривание команд :), но SSE - это тоже спаривание в какой-то мере...
Просто это был мой первый (и пока последний) опыт работы с SSE (ради интереса), хотелось бы услышать конструктивную критику по этому примеру.


Дата: Окт 8, 2003 01:39:24

masquer
Да, но только за счет SSE2
Последние процы AMD тоже поддерживают SSE2, а разница в скорости архивирования в 20% (эти данные из той же "КомпьюТерры").


Дата: Окт 8, 2003 11:12:11

Max
У интела книга есть по оптимизации P4, лучше ее почитай.

Sk. Inc.
Поддерживают, только чуть-чуть похуже.


Дата: Окт 8, 2003 16:24:06

masquer
Да читал я ее и много че еще. Вот и наваял как мог. А оно медленнее FPU работает :(
А в чем секрет никто сказать не может


Дата: Окт 8, 2003 17:57:30

Max
Код и данные выровнены на границу 16?


Дата: Окт 8, 2003 18:10:38

мне кажется, что здесь действительно проблемы с конвеером, потому как тест цикла типа:
mov ecx,1000000
loop:
fsin
fsin
fsin
fsin
dec ecx
jnz loop

работает примерно одинаково и на duron-1200 и на celeron-1200.
Наверное у Intel'а плохо с предсказыванием переходов

. 1 . 2 . >>


Powered by miniBB 1.6 © 2001-2002
Время загрузки страницы (сек.): 0.068