|
|
| Посл.отвђт | Сообщенiе |
|
|
Дата: Окт 6, 2003 06:07:49 · Поправил: Безпощадный даос у меня duron-1200 morgan, 128k L1, 64k L2, а у моего друга celeron 1200, насчет кэша я не помню. так вот решили мы как-то протестить что быстрее. Так вот в тестах типа пустой цикл и т. д... в общем CPU все примерно одинаково. Но я написал тест в духе: sin64: fsin [esp+4] ret 4 cos64: fcos [esp+4] ret 4 Тестер делал цикл из 1 000 000 итераций для каждой функции. Ну и мой проц дал где-то 1.5 млн. вызовов цикла в секунду, а celeron 0.5 млн. вызовов. Почему такая разница??? |
|
|
Дата: Окт 6, 2003 10:37:14 Поищи здесь, может что найдешь :))) http://forum.ixbt.com/0035/001057.html http://forum.ixbt.com/0015/041551.html |
|
|
Дата: Окт 6, 2003 11:11:27 П4( и Цел судя по всему) хуже работает с булькающей запятой, чем Атлон/Дюрон даже с гораздо меньшей частотой последних, сам проверял. Причину лень было искать. |
|
|
Дата: Окт 6, 2003 19:32:55 У AMD и Intel разные архитектуры процессоров, т.к. они (процессоры) предназначены для разных целей. Под AMD быстрее идут игры и некоторые офисные приложения, зато Pentium быстрее работает с архивами и мультимедиа. Все что я написал, я сегодня вычитал в "КомпьюТерре" за 30 сентября :) |
|
|
Дата: Окт 6, 2003 19:39:44 Pentium быстрее работает с архивами и мультимедиа Да, но только за счет SSE2. вычитал в "КомпьюТерре" Желтая пресса и то лучше, что это :) |
|
|
Дата: Окт 6, 2003 19:46:50 с булькающей запятой прикольная фраза :) |
|
|
Дата: Окт 7, 2003 14:17:36 "с булькающей запятой" не правильный перевод :-) Булькает - значит утонуло и не плавает. По поводу скорости скажу следующее. У Celeron Intel обрезает некоторые возможности. Предсказание ветвления, переименование регистров, спекулятивное выполнение итд. Кроме этого, эсли тестирование проводилось под Windows с переключение задач, то сказалась длина конвеера у Intel. |
|
|
Дата: Окт 7, 2003 15:21:56 masquer Да, но только за счет SSE2 Воо, еще один вспомнил это волшебное слово :) Если ты в этом шаришь, может быть глянешь сюда |
|
|
Дата: Окт 7, 2003 17:29:24 Max еще один вспомнил это волшебное слово :) Что значит - еще один? Я с SSE2 не оптимизирую, т.к. рядом П4/П3 нет. |
|
|
Дата: Окт 7, 2003 18:54:11 Что значит - еще один? да просто никто не может объяснить мне, в чем фишка того, что я написал - почему SSE2 работает медленее, чем FPU, хотя код для FPU длинее. Я понимаю, что есть спаривание команд :), но SSE - это тоже спаривание в какой-то мере... Просто это был мой первый (и пока последний) опыт работы с SSE (ради интереса), хотелось бы услышать конструктивную критику по этому примеру. |
|
|
Дата: Окт 8, 2003 01:39:24 masquer Да, но только за счет SSE2 Последние процы AMD тоже поддерживают SSE2, а разница в скорости архивирования в 20% (эти данные из той же "КомпьюТерры"). |
|
|
Дата: Окт 8, 2003 11:12:11 Max У интела книга есть по оптимизации P4, лучше ее почитай. Sk. Inc. Поддерживают, только чуть-чуть похуже. |
|
|
Дата: Окт 8, 2003 16:24:06 masquer Да читал я ее и много че еще. Вот и наваял как мог. А оно медленнее FPU работает :( А в чем секрет никто сказать не может |
|
|
Дата: Окт 8, 2003 17:57:30 Max Код и данные выровнены на границу 16? |
|
|
Дата: Окт 8, 2003 18:10:38 мне кажется, что здесь действительно проблемы с конвеером, потому как тест цикла типа: mov ecx,1000000 loop: fsin fsin fsin fsin dec ecx jnz loop работает примерно одинаково и на duron-1200 и на celeron-1200. Наверное у Intel'а плохо с предсказыванием переходов |
|
Powered by miniBB 1.6 © 2001-2002
Время загрузки страницы (сек.): 0.068 |