Big Sky :: シャア専用memcpy前回は効果が無かったけど、今回は
試してみた memcpy 最適化 - id:kazuhookuのメモ置き場バイト単位でコピーするアホなコードの方が、勝手にベクトル化される分、gcc 内蔵のヤツより最大3倍高速なんだってwwwx64じ...
http://mattn.kaoriya.net/software/gcc/20080617134829.htm
--------------------------------------------------------------------------
gcc (GCC) 4.4.0
Copyright (C) 2009 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
--------------------------------------------------------------------------
# gcc -O3 -ftree-vectorize -msse2 test.c
adhock memcpy: 1.625031
normal memcpy: 3.734447
# gcc -O3 -ftree-vectorize -ftree-vectorizer-verbose=5 -mmmx -msse3 test.c
adhock memcpy: 1.609581
normal memcpy: 3.750480
# gcc test.c
adhock memcpy: 79.642154
normal memcpy: 4.968845
確かに3倍近いスコアが出てる。もうmemcpyとかinlineでいいんでね?