64비트 CPU 대상 32비트 나눗셈 연산 최적화 기법 개발
원제: Optimization of 32-bit Unsigned Division by Constants on 64-bit Targets
왜 중요한가
컴파일러 최적화 기술의 실질적 발전으로 64비트 시스템의 성능 활용도 향상에 기여
일본 연구진이 64비트 CPU에서 32비트 부호 없는 정수의 상수 나눗셈을 최적화하는 새로운 기법을 개발했다고 arXiv에 발표했다. Intel Xeon에서 1.67배, Apple M4에서 1.98배 성능 향상을 달성했으며, LLVM 컴파일러에 이미 적용되었다.
Shigeo Mitsunari와 Takashi Hoshino 연구진이 64비트 CPU를 대상으로 한 32비트 부호 없는 정수의 상수 나눗셈 최적화 기법을 제안했다. 기존의 Granlund-Montgomery(GM) 방법은 GCC, Clang, Microsoft Compiler, Apple Clang 등 주요 컴파일러에서 채택되고 있지만, 32비트 CPU 기준으로 설계되어 64비트 CPU의 성능을 완전히 활용하지 못한다는 한계가 있었다. 새로운 최적화 기법은 x/7과 같은 연산에서 64비트 CPU의 능력을 완전히 활용할 수 있도록 설계되었다. 마이크로벤치마크 테스트 결과 Intel Xeon w9-3495X(Sapphire Rapids)에서 1.67배, Apple M4(Apple M-series SoC)에서 1.98배의 성능 향상을 기록했다. 연구진은 LLVM과 GCC용 패치를 구현했으며, LLVM 패치는 이미 llvm:main 브랜치에 병합되어 실용성을 입증했다. 이 연구는 프로그래밍 언어와 하드웨어 아키텍처 분야에 기여하는 것으로 평가된다.
출처
※ 본 기사는 해외 미디어의 공개 정보를 편집부가 한국어로 요약한 것입니다. 투자 판단을 권유하는 것이 아닙니다.