Prijeđite na glavni sadržaj

Akceleracija izračuna FLAPW metoda na heterogenim arhitekturama

18.5.2026.

Naslijeđeni programski kodovi u računalnoj znanosti i inženjerstvu pokazali su se iznimno uspješnima u pružanju ključnih funkcionalnosti istraživačima. Međutim, oni nisu sposobni učinkovito iskoristiti masivni paralelizam koji omogućuju nove heterogene računalne arhitekture. Nedostatak prenosivih performansi i skalabilnosti predstavlja velik rizik, odnosno takvi sustavi moraju evoluirati ili će ostati ograničeni na starije platforme i manje računalne klastere.

Jedan od primjera naslijeđenog koda koji bi značajno profitirao modernim redizajnom jest FLEUR, softver za izračune elektroničke strukture. U prethodnim radovima djelomično je redizajniran računalni uski grlo sustava FLEUR kako bi se dobio modularni dizajn temeljen na standardnim komponentama poput BLAS i LAPACK biblioteka.

U ovom radu pokazujemo kako takav početni redizajn omogućuje prenosivost na heterogene arhitekture. Konkretno, proučavali smo različite pristupe prilagodbe koda arhitekturama koje se sastoje od višejezgrenih CPU procesora opremljenih jednim ili više koprocesora, poput Nvidia GPU-ova i Intel Xeon Phi sustava.

Završna verzija koda postiže više od 70 % maksimalnih performansi arhitekture te nadmašuje Nvidia i Intel biblioteke. Na JURECA sustavu, velikom tier-0 klasteru na kojem se FLEUR često izvršava, kod uspješno iskorištava puni potencijal računalnih čvorova, ostvarujući pet puta veće ubrzanje u odnosu na korištenje samo CPU procesora.

Akceleracija izračuna FLAPW metoda na heterogenim arhitekturama