|
П.Б. Богданов, О.Ю. Сударева "Применение отечественных специализированных процессоров семейства КОМДИВ в научных расчётах" |
|
Аннотация. В статье на примере трёх алгоритмов из NAS Parallel Benchmarks исследуется принципиальная возможность использования аппаратно-программных решений ФГУ ФНЦ НИИСИ РАН в расчётных задачах общего назначения. Для различных реализаций выбранных алгоритмов — как референсных, так и оптимизированных под микропроцессоры семейства КОМДИВ — приводятся результаты замеров производительности на уже выпускаемых микропроцессорах, а также на ПЛИС-прототипе перспективного микропроцессора. Приводятся также оценки ожидаемой производительности на многопроцессорных комплексах. Делаются выводы о принципиальной применимости таких комплексов для научных расчётов и даются рекомендации к дальнейшей оптимизации аппаратных компонент. Ключевые слова: КОМДИВ, CP2, CPV, RapidIO, NAS PB, MG, CG, FT Стр. 45-65. P.B. Bogdanov, O.J. Sudareva"The applicability of Russian special-purpose KOMDIV microprocessor series for scientific computations"In this article we consider the application possibility of Russian hardware components and software products devised by the ISR RAS for general-purpose computations, taken three NAS Parallel Benchmarks algorithms as an example. For different code versions — reference implementations, as well as code versions optimized for KOMDIV microprocessors — we provide the results of performance tests on existing microprocessors and on FPGA prototype of the future microprocessor version. The performance estimates for a multi-processor complex are also given. We draw the conclusions about the fundamental applicability of such complexes for scientific computations and give recommendations for further hardware optimizations. Keywords: KOMDIV, CP2, CPV, RapidIO, NAS PB, MG, CG, FT. Полная версия статьи в формате pdf. REFERENCES 1. Dominic Sweetman. See MIPS Run, 2nd Edition. — Morgan Kaufmann Publishers, 2006. — 512 pp. 2. RapidIO Specifications // URL: http://www.rapidio.org/rapidio-specifications/ 3. VMEbus Technology FAQ // URL: http://www.vita.com/page-1855175 4. Doug Abbott. PCI Bus Demystified, 2nd edition. — Newnes, 2004. — 250 pp. 5. Ravi Budruk, Don Anderson, Tom Shanley. PCI Express System Architecture. — Addison-Wesley Professional,1999. — 832 pp. 6. TigerSHARC Processor Benchmarks // URL: http://www.analog.com/ru/design-center/landingpages/001/tigersharc-benchmarks.html 7. Mikroskhema integralnaya 1890VM7Ya (KOMDIV128-RIO). Ukazaniya po primeneniyu. YuKSU.431281.104D4. — Moskva: NIISI RAN, 2009. — 371 s. 8. MPI: A message-passing interface standard, version 3.0. //Message Passing Interface Forum, 2012. URL: http://www.mpi-forum.org/docs/mpi-3.0/mpi30-report.pdf 9. D. Bailey, E. Barszcz, J. Barton, D. Browning, R. Carter, L. Dagum, R. Fatoohi, S. Fineberg, P. Fred-erickson, T. Lasinski, R. Schreiber, H.Simon,V.Venkatakrishnan and S.Weeratunga. The NAS Parallel Benchmarks // RNR Technical Report RNR-94-007, March 1994. 10. NAS Parallel Benchmarks // URL: https://www.nas.nasa.gov/publications/npb.html 11. Kuleshov A.S. Podderzhka protokola MPI v yadre OS Linux dlya mnogoprotsessornykh vychislitelnykh kompleksov na baze vysokoskorostnykh kanalov RapidIO // Programmnye produkty i sistemy, № 4, 2015. - S. 93--98. 12. Bobkov S.G., Aryashev S.I., Zubkovskiy P.S. Arifmeticheskie soprotsessory mikroprotsessorov s arkhitekturoy KOMDIV // 6-oy Moskovskiy superkompyuternyy forum. Moskva, 2015. 13. MIPS Extension for Digital Media with 3D. — MIPS Technologies, Inc., 1997. — 29 pp. 14. Pavlov A. N. Obzor kommunikatsionnoy sredy RapidIO //Modelirovanie i vizualizatsiya. Mnogoprotsessornye sistemy. Instrumentalnye sredstva razrabotki PO / Sbornik statey pod redaktsiey akademika RAN V.B. Betelina. — M.: NIISI RAN, 2009. — c.105 –122. 15. Pavlov A.N. Formalnaya model RapidIO // Modelirovanie i vizualizatsiya. Mnogoprotsessornye sistemy. Instrumentalnye sredstva razrabotki PO /Sbornik statey pod redaktsiey akademika RAN V.B.Betelina. — M.: NIISI RAN, 2009. — c.123 –131. 16. Pavlov A. N. Programmnaya podderzhka RapidIO // Modelirovanie i vizualizatsiya. Mnogoprotsessornye sistemy. Instrumentalnye sredstva razrabotki PO /Sbornik statey pod redaktsiey akademika RAN V.B. Betelina. — M.: NIISI RAN, 2009. — c.132 –147. 17. GCC online documentation // URL:https://gcc.gnu.org/onlinedocs/ 18. Programmnoe izdelie Assembler dlya spetsializirovannogo soprotsessora CP2 v sostave mikroprotsessora KOMDIV128-RIO (ASSK128). Rukovodstvo programmista. YuKSU.90986-01 33 01. — Moskva: NIISI RAN, 2013. — 67 s. 19. Rayko G.O., Pavlovskiy Yu. A., Melkanovich V.S. Tekhnologiya programmirovaniya mnogoprotsessornoy obrabotki gidroakusticheskikh signalov na vychislitelnykh ustroystvakh semeystva «KOMDIV» // Gidroakustika. Vyp. 20 (2). — SPb.: OAO «Kontsern "Okeanpribor"», 2014. — 118 s. 20. Sudareva O.Yu. Effektivnaya realizatsiya algoritmov bystrogo preobrazovaniya Fure i svertki na mikroprotsessore KOMDIV128-RIO. — Moskva: NIISI RAN, 2014. — 266 s. 21. Daisuke Takahashi. An Implementation of Parallel 2-D FFT Using Intel AVX Instructions on Multi-core Processors // Algorithms and Architectures for Parallel Processing: 12th International Conference (ICA3PP 2012), September 4-7, 2012, Fukuoka, Japan. Proceedings, Part II, pp.197–205. 22. A. Monakov, A. Lokhmotov, A. Avetisyan. Automatically tuning sparse matrix-vector multiplication for GPU architectures // High Performance Embedded Architectures and Compilers, vol.5952, pp.111–125, 2010. 23. Balandin M.Yu., Shurina E.P. Metody resheniya SLAU bolshoy razmernosti. — Novosibirsk: Izd-vo NGTU, 2000. — 70 s.
|