ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ
ОБРАБОТКА ИНФОРМАЦИИ И АНАЛИЗ ДАННЫХ
ПРИКЛАДНЫЕ АСПЕКТЫ ИНФОРМАТИКИ
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
ПРОГРАММНАЯ ИНЖЕНЕРИЯ
А. В. Соловьев "Организация хранения данных в распределенных СУБД со строгой согласованностью данных"
А. В. Соловьев "Организация хранения данных в распределенных СУБД со строгой согласованностью данных"
Аннотация. 

В статье излагаются принципы организации хранения данных, предназначенные для поддержания строгой согласованности между репликами данных в распределенных СУБД. Рассмотрены типичные представители недавно появившегося класса NewSQL СУБД, сделан вывод о том, какие структуры данных и почему используются в них. Выделены основные проблемы организации данных. Сделан вывод о перспективности распределенных СУБД со строгой согласованностью. Выделено направление использования хранилищ типа «ключ-значение», как универсальный механизм для хранения распределенных данных. Сделаны предположения о том, почему такие хранилища нужно использовать, и какие механизмы, например, хэширование, могут помочь в организации распределенного хранения на большом (до сотен тысяч) узлов распределенного хранилища данных СУБД.

Ключевые слова: 

организация хранения данных, строгая согласованность, распределенные СУБД, NewSQL, хранилища «ключ-значение», хэширование.

DOI 10.14357/20718632250210

EDN BFSUXU

Стр. 113-122.

Литература

1. The Digital Twin. Noel Crespi, Adam T. Drobot, Roberto Minerva (eds). 2023. 1238 p. ISBN: 978-3-031-21345-8. DOI: https://doi.org/10.1007/978-3-031-21343-4.
2. Zhang Yan. Digital Twin. Architectures, Networks, and Applications. 2024. 126 p. ISBN: 978-3-031-51818-8. DOI: https://doi.org/10.1007/978-3-031-51819-5.
3. Shu, J. Distributed Storage Systems. In: Data Storage Architectures and Technologies, 2024, pp. 185-224. https://doi.org/10.1007/978-981-97-3534-1_8.
4. Bitcoin Energy Consumption Index // DIGICONOMIST. URL: https://digiconomist.net/bitcoin-energy-consumption/ (Дата обращения: 12.03.2024).
5. Zhu, G., He, D., An, H. et al. The governance technology for blockchain systems: a survey. In: Front. Comput. Sci. 2024, 18, 182813. https://doi.org/10.1007/s11704-023-3113-x.
6. Shiriaev, E. Load Balancing Methods for Distributed Data Storage: Challenges and Opportunities. In: Alikhanov, A., Tchernykh, A., Babenko, M., Samoylenko, I. (eds) Current Problems of Applied Mathematics and Computer Systems. CPAMCS 2023. Lecture Notes in Networks and Systems, 2024, vol 1044. https://doi.org/10.1007/978-3-031-64010-0_10.
7. Xia, J., Huang, Q., Gui, Z., Tu, W. (2024). Relational Databases. In: Open GIS. Springer, Cham. doi: 10.1007/978-3-031-41748-1_5.
8. Data Distribution with MariaDB Xpand : mariadb.com. URL: https://mariadb.com/docs/xpand/architecture/components/xpand/data-distribution/ (дата обращения 14.03.2025).
9. Lengstorf, J., Blom Hansen, T., Prettyman, S. Databases, MVC, and Data Objects. In: PHP 8 for Absolute Beginners. Apress, Berkeley, CA. 2022. doi: 10.1007/978-1-4842-8205-2_6.
10. Hu, C., Li, R., Li, C., Miao, H., Yang, Z., Zhang, T. Big Data Analysis for Anti-Money Laundering: A Case of Open Source Greenplum Application. In: Zhao, X., Yang, S., Wang, X., Li, J. (eds) Web Information Systems and Applications. WISA 2022. Lecture Notes in Computer Science, 2022, vol 13579. Springer, Cham. https://doi.org/10.1007/978-3-031-20309-1_56.
11. Павленко А. Greenplum: аналитическая БД для Big Data-проектов: OTUS. URL: https://otus.ru/nest/post/2830/. Дата публикации: 05.08.2022.
12. Song, H., Zhou, W., Cui, H. et al. A survey on hybrid transactional and analytical processing. The VLDB Journal 33, 1485–1515 (2024). https://doi.org/10.1007/s00778-024-00858-9.
13. Ensuring Data Consistency and Transaction Management in Trino: freshers.in. URL: https://www.freshers.in/article/trino/ensuring-data-consistency-and-transaction-management-in-trino/. Дата публикации: 03.03.2024. 
14. Cardas, C., Aldana-Martín, J.F., Burgueño-Romero, A.M. et al. On the performance of SQL scalable systems on Kubernetes: a comparative study. In: Cluster Comput. 2023, 26, 1935–1947. https://doi.org/10.1007/s10586-022-03718-9.
15. Data Partitioning in Trino: Best Practices: freshers.in. URL: https://www.freshers.in/article/trino/data-partitioning-intrino-best-practices/. Дата публикации: 03.02.2024.
16. Vlad Mihalcea (2023). YugabyteDB Architecture. URL: https://vladmihalcea.com/yugabytedb-architecture/. Дата публикации: 24.03.2023.
17. Bhanawat Hemant, Agarwal Sonal. TPC-C Benchmark: Scaling YugabyteDB to 100,000 Warehouses: YugabyteDB. URL: https://www.yugabyte.com/blog/tpc-c-benchmark-100000-warehouses-yugabytedb/. Дата публикации: 11.02.2022.
18. YugabyteDB Powers the Global Cache of a Top Five US Bank’s Business-Critical Payment App: YugabyteDB. URL: https://www.yugabyte.com/success-stories/bankbill-pay-app/ (дата обращения 14.03.2025)
19. Soto Christiane. US-Based Bank Scales Data Platform for Billions of Real-Time Customer Interactions: YugabyteDB. URL: https://www.yugabyte.com/blog/bank-scalesdata-platform/. Дата публикации: 24.10.2023.
20. Обзор YDB: YDB. URL: https://ydb.tech/docs/ru/concepts/ (дата обращения 17.03.2025).
21. Модель данных и схема: YDB. URL: https://ydb.tech/docs/ru/concepts/datamodel/ (дата обращения 17.03.2025).
22. Дисковая подсистема кластера aka YDB BlobStorage : YDB. URL: https://ydb.tech/docs/ru/concepts/cluster/distributed_storage (дата обращения 17.03.2025).
23. YDB знакомится с TPC-C: раскрываем производительность наших распределенных транзакций: habr. URL: https://habr.com/ru/companies/ydb/articles/763938/. Дата публикации: 27.09.2023.

2025 / 02
2025 / 01
2024 / 04
2024 / 03

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".