WYDAJNE PRZETWARZANIE DANYCH W TABELI Z MILIARDAMI REKORDÓW

Piotr Bednarczuk

piotr.bednarczuk@wsei.lublin.pl
University of Economics and Innovation in Lublin, Institute of Computer Science (Polska)
http://orcid.org/0000-0003-1933-7183

Adam Borsuk


University of Economics and Innovation in Lublin, Institute of Computer Science (Polska)
http://orcid.org/0000-0003-2316-1694

Abstrakt

Z biegiem czasu systemy podłączone do baz danych zwalniają. Wynika to zwykle ze wzrostu ilości danych przechowywanych w poszczególnych tabelach, liczonych nawet w miliardach rekordów. Niemniej jednak istnieją metody uniezależnienia szybkości systemu od liczby rekordów w bazie danych. Jednym z tych sposobów jest partycjonowanie tabel. Przy prawidłowym zastosowaniu rozwiązanie to może zapewnić wydajne przetwarzanie danych w bardzo dużych bazach danych nawet po kilku latach działania. Jednak nie wszystko jest tak przewidywalne ponieważ niektóre niepożądane zjawiska ujawniają się dopiero przy bardzo dużej ilości danych. W artykule przedstawiono badanie czasu wykonania tych samych zapytań przy rosnącej liczbie rekordów w tabeli. Badania te ujawniają i przedstawiają moment i okoliczności występowania anomalii dla pewnej liczby rekordów.


Słowa kluczowe:

starzenie się systemów, partycjonowanie, efektywne przetwarzanie danych, miliardy rekordów

Bednarczuk P.: Optimization in very large databases by partitioning tables, Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska 10(3), 2020, 95–98.
DOI: https://doi.org/10.35784/iapgos.2056   Google Scholar

Bandle M., Giceva J., Neumann T.: To Partition, or Not to Partition, That is the Join Question in a Real System. International Conference on Management of Data, 2021.
DOI: https://doi.org/10.1145/3448016.3452831   Google Scholar

Kumar A., Jitendra Singh Y.: A Review on Partitioning Techniques in Database. International Journal of Computer Science and Mobile Computing 13(5), 2014, 342–347.
  Google Scholar

Microsoft documentation, Data partitioning guidance, https://learn.microsoft.com/en-us/azure/architecture/best-practices/data-partitioning
  Google Scholar

Qi W., Song J., Yu-bin B.: Near-uniform Range Partition Approach for Increased Partitioning in Large Database. 2nd IEEE International Conference on Information Management and Engineering, 2010, 101–106.
DOI: https://doi.org/10.1109/ICIME.2010.5477529   Google Scholar

Song J., Bao Y.: NPA: Increased Partitioning Approach for Massive Data in Real-time Data Warehouse. 2nd International Conference on Information Technology Convergence and Services, 2010, 1–6.
DOI: https://doi.org/10.1109/ITCS.2010.5581277   Google Scholar

Tanvi J., Shivani S.: Refreshing Datawarehouse in Near Real-Time. International Journal of Computer Applications 46(18), 2012, 24–29.
  Google Scholar

Zheng K. et al.: Data storage optimization strategy in distributed column-oriented database by considering spatial adjacency. Cluster Computing 20, 2017.
DOI: https://doi.org/10.1007/s10586-017-1081-3   Google Scholar


Opublikowane
2022-12-30

Cited By / Share

Bednarczuk, P., & Borsuk, A. (2022). WYDAJNE PRZETWARZANIE DANYCH W TABELI Z MILIARDAMI REKORDÓW. Informatyka, Automatyka, Pomiary W Gospodarce I Ochronie Środowiska, 12(4), 17–20. https://doi.org/10.35784/iapgos.3058

Autorzy

Piotr Bednarczuk 
piotr.bednarczuk@wsei.lublin.pl
University of Economics and Innovation in Lublin, Institute of Computer Science Polska
http://orcid.org/0000-0003-1933-7183

Autorzy

Adam Borsuk 

University of Economics and Innovation in Lublin, Institute of Computer Science Polska
http://orcid.org/0000-0003-2316-1694

Statystyki

Abstract views: 1720
PDF downloads: 127