Tech News

제목PostgreSQL을 데이터 웨어하우스로 사용하기2021-05-12 23:35
작성자 Level 10

Using PostgreSQL as a Data Warehouse (narrator.ai) 


데이터분석을 통한 의사결정 지원시스템 Narrative가 경험을 통해 정리한 주요 트윅들

- 프로덕션 시스템과 같은 서버 사용하지 말 것

- PG 12+로 업그레이드(CTE 사용하지 말 것)

- 인덱스는 가능한 작게

- 테이블 파티셔닝(range/list)

- 디스크 I/O 최소화

- 벌크 인서트 후 Vacuum

- 병렬 쿼리 사용하기

- 통계 샘플링을 증가시키기 (컬럼별 또는 DB 전체. 기본값 100 이지만 500)

- 더 적은 컬럼 사용하기 (row 기반 저장이기 때문)


* 5천만~1억로우 테이블에서는 Postgres가 훌륭하게 동작

* 10억단위로 스케일하게 될때는 Citus 를 추천

ㅤ→ https://www.citusdata.com : Postgres를 분산 DB로 바꿔주는 오픈소스

G
M
T
Text-to-speech function is limited to 200 characters
댓글
자동등록방지
(자동등록방지 숫자를 입력해 주세요)