Using PostgreSQL as a Data Warehouse (narrator.ai)
데이터분석을 통한 의사결정 지원시스템 Narrative가 경험을 통해 정리한 주요 트윅들 - 프로덕션 시스템과 같은 서버 사용하지 말 것 - PG 12+로 업그레이드(CTE 사용하지 말 것) - 인덱스는 가능한 작게 - 테이블 파티셔닝(range/list) - 디스크 I/O 최소화 - 벌크 인서트 후 Vacuum - 병렬 쿼리 사용하기 - 통계 샘플링을 증가시키기 (컬럼별 또는 DB 전체. 기본값 100 이지만 500) - 더 적은 컬럼 사용하기 (row 기반 저장이기 때문)
* 5천만~1억로우 테이블에서는 Postgres가 훌륭하게 동작 * 10억단위로 스케일하게 될때는 Citus 를 추천 ㅤ→ https://www.citusdata.com : Postgres를 분산 DB로 바꿔주는 오픈소스 Text-to-speech function is limited to 200 characters |