๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๋?
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค(Data Warehouse, DW)๋ ์ฝ๊ฒ ๋งํด ํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ธฐ ์ข๊ฒ ๋ชจ์๋๋ ์ค์ ์ฐฝ๊ณ ์ด๋ค.
์ฌ๋ฌ ์์ค์์ ๋ค์ด์ค๋ ๋ฐ์ดํฐ๋ฅผ ํ ๊ณณ์ ๋ชจ์, ๋ถ์๊ณผ ์ฟผ๋ฆฌ์ ์ต์ ํ๋ ํํ๋ก ์ ๋ฆฌ, ์ค๋น, ๊ตฌ์ฑํด ์ ๊ณตํ๋ ์ค์ ์ ์ฅ์
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๊ฐ ์ค์ํ ์ด์ ๋ ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๊ฐ ๋ณดํต ํ์ฌ ๋ฐ์ดํฐ + ๊ณผ๊ฑฐ(์ด๋ ฅ) ๋ฐ์ดํฐ๋ฅผ ํจ๊ป ์ ์ฅํ๋ฉด์,
์กฐ์ง์ด ์ฐธ๊ณ ํ ์ ์๋ ๊ณต์ ๊ธฐ์ค์ ๊ฐ๊น์ด ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ๋ง๋ค์ด์ฃผ๊ธฐ ๋๋ฌธ์ด๋ค.
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๋ก ๋ค์ด์ค๋ ๋ฐ์ดํฐ (์์)
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค์๋ ๋ณดํต ์ด๋ฐ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์จ๋ค.
- ์ด์ ์์คํ / ์๋น์ค DB (ํ์, ์ฃผ๋ฌธ, ๊ฒฐ์ ๊ฐ์ ํธ๋์ญ์ )
- ์ฌ๋ด ์ ๋ฌด ์์คํ (CRM, ERP), ํํธ๋ ์์คํ
- IoT / ์ผ์ ๋ฐ์ดํฐ
- ์ธ๋ถ ๋ฐ์ดํฐ (๋ ์จ, ์์ ๋ฑ)
์์ค๊ฐ ๋ง์์ง์๋ก ๋ฐ์ดํฐ๋ ๊ธฐ์ค์ด ๋ฌ๋ผ์ง๊ณ ์์ด๊ธฐ ์ฌ์ด๋ฐ,
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๋ ์ด ๋ฐ์ดํฐ๋ฅผ ํ ๊ธฐ์ค์ผ๋ก ์ ๋ฆฌํด์ ํ ๊ณณ์์ ๋ณด๊ฒ ํด์ฃผ๋ ์ญํ ์ ํ๋ค.

๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค์๋ ๋ฐ์ดํฐ๊ฐ ์ด๋ป๊ฒ ๋ค์ด์ค๋๊ฐ? (ETL vs ELT)
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค์ ๋ฐ์ดํฐ๋ฅผ ๋ฃ๋ ๋ฐฉ์์ ๋ํ์ ์ผ๋ก ๋ ๊ฐ์ง๊ฐ ์๋ค.
- ETL : Extract(์ถ์ถ) → Transform(๋ณํ) → Load(์ ์ฌ)
- ๋ฐ๊พธ๊ณ ๋์ ์ ์ฅํ๋ค.
- ELT : Extract(์ถ์ถ) → Load(์ ์ฌ) → Transform(๋ณํ)
- ์ผ๋จ ์ ์ฅํ๊ณ ๋์ ๋ฐ๊พผ๋ค.
๋ ์ค ๋ฌด์์ด "์ ๋ต"์ด๋ผ๊ธฐ๋ณด๋ค๋, ํ์ฌ์ ๋๊ตฌ / ํ๊ฒฝ / ๋ฐ์ดํฐ ํํ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ค.
ํ์ง๋ง ๊ณตํต์ ์ ํ๋๋ค.
๋ถ์์ ์ฐ๋ ค๋ฉด, ๊ฒฐ๊ตญ ์ ๋ฆฌ(๋ณํ) ๊ณผ์ ์ด ๋ฐ๋์ ํ์ํ๋ค.
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ง์ ๋ชฉ์ ๊ณผ ํจ๊ณผ
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๋ ๊ฒฐ๊ตญ ์์ฌ๊ฒฐ์ ์ ๋ ์ํ๊ธฐ ์ํด ๋ง๋ ๋ค.
๋ํ ์ฌ์ฉ์ฒ๋ BI(๋์๋ณด๋), ๋ฆฌํฌํธ, ๋ฐ์ดํฐ ๋ถ์, ๊ท์ /๊ฐ์ฌ ๋์ ๋ฑ์ด๋ค.
๋์ ํจ๊ณผ๋ ๋ณดํต ์ด๋ฐ ์์ผ๋ก ๋ํ๋๋ค.
- ์์ฌ๊ฒฐ์ ์ด ์ข์์ง : ํฉ์ด์ง ๋ฐ์ดํฐ๋ฅผ ํ ๋ฒ์ ๋ณด๊ณ ํ๋จํ ์ ์๋ค.
- ๋ถ์์ด ๋นจ๋ผ์ง : ๋ถ์์ ๋ง๊ฒ ์ค๊ณ๋์ด ์ฟผ๋ฆฌ / ํ์์ด ๋นจ๋ผ์ง๋ค.
- ๋ฐ์ดํฐ ํ์ง์ด ์ข์์ง : ํ์คํ / ์ ํฉ์ฑ / ์ค๋ณต ์ ๊ฑฐ ๊ฐ์ ์ ๋ฆฌ ๊ณผ์ ์ ์ฒด๊ณํ
- ์ด๋ ฅ ๋ถ์์ด ๊ฐ๋ฅํด์ง : ๊ณผ๊ฑฐ ๋ฐ์ดํฐ๋ฅผ ์์ ์ถ์ธ / ํจํด ์์ธก์ ํ์ฉ
์ด๋ค ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋๊ฐ? (์ ํ / ๋น์ ํ + ํ๊ณ)
์ ํต์ ์ผ๋ก ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๋ ์ ํ(ํ
์ด๋ธ๋ก ์ ์ ๋ฆฌ๋๋ ๋ฐ์ดํฐ) ์ค์ฌ์ผ๋ก ๋ฐ์ ํ๋ค.
๊ทธ๋์ "์๋ฌด ์์ ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋ฅ ๋์ ธ ๋ฃ๋ ์ ์ฅ์"๋ผ๊ธฐ๋ณด๋ค๋, ๋ถ์ ๋ชฉ์ ์ ๋ง๊ฒ ์ ๋ฆฌ๋ ๋ฐ์ดํฐ๋ฅผ ๋ด๋ ๋ฐ ์ด์ ์ด ์๋ค.
๋ํ ๋ฐ์ดํฐ ๊ท๋ชจ๊ฐ ์ปค์ง๋ฉด:
- ๋น์ฉ / ์ด์ ๋ณต์ก๋ ์ฆ๊ฐ
- ์ค๊ณ๊ฐ ์ ์ข์ผ๋ฉด ์ง์ฐ, ์ฑ๋ฅ ๋ฌธ์ ๋ฐ์
์ต๊ทผ์๋ ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๋ ๋ฐ์ ํ / ๋น์ ํ ๋ฐ์ดํฐ๋ฅผ ๋ ์ ๋ค๋ฃจ๋ ค๋ ๋ฐฉํฅ์ผ๋ก ๋ฐ์ ํ๊ณ ,
์ค์ ๋ก๋ ๋ฐ์ดํฐ ๋ ์ดํฌ / ๋ ์ดํฌํ์ฐ์ค์ ํจ๊ป ์ฐ๋ ๊ตฌ์ฑ์ด ํํ๋ค.
ํท๊ฐ๋ฆฌ๋ ์ฉ์ด ์ ๋ฆฌ (DB vs DW vs Lake vs Mart)
1) ๋ฐ์ดํฐ๋ฒ ์ด์ค (DB) vs DW
- DB (์ด์ DB) : ์๋น์ค ์ด์์ฉ(DLTP), ์ค์๊ฐ ์ ๋ฐ์ดํธ / ํธ๋์ญ์ ์ฒ๋ฆฌ์ ๊ฐํ๋ค.
- DW : ๋ถ์์ฉ(OLAP / BI), ์ด๋ ฅ ํฌํจ + ์ฌ๋ฌ ์์ค ํตํฉ์ ๊ฐํ๋ค.
2) ๋ฐ์ดํฐ ๋ ์ดํฌ (Data Lake)
- DW : ๋ชฉ์ ์ ๋ง๊ฒ ์ ๋ฆฌ๋ ๋ถ์์ฉ ๋ฐ์ดํฐ
- Data Lake : ๊ฐ๊ณต์ด ๋ ๋ ์์ ๋ฐ์ดํฐ(์ํ)๋ฅผ ํญ๋๊ฒ ์ ์ฅ
ํ์ ์์๋ ๋์ด ๊ฒฝ์์ด๋ผ๊ธฐ๋ณด๋จ ๋ณด์ ๊ด๊ณ๋ก ๊ฐ์ด ์ฐ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.

3) ๋ฐ์ดํฐ ๋งํธ (Data Mart) vs DW
๋ฐ์ดํฐ ๋งํธ๋ DW ์์์ ํน์ ๋ถ์ / ๋๋ฉ์ธ ๋ชฉ์ ์ ๋ง๊ฒ ๋ "์ฐ๊ธฐ ์ฝ๊ฒ" ๋ง๋ ์์ญ์ผ๋ก ๋ณด๋ฉด ๋๋ค.
- ๋ฐ์ดํฐ ๋งํธ
- ์์ / ๋ง์ผํ / ์ฌ๋ฌด์ฒ๋ผ ๋๋ฉ์ธ๋ณ๋ก ๊ตฌ์ฑ
- ํน์ ์ฌ์ฉ์ / ํ์ด ๋น ๋ฅด๊ฒ ์ฐ๋๋ก ๋ฐ์ดํฐ ์ ๊ทผ์ ๋จ์ํ
- DW ์์ ์ฌ๋ฌ ๊ฐ(n๊ฐ)๊ฐ ์์ ์ ์๊ณ , n์ ์กฐ์ง ๊ตฌ์กฐ / ์๊ตฌ์ฌํญ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ค.
- DW
- ์กฐ์ง ์ ์ฒด๊ฐ ๋ณด๋ ์ค์ ๋ถ์ ์ ์ฅ์
๊ณต๋ถํ ๋๋ "DW = ์ค์ ์ ์ฅ์, DM = ๋๋ฉ์ธ๋ณ"๋ง ํ์คํ ์ก์๋ ์ถฉ๋ถํ ์ดํด๋๋ค.

๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค ์ํคํ ์ฒ
๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค ๊ตฌ์กฐ๋ ๋ณดํต 3๋จ์ผ๋ก ์ค๋ช ํ๋ฉด ์ฝ๋ค.
- ์ ์ฅ / ์ ์ฌ ๊ณ์ธต (ํ์) : ์ฌ๋ฌ ์์ค์์ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ ์ ์ฅ (ELT / ELT ํฌํจ)
- ๋ถ์ / ์์ง ๊ณ์ธต (์ค๊ฐ) : ๋ณต์กํ ๋ถ์ / ๋ค์ฐจ์ ์ฟผ๋ฆฌ (OLAP ๋ฑ)์ ์ฒ๋ฆฌ
- ๋ถ์ / ์๋น ๊ณ์ธต (์์) : BI (๋์๋ณด๋), ๋ฆฌํฌํธ, ์์ ๋ถ์์ ์ํํ๋ ํ๋ฉด / ๋๊ตฌ
์ฆ, DW๋ "์ ์ฅ๋ง ํ๋ ๊ณณ"์ด ์๋๋ผ, ๋ถ์๊น์ง ์ด์ด์ง๋ ํ๋ฆ์ ์ค์ฌ์ ๊ฐ๊น๋ค.

๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค์ ์ฃผ์ ๊ตฌ์ฑ ์์ (๋ํ 4๊ฐ์ง)
- ์ค์ ์ ์ฅ์ (DB . ์คํ ๋ฆฌ์ง)
- ๋ฐ์ดํฐ ํตํฉ / ํ์ดํ๋ผ์ธ (ETL, ELT)
- ๋ฉํ๋ฐ์ดํฐ (์ ์ / ์ถ์ฒ / ๊ตฌ์กฐ / ์ค๋ช ๊ฐ์ "๋ฐ์ดํฐ ์ค๋ช ์")
- ์ก์ธ์ค ๋๊ตฌ (BI / ์ฟผ๋ฆฌ / ๋ฆฌํฌํ / ๋ถ์ ํด)

๋ฐฐํฌ ๋ชจ๋ธ : ์จํ๋ ๋ฏธ์ค → ํด๋ผ์ฐ๋ / ํ์ด๋ธ๋ฆฌ๋
๊ณผ๊ฑฐ์๋ ์จํ๋ ๋ฏธ์ค๊ฐ ๋ง์์ง๋ง, ์์ฆ์ ํด๋ผ์ฐ๋ / ํ์ด๋ธ๋ฆฌ๋๊ฐ ํํ๋ค.
์ ํ ๊ธฐ์ค์ ๋ณดํต ๋ณด์ / ๊ท์ , ๋น์ฉ, ํ์ฅ์ฑ, ์ด์ ํธ์์ฑ ๊ฐ์ ์์์ ๋ฌ๋ ค ์๋ค.
๊ฒฐ๋ก : ํ ์ค ์์ฝ
- ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค : ์ ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ชจ์ ๋ถ์ ๊ฐ๋ฅํ ํํ๋ก ์ ๋ฆฌํด ์ ๊ณตํ๋ ์ค์ ์ ์ฅ์
- ๋ฐ์ดํฐ ๋งํธ : ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค ์์์ ๋๋ฉ์ธ ๋ชฉ์ ์ ๋ง๊ฒ ๊ตฌ์ฑํ ์ฃผ์ ๋ณ ๋ฐ์ดํฐ ์์ญ (์ฌ๋ฌ ๊ฐ์ผ ์ ์์)
References
https://www.sap.com/korea/products/data-cloud/datasphere/what-is-a-data-warehouse.html
https://www.ibm.com/kr-ko/think/topics/data-warehouse