Mọi hệ thống dữ liệu đều liên quan đến CSDL SQL

→ Biết SQL biết cánh cửa vào CSDL

Người làm backend → SQL bắt buộc

Khó khăn khi làm dữ liệu:

Trong doanh nghiệp, DE thường xuyên cãi nhau với DA

Data warehouse:

Để sử dụng các công cụ phân tích dữ liệu, phải tổng hợp dữ liệu về chung 1 kiểu

Data warehouse: tập hợp dữ liệu bao gồm 4 tính chất;

Trước khi tải dữ liệu lên data warehouse phải tái cấu trúc lại, lấy bảng nào, thông tin nào, cột nào

Dimensional Data Warehouse:

Bảng Fact: chứa những dữ liệu cơ bản muốn phân tích, chứa key của bảng dim

Bảng dim: thể hiện của bảng fact,

→ Bảng fact chứa những dữ liệu số, bảng dim bổ trợ cho bảng fact

So sánh DB và DW