Mọi hệ thống dữ liệu đều liên quan đến CSDL SQL
→ Biết SQL biết cánh cửa vào CSDL
Người làm backend → SQL bắt buộc
Khó khăn khi làm dữ liệu:
Trong doanh nghiệp, DE thường xuyên cãi nhau với DA
Để sử dụng các công cụ phân tích dữ liệu, phải tổng hợp dữ liệu về chung 1 kiểu
Data warehouse: tập hợp dữ liệu bao gồm 4 tính chất;
Trước khi tải dữ liệu lên data warehouse phải tái cấu trúc lại, lấy bảng nào, thông tin nào, cột nào
Bảng Fact: chứa những dữ liệu cơ bản muốn phân tích, chứa key của bảng dim
Bảng dim: thể hiện của bảng fact,
→ Bảng fact chứa những dữ liệu số, bảng dim bổ trợ cho bảng fact
So sánh DB và DW