1. SQL - TRUY VẤN DỮ LIỆU TRONG CSDL (DATABASE)
(1) Cơ bản:
Cấu trúc cơ bản của SQL:
- Các câu lệnh SELECT, INSERT, UPDATE, DELETE, FROM, WHERE, UPDATE / INSERT / DROP / TRUNCATE / CREATE / ALTER,...)
- Các toán tử so sánh, toán tử logic
- Các hàm aggregate (SUM, AVG, COUNT,…)
Kiểu dữ liệu:
- Hiểu rõ các kiểu dữ liệu cơ bản (INT, VARCHAR, DATE,…)
- Cách sử dụng các kiểu dữ liệu trong truy vấn
Cơ sở dữ liệu:
- Hiểu khái niệm về bảng, cột, khóa chính
- Các mối quan hệ giữa các bảng (1:1, 1:n, n:n)
(2) Nâng cao:
Nâng cao với SQL:
- Hiểu biết về các biểu thức điều kiện phức tạp và sử dụng các toán tử logic (AND, OR, NOT).
- Sử dụng các hàm chuỗi (STRING FUNCTIONS) và hàm ngày tháng (DATE FUNCTIONS) để xử lý dữ liệu chuỗi và ngày tháng.
- Hiểu biết về việc tạo, sửa đổi và xóa dữ liệu từ bảng sử dụng các câu lệnh INSERT, UPDATE và DELETE.
Tối ưu hóa câu lệnh SQL:
- Nắm vững cách tối ưu hóa hiệu suất câu lệnh SQL bằng cách sử dụng các chỉ mục (index) và viết câu lệnh một cách tối ưu.
- Hiểu biết về cách sử dụng kế hoạch thực hiện câu lệnh (query execution plan) để đánh giá và tối ưu hóa hiệu suất câu lệnh.
Quản lý Dữ liệu:
- Hiểu biết về các câu lệnh DDL (Data Definition Language) như CREATE TABLE, ALTER TABLE, DROP TABLE để quản lý cấu trúc của cơ sở dữ liệu.
- Sử dụng các câu lệnh DML (Data Manipulation Language) như INSERT, UPDATE, DELETE để quản lý dữ liệu trong bảng.
Bảo mật Dữ liệu:
- Hiểu biết về các biện pháp bảo mật cơ bản như phân quyền (GRANT, REVOKE) để kiểm soát quyền truy cập vào dữ liệu.
- Nắm vững về việc sử dụng các biện pháp bảo mật như mã hóa (encryption) và kiểm tra toàn vẹn (integrity constraints) để bảo vệ dữ liệu."
2. POWER BI - XÂY DỰNG BÁO CÁO DỮ LIỆU VỚI POWER BI
(1) Cơ bản:
Kết nối và xử lý dữ liệu:
- Cách Import dữ liệu và sử dụng Power BI để vẽ các biểu đồ như Column, Pie, Donut cũng như các table, card để trực quan hoá dữ liệu.
- Cách kết nối Power Bi với các nguồn dữ liệu khác nhau (Excel, SQL Server,...).
- Cách sử dụng Power Queries để tiền xử lý dữ liệu trước khi phân tích.
Tạo báo cáo:
- Xây dựng Data Modeling với các dữ liệu phức tạp, nhiều bảng dựa trên các chuẩn 1NF, 2NF, 3NF.
- Sử dụng các loại biểu đồ và đồ thị khác nhau để trực quan hóa dữ liệu
- Tạo các filter và slicer để tương tác với báo cáo.
(2) Nâng cao
Ngôn ngữ công thức DAX
- Sử dụng các biểu thức Measure, Calculated Column để tạo các phép tính, các biến, tham số và giải quyết các bài toán yêu cầu tính toán trên dữ liệu của nhiều bảng.
- Xây dựng các báo cáo tự động theo thời gian và các tính năng trong PBI Services.
Ngôn ngữ chức năng M (Power Queries)
- Học ngôn ngữ M để truy vấn và chuyển đổi dữ liệu nâng cao.
- Sử dụng M để tạo các custom columns và tables.
Tối ưu hoá và tinh chỉnh
- Khả năng tối ưu hóa hiệu suất của báo cáo và truy vấn dữ liệu trong Power BI.
- Hiểu biết về cách tinh chỉnh cấu trúc dữ liệu để tối ưu hóa hiệu suất và thời gian phản hồi."
3. PYTHON - XỬ LÝ DỮ LIỆU VỚI NGÔN NGỮ LẬP TRÌNH PYTHON
(1) Cơ bản
Thông tin chung:
- Cú pháp cơ bản của Python: biến, kiểu dữ liệu, cấu trúc điều khiển (if, for, while), hàm.
- Hiểu biết về các thư viện cơ bản của Python như NumPy, Pandas, Matplotlib, và Seaborn.
Thống kê với Python:
- Hiểu biết về các khái niệm cơ bản trong thống kê như mean, median, mode, variance, standard deviation.
- Sử dụng Python để tính toán các thống kê mô tả và thực hiện kiểm định giả thuyết cơ bản.
(2) Nâng cao
NumPy (Numerical Python):
- Hiểu biết về NumPy arrays và cách sử dụng chúng để thực hiện các phép toán số học và thống kê.
- Sử dụng NumPy để thực hiện các phép toán ma trận và xử lý dữ liệu đa chiều.
Pandas
- Hiểu biết về DataFrame trong Pandas và cách sử dụng chúng để thực hiện các phân tích dữ liệu.
- Sử dụng Pandas để đọc và ghi dữ liệu từ và vào các nguồn dữ liệu khác nhau như CSV, Excel, SQL databases.
- Thực hiện các thao tác xử lý dữ liệu như lọc, sắp xếp, gom nhóm, và biến đổi dữ liệu.
Visualizations với Matplotlib và Seaborn:
- Hiểu biết về cách sử dụng Matplotlib và Seaborn để tạo các biểu đồ và đồ thị trực quan.
- Sử dụng các chức năng của Matplotlib và Seaborn để tinh chỉnh và làm đẹp biểu đồ.
Machine Learning (tùy chọn):
- Nắm vững về các thư viện machine learning như Scikit-learn và TensorFlow.
- Hiểu biết về các thuật toán machine learning cơ bản như hồi quy tuyến tính, phân loại, gom cụm.
- Sử dụng Python để xây dựng và đánh giá các mô hình machine learning trên dữ liệu thực tế.
SQL (tùy chọn):
- Hiểu biết về cách sử dụng Python kết hợp với SQL để trích xuất và xử lý dữ liệu từ cơ sở dữ liệu.
- Sử dụng thư viện như SQLAlchemy để tương tác với cơ sở dữ liệu từ Python.