Chi tiết Khóa học

Mathematics and Statistics for Data Science

  • Khóa học cung cấp cho học viên (HV) các kiến thức cần thiết về toán dành cho Data Science như Đại số tuyến tính (Linear Algebra), Phương trình vector ma trận (Matrix-Vector Equations), Matrix Factorization, Eigenvalues và Eigenvectors, Singular Value Decomposition (SVD), Phân tích thành phần chính (Principal Component Analysis - PCA), Giải tính (Calculus), Gradient Descent
  • Khóa học cung cấp cho học viên (HV) các kiến thức cần thiết về xác suất thống kê dành cho Data Science như Thống kê mô tả (Descriptive Statistics), Xác suất (Probability), Thống kê suy luận (Inferential Statistics), Ước lượng (Estimation), Tương quan (Correlation)
  • Hướng dẫn HV cách vận dụng các thư viện toán, xác suất thống kê của Python để giải quyết các vấn đề về khoa học dữ liệu.
  • Là khóa học thứ ba của chương trình “Data Science and Machine Learning Certificate

 

Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:
  • Nắm được các kiến thức toán học và xác suất, thống kê cần thiết cho việc tính toán và phân tích dữ liệu
  • Sử dụng được các bộ thư viện, công cụ trong Python trong việc tính toán và thống kê
  • Vận dụng toán học phù hợp tùy theo yêu cầu của từng bài toán khác nhau
  • Thực hiện phân tích thống kê, đưa ra nhận xét trên những bộ dữ liệu thực tế
  • Thời lượng: 53 tiết (5 tuần), học trực tiếp trên máy
  • Học phí: 4.500.000 đ

Phần 1: Toán học (Mathematics)

  • Linear Algebra (Đại số tuyến tính)
    • Matrix Vectors & Space
    • Matrix - Vector operations (tính toán ma trận với vector)
    • Matrix transformations (biến đổi ma trận): Matrix Multiplication
    • T-matrix (ma trận chuyển vị)
    • Matrix - Matrix calculations (tính toán ma trận với ma trận)
  • Matrix Factorization
    • LU decomposition
    • QR decomposition
    • Cholesky decomposition
  • Eigenvalues & Eigenvectors
    • Scalar Multiplication
    • Scaling different axes (Tinh chỉnh dữ liệu trên các trục)
    • Toán trong Eigenvalues
  • Singular Value Decomposition (SVD)
    • SVD
    • Tái cấu trúc ma trận từ SVD
    • SVD cho Dimensionality Reduction
  • Principal Component Analysis (Phân tích thành phần chính - PCA)
    • Giới thiệu PCA
    • Tìm feature thừa
    • Linear Algebra trong PCA
    • Tìm hiểu Covarience
    • Chuẩn hóa dữ liệu
    • Tính toán varience, covariance
  • Calculus (Giải tính)
    • Multivariate calculus
    • Derivatives và gradients

Phần 2: Xác suất, thống kê (Probability Statistic)

  • Descriptive Statistics (thống kê mô tả)
    • Mean, Median, Mode
    • Standard Deviation
    • Variance
    • Co-variance
    • Range
    • Probability Density Function (PDF: hàm mật độ xác suất)
    • Outliers
    • Probability mass function (PMF: hàm khối xác suất)
    • Cumulative distribution function (CDF: hàm phân phối tích lũy)
  • Probability (Xác suất)
    • Quy tắc xác suất
    • Exponential distribution
    • Pareto distribution
    • Nomal Distribution - Gaussian Distribution
    • Binomial distribution
    • Uniform Distribution
    • Poisson Distribution
    • Bernoulli Distribution
    • Central Limit Theorem
    • Three Sigma Rule
  • Inferential Statistics (thống kê suy luận)
    • Standard error
    • Confidence interval (khoảng tin cậy T)
    • Confidence levels and Sigificance levels
    • Correlation
    • Hypothesis Testing (kiểm định giả thuyết)
      1. Cross-validation
      2. t-test, p-value, chi-squared test
      3. A/B Testing
      4. ANOVA

 

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Mathematics and Statistics for Data Science" do Trung Tâm Tin Học - Trường ĐH Khoa Học Tự Nhiên cấp.