Chi tiết Khóa học

Data Manipulation and Visualization with Python

Làm sao để có thể phát hiện nhiều “viên ngọc" thông tin giá trị trong chính kho dữ liệu doanh nghiệp của bạn, hay từ nhiều nguồn dữ liệu hữu ích miễn phí khắp nơi trên Internet? 

Khóa học “Data Manipulation and Visualization with Python – Thao tác và Trực quan hóa dữ liệu với Python” sẽ giúp bạn:
  • Ứng dụng thành tạo Python để thực hiện các thao tác xử lý dữ liệu một các bài bản, nhanh chóng và hiệu quả.
  • Sử dụng thành thạo các thư viện trực quan hóa dữ liệu của Python để “hô biến” các dữ liệu thành các báo cáo trực quan sinh động, giúp hỗ trợ việc ra quyết định hay định hướng giải quyết bài toán một cách hiệu quả hơn.
  • Nâng cao kỹ năng xử lý, phân tích và trực quan hóa dữ liệu với nhiều bài tập tình huống ứng dụng xử lý phân tích dữ liệu trong nhiều lĩnh vực khác nhau.

 

Tham gia khóa học "Data Manipulation and Visualization with Python – Thao tác và Trực quan hóa dữ liệu với Python" ngay hôm nay để sở hữu kỹ năng xử lý, phân tích và trực quan hóa dữ liệu - kỹ năng quan trọng trong hành trình trở thành Chuyên viên Data Science – Machine Learning trong tương lai.

 

  • Tất cả những ai có định hướng sẽ làm việc trong lĩnh vực Machine Learning, Data Science
  • Sinh viên các trường Đại học, Cao đẳng

Đặc biệt phù hợp với Người đi làm, mong muốn tìm hiểu sâu về lĩnh vực Data Science - Machine Learning, tùy biến theo nhu cầu và ứng dụng cho nhiều lĩnh vực khác nhau.

Yêu cầu đầu vào : HV đã tham gia khóa Fundamentals of Python - Lập trình Python Cơ bản hoặc có kiến thức tương đương 

  • Nắm được quy trình làm việc cơ bản của Data Science
  • Vận dụng linh hoạt các bộ thư viện, công cụ như Jupyter Notebooks, Numpy, Pandas, Matplotlib, Seaborn, Folium… trong việc giải quyết các bài toán thực tế
  • Hiểu và vận dụng cách tìm dữ liệu, xây dựng câu hỏi nghiên cứu, sử dụng các công cụ và kỹ thuật tìm ra câu trả lời
  • Thực hiện phân tích thống kê cơ bản 
  • Vận dụng công cụ trực quan hóa dữ liệu để phân tích, hiểu rõ hơn về dữ liệu và đưa ra quyết định hiệu quả hơn.
  • Data Visualization

  • Data Manipulation

  • Jupyter Notebooks

  • Numpy

  • Pandas

  • Matplotlib

  • Seaborn

  • Folium

  • Plotly      

Tổng quan Data Science

  • Giới thiệu Data Science
  • Quy trình của Data Science
  • Giá trị của việc tìm hiểu Data Science
  • Lý do chọn ngôn ngữ lập trình Python

Jupyter Notebook

  • Giới thiệu, lý do sử dụng Jupyter Notebook
  • Cài đặt và cấu hình
  • Sử dụng Jupyter Notebook
  • Markdown Text: cách sử dụng, cú pháp

Numpy

  • Giới thiệu, lý do sử dụng Numpy
  • Ndarray: mảng một chiều, hai chiều, tạo mảng, index, data type, operation
  • Thao tác trên Ndarray: Statictical, sorting, set operation, broadcasting

Pandas

  • Giới thiệu, lý do sử dụng Pandas
  • Series
  • Dataframe
  • Thao tác trên Pandas
    • Đọc ghi dữ liệu
    • Làm sạch, tinh chỉnh dữ liệu
    • Trực quan hóa dữ liệu
    • Thống kê dữ liệu
    • Thao tác trên dữ liệu

Data Visualization

  • Vai trò của trực quan hóa dữ liệu (Data Visualization)
  • Giới thiệu các công cụ trực quan hóa dữ liệu như Matplotlib, Seaborn, Plotly 
  • Trực quan hóa dữ liệu với Python
    • Histogram, Density plot 
    • Box plot, Violin plot
    • Scatter plot, Regression plot, Residual plot
    • Swarm plot, Strip plot
    • Bar plot, Stacked bar plot
    • Line plot
    • Treemap
    • Heatmap
  • Phân tích trực quan đa biến với lưới
  • Word Cloud

Trực quan hóa không gian địa lý 

  • Giới thiệu Folium
  • Plotly
  • Map và Marker
  • Choropleth
  • Tạo map và trực quan hóa không gian địa lý

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Python for Machine Learning, Data Science & Data Visualization" do Trung Tâm Tin Học - Trường ĐH Khoa Học Tự Nhiên cấp.