Trong ngành DS, kiến thức về Xác suất Thống kê và Học Máy là những nền tảng cốt lõi để thực hiện tốt các phân tích chuyên sâu, đặc biệt là cho các dạng phân tích cao cấp như dự đoán/dự báo và đề xuất/đề nghị. Khóa học này giúp các học viên củng cố kiến thức nền cho ngành DS một cách vững chắc, đồng thời hiểu về AI cơ bản. Tuy nhiên, các phương pháp Thống kê và Học Máy không đơn giản và cần có thời gian để nắm bắt, luyện tập. Thông qua 1 buổi lý thuyết và 1 buổi thực hành hằng tuần, học viên sẽ được luyện tập cách đưa ra các dự đoán, khuyến nghị về quyết định hoặc kế hoạch (thậm chí chiến lược) dựa trên dữ liệu (data-driven) cho doanh nghiệp thông qua các bài thực hành về phân cụm, phân loại và phân tích dự đoán/đề xuất trong kinh doanh, bán lẻ, tài chính, chứng khoán... sử dụng các phương pháp Học Máy Thống Kê, bao gồm Top 05 giải thuật trong phân tích dữ liệu, theo Edureka: Decision Tree, Random Forest, Association Rule Mining, Linear Regression và K-Means Clustering. Sau khóa học này, học viên có khả năng phân loại các bài toán và đề xuất giải pháp cho các dự án DA/DS dựa trên các cơ sở vững chắc, chọn lựa các tiêu chí đánh giá phù hợp về tiềm năng, kết quả cần đạt, cũng như khả năng truyền tải các thông tin đó đến đồng nghiệp, cấp trên, khách hàng, đối tác,… một cách khoa học và dễ hiểu. Đồng thời, các kiến thức trong khóa học giúp tạo nền tảng vững chắc cho các học viên muốn đi sâu hơn vào AI và đặc biệt là Deep Learning.
Với các kiến thức, kinh nghiệm từ khóa học này, học viên từ chưa có kinh nghiệm đi làm có thể apply vào các vị trí junior Data Scientist phụ trách phân tích dữ liệu ở các công ty. Với các học viên đã đi làm và có kiến thức/kinh nghiệm chuyên ngành hoàn toàn có thể trở thành senior/leader phụ trách phân tích dữ liệu, thậm chí là chuyên gia cấp cao về phân tích dữ liệu trong chuyên ngành cụ thể (marketing, ngân hàng, chứng khoán, bảo hiểm, bán lẻ, logistics, kinh doanh - thương mại điện tử…).
Yêu cầu đầu vào: Lập trình Python (nắm vững Numpy và Pandas, trực quan hóa dữ liệu với Matplotlib, Pandas), toán THPT (nắm vững về hàm số và xác suất), tiếng Anh (đọc hiểu cơ bản). Với các học viên đã biết lập trình Python nhưng chưa nắm vững Pandas có thể học bổ sung vài buổi trước khóa học.