Chào anh em,
Theo mục tiêu của series bài chinh phục python, automation hôm trước, hôm nay chúng ta bắt đầu với chặng 1: nền tảng python. Với lộ trình được tư vấn bởi AI, tớ sẽ cần phải điểm qua và hoàn thành các items như sau:
Giai đoạn 1: Nền tảng Python và Data Manipulation
- Mục tiêu: Làm quen với Python, xử lý dữ liệu cơ bản.
- Kỹ năng cần học:
- Python cơ bản: Syntax, OOP, exception handling.
- Pandas:
- Đọc/ghi file (CSV, Excel, JSON).
- Xử lý dữ liệu: merge, filter, groupby.
- Làm sạch dữ liệu (data cleaning).
- Numpy: Xử lý dữ liệu dạng mảng, tính toán số học.
- Tools/Libs:
- Jupyter Notebook (làm việc với data trực quan).
- Matplotlib/Seaborn (vẽ biểu đồ cơ bản).
💡 Thời gian: 2-4 tuần (với 2-3 tiếng/ngày).
Vì đã có kinh nghiệm nhất định, tuy chỉ mới vỡ lòng với python và pandas, nên tớ sẽ không mất thời gian đi "học" lại hay vọc lại mí bạn như syntax, hay OOP, vân vân mây mây nhé. Anh em có thể tra cứu tài liệu hoặc khóa học online tương ứng để nhanh chóng đạt mục tiêu hen. Tuy nhiên python có thể khác nhiều so với java, nên để tránh chủ quan, tớ sẽ làm review, làm các bài tests trước khi đi qua chặng mới. Đôi khi việc quá nôn nóng hoàn thành mục tiêu, hoặc đi quá nhanh có thể khiến chúng ta dễ dàng bỏ sót, bị hổng kiến thức, giống như hổng kiến thức Vật Lý lớp 7 mà vẫn cố thoi thóp để leo cho lên Vật Lý lớp 12 vậy, nên ở đây tớ chọn phương án chậm mà chắc nhé.
Phần review, tớ sẽ lập bảng checklist, làm tất cả các bài test liên quan tới các từ khóa thuộc hạng mục chặng 1 ở trên. Phần này tớ sẽ nhờ trợ lý AI hỗ trợ để có 1 bảng bài test nhanh chóng hiệu quả. Sau đó dựa trên kết quả test, và cải thiện tớ sẽ cập nhật cho anh em trong bài tiếp theo thuộc cùng series. Nếu các hạng mục trong bài test mà chưa đạt yêu cầu, dĩ nhiên tớ buộc phải dành nhiều thời gian hơn ở chặng 1 này.
Bảng TEST Python
Theo tư vấn ban đầu của AI, nếu đi làm hết tất cả các bài test online thì sẽ rất nhiều, và rất mất thời gian.
- Ví dụ: chỉ riêng https://www.hackerrank.com/domains/python đã có hơn 100 bài tests với độ khó và và hạng mục (sub-domains) khác nhau rồi. Nên tớ sẽ không cố làm hết tất cả các bài tests theo cách này nhé.
- Quá nhiều!!!!!! Và không bám sát mục tiêu đề ra.
.
Tiêu chí bài tests vì thế sẽ được thu hẹp gồm bài kiểm tra phức hợp với độ khó từ trung bình trở lên, tập trung vào các từ khóa và kỹ năng như mô tả trong Giai đoạn 1: "Nền tảng Python và Xử lý Dữ liệu". Như vậy sẽ nhanh chóng kiểm tra trình độ, và tiết kiệm thời gian hơn cho anh em rồi nhé. Dưới đây là bảng tổng hợp:
No. | Từ khóa | Liên kết bài kiểm tra | Độ khó | Độ phổ biến | Ghi chú |
---|---|---|---|---|---|
1 | Python OOP | Classes: Dealing with Complex Numbers Classes: Find the Torsional Angle |
Trung bình | 85% | Các bài tập này giúp bạn rèn luyện kỹ năng lập trình hướng đối tượng trong Python. |
2 | Exception Handling | Exceptions Incorrect Regex |
Trung bình | 80% | Luyện tập xử lý ngoại lệ trong Python, giúp chương trình của bạn trở nên robust hơn. |
3 | Pandas CSV/Excel | Pandas Exercises 101 Pandas Exercises for Data Analysis |
Trung bình | 75% | Các bài tập này giúp bạn làm quen với việc đọc/ghi và xử lý dữ liệu bằng Pandas. |
4 | Jupyter Notebook | Data Analysis with Python: Zero to Pandas Introduction to Jupyter |
Trung bình | 70% | Hướng dẫn sử dụng Jupyter Notebook cho phân tích dữ liệu, giúp bạn làm việc với dữ liệu một cách trực quan. |
5 | Python Syntax | Python If-Else Arithmetic Operators |
Trung bình | 90% | Củng cố kiến thức về cú pháp Python thông qua các bài tập điều kiện và toán tử. |
6 | Data Cleaning | Data Cleaning Challenge Handling Missing Data in Python |
Trung bình | 65% | Thực hành làm sạch dữ liệu, một kỹ năng quan trọng trong phân tích dữ liệu. |
7 | NumPy Array Ops | Arrays Shape and Reshape |
Trung bình | 85% | Luyện tập thao tác với mảng NumPy, cơ sở cho các tính toán số học trong Python. |
8 | Data Visualization | Matplotlib Tutorial Seaborn Tutorial |
Trung bình | 70% | Học cách vẽ biểu đồ cơ bản với Matplotlib và Seaborn để trực quan hóa dữ liệu. |
9 | Python Functions | Write a Function Map and Lambda Function |
Trung bình | 80% | Phát triển kỹ năng viết hàm và sử dụng biểu thức lambda trong Python. |
10 | File Handling | File Operations in Python Working with Files |
Trung bình | 75% | Thực hành thao tác với tệp tin trong Python, bao gồm đọc và ghi dữ liệu. |
.
Quá tuyệt vời, trợ lý AI đã giúp tớ tiết kiếm khối thời gian, và đã cho ra một bảng tổng hợp nhanh chóng nhìn cũng khá OK. Trong phần tiếp theo tớ sẽ đi sâu vào các bài test, hoàn thành nó, và sẵn review luôn coi AI có tổng hợp đúng như yêu cầu không. Trong phần này chúng ta chỉ tạm lướt xem bảng test có bám sát với mục tiêu không nhé?
- Python cơ bản: Syntax, OOP, exception handling: Test 1, 2, 5: OK.
- Pandas:
- Đọc/ghi file (CSV, Excel, JSON): Test 3: OK.
- Xử lý dữ liệu: merge, filter, groupby: Test 3? Không rõ lắm, cần check thêm: TODO.
- Làm sạch dữ liệu (data cleaning): : Test 6: OK.
- Numpy: Xử lý dữ liệu dạng mảng, tính toán số học: Test 7: OK.
- Tools/Libs:
- Jupyter Notebook (làm việc với data trực quan): Test 4: OK.
- Matplotlib/Seaborn (vẽ biểu đồ cơ bản): Test 8: OK.
Như vậy bảng tổng hợp khá bám sát mục tiêu, trợ lý AI còn "tự ý" bổ sung thêm 2 bài Test 9, 10, nên có lẽ nó cũng quan trọng. Mục tiêu đã rõ cho chặng 1, có tất cả 10 bài tests/challenges cần hoàn thành, và sẽ được cập nhật trong bài tiếp theo. Anh em nào nhanh chân, làm thử 10 bài test ở trên, có gì thú vị, hoặc phát hiện AI chém gió, thì cho tớ biết với nhé.
Hẹn gặp lại trong bài tiếp theo.