- vừa được xem lúc

Chặng 1.1: Python và Data Manipulation

0 0 2

Người đăng: Hoang Dang

Theo Viblo Asia

Chào anh em,

Theo mục tiêu của series bài chinh phục python, automation hôm trước, hôm nay chúng ta bắt đầu với chặng 1: nền tảng python. Với lộ trình được tư vấn bởi AI, tớ sẽ cần phải điểm qua và hoàn thành các items như sau:

Giai đoạn 1: Nền tảng Python và Data Manipulation

  • Mục tiêu: Làm quen với Python, xử lý dữ liệu cơ bản.
  • Kỹ năng cần học:
    • Python cơ bản: Syntax, OOP, exception handling.
    • Pandas:
      • Đọc/ghi file (CSV, Excel, JSON).
      • Xử lý dữ liệu: merge, filter, groupby.
      • Làm sạch dữ liệu (data cleaning).
    • Numpy: Xử lý dữ liệu dạng mảng, tính toán số học.
  • Tools/Libs:
    • Jupyter Notebook (làm việc với data trực quan).
    • Matplotlib/Seaborn (vẽ biểu đồ cơ bản).

💡 Thời gian: 2-4 tuần (với 2-3 tiếng/ngày).


Vì đã có kinh nghiệm nhất định, tuy chỉ mới vỡ lòng với python và pandas, nên tớ sẽ không mất thời gian đi "học" lại hay vọc lại mí bạn như syntax, hay OOP, vân vân mây mây nhé. Anh em có thể tra cứu tài liệu hoặc khóa học online tương ứng để nhanh chóng đạt mục tiêu hen. Tuy nhiên python có thể khác nhiều so với java, nên để tránh chủ quan, tớ sẽ làm review, làm các bài tests trước khi đi qua chặng mới. Đôi khi việc quá nôn nóng hoàn thành mục tiêu, hoặc đi quá nhanh có thể khiến chúng ta dễ dàng bỏ sót, bị hổng kiến thức, giống như hổng kiến thức Vật Lý lớp 7 mà vẫn cố thoi thóp để leo cho lên Vật Lý lớp 12 vậy, nên ở đây tớ chọn phương án chậm mà chắc nhé.

Phần review, tớ sẽ lập bảng checklist, làm tất cả các bài test liên quan tới các từ khóa thuộc hạng mục chặng 1 ở trên. Phần này tớ sẽ nhờ trợ lý AI hỗ trợ để có 1 bảng bài test nhanh chóng hiệu quả. Sau đó dựa trên kết quả test, và cải thiện tớ sẽ cập nhật cho anh em trong bài tiếp theo thuộc cùng series. Nếu các hạng mục trong bài test mà chưa đạt yêu cầu, dĩ nhiên tớ buộc phải dành nhiều thời gian hơn ở chặng 1 này.

Bảng TEST Python

Theo tư vấn ban đầu của AI, nếu đi làm hết tất cả các bài test online thì sẽ rất nhiều, và rất mất thời gian.

  • Ví dụ: chỉ riêng https://www.hackerrank.com/domains/python đã có hơn 100 bài tests với độ khó và và hạng mục (sub-domains) khác nhau rồi. Nên tớ sẽ không cố làm hết tất cả các bài tests theo cách này nhé.

image.png

  • Quá nhiều!!!!!! Và không bám sát mục tiêu đề ra.

.

Tiêu chí bài tests vì thế sẽ được thu hẹp gồm bài kiểm tra phức hợp với độ khó từ trung bình trở lên, tập trung vào các từ khóa và kỹ năng như mô tả trong Giai đoạn 1: "Nền tảng Python và Xử lý Dữ liệu". Như vậy sẽ nhanh chóng kiểm tra trình độ, và tiết kiệm thời gian hơn cho anh em rồi nhé. Dưới đây là bảng tổng hợp:

No. Từ khóa Liên kết bài kiểm tra Độ khó Độ phổ biến Ghi chú
1 Python OOP Classes: Dealing with Complex Numbers
Classes: Find the Torsional Angle
Trung bình 85% Các bài tập này giúp bạn rèn luyện kỹ năng lập trình hướng đối tượng trong Python.
2 Exception Handling Exceptions
Incorrect Regex
Trung bình 80% Luyện tập xử lý ngoại lệ trong Python, giúp chương trình của bạn trở nên robust hơn.
3 Pandas CSV/Excel Pandas Exercises
101 Pandas Exercises for Data Analysis
Trung bình 75% Các bài tập này giúp bạn làm quen với việc đọc/ghi và xử lý dữ liệu bằng Pandas.
4 Jupyter Notebook Data Analysis with Python: Zero to Pandas
Introduction to Jupyter
Trung bình 70% Hướng dẫn sử dụng Jupyter Notebook cho phân tích dữ liệu, giúp bạn làm việc với dữ liệu một cách trực quan.
5 Python Syntax Python If-Else
Arithmetic Operators
Trung bình 90% Củng cố kiến thức về cú pháp Python thông qua các bài tập điều kiện và toán tử.
6 Data Cleaning Data Cleaning Challenge
Handling Missing Data in Python
Trung bình 65% Thực hành làm sạch dữ liệu, một kỹ năng quan trọng trong phân tích dữ liệu.
7 NumPy Array Ops Arrays
Shape and Reshape
Trung bình 85% Luyện tập thao tác với mảng NumPy, cơ sở cho các tính toán số học trong Python.
8 Data Visualization Matplotlib Tutorial
Seaborn Tutorial
Trung bình 70% Học cách vẽ biểu đồ cơ bản với Matplotlib và Seaborn để trực quan hóa dữ liệu.
9 Python Functions Write a Function
Map and Lambda Function
Trung bình 80% Phát triển kỹ năng viết hàm và sử dụng biểu thức lambda trong Python.
10 File Handling File Operations in Python
Working with Files
Trung bình 75% Thực hành thao tác với tệp tin trong Python, bao gồm đọc và ghi dữ liệu.

.

Quá tuyệt vời, trợ lý AI đã giúp tớ tiết kiếm khối thời gian, và đã cho ra một bảng tổng hợp nhanh chóng nhìn cũng khá OK. Trong phần tiếp theo tớ sẽ đi sâu vào các bài test, hoàn thành nó, và sẵn review luôn coi AI có tổng hợp đúng như yêu cầu không. Trong phần này chúng ta chỉ tạm lướt xem bảng test có bám sát với mục tiêu không nhé?

  • Python cơ bản: Syntax, OOP, exception handling: Test 1, 2, 5: OK.
  • Pandas:
    • Đọc/ghi file (CSV, Excel, JSON): Test 3: OK.
    • Xử lý dữ liệu: merge, filter, groupby: Test 3? Không rõ lắm, cần check thêm: TODO.
    • Làm sạch dữ liệu (data cleaning): : Test 6: OK.
    • Numpy: Xử lý dữ liệu dạng mảng, tính toán số học: Test 7: OK.
  • Tools/Libs:
    • Jupyter Notebook (làm việc với data trực quan): Test 4: OK.
    • Matplotlib/Seaborn (vẽ biểu đồ cơ bản): Test 8: OK.

Như vậy bảng tổng hợp khá bám sát mục tiêu, trợ lý AI còn "tự ý" bổ sung thêm 2 bài Test 9, 10, nên có lẽ nó cũng quan trọng. Mục tiêu đã rõ cho chặng 1, có tất cả 10 bài tests/challenges cần hoàn thành, và sẽ được cập nhật trong bài tiếp theo. Anh em nào nhanh chân, làm thử 10 bài test ở trên, có gì thú vị, hoặc phát hiện AI chém gió, thì cho tớ biết với nhé.

Hẹn gặp lại trong bài tiếp theo.

Bình luận

Bài viết tương tự

- vừa được xem lúc

Thao tác với File trong Python

Python cung cấp các chức năng cơ bản và phương thức cần thiết để thao tác các file. Bài viết này tôi xin giới thiệu những thao tác cơ bản nhất với file trong Python.

1 1 134

- vừa được xem lúc

Tập tành crawl dữ liệu với Scrapy Framework

Lời mở đầu. Chào mọi người, mấy hôm nay mình có tìm hiểu được 1 chút về Scrapy nên muốn viết vài dòng để xem mình đã học được những gì và làm 1 demo nho nhỏ.

1 1 237

- vừa được xem lúc

Sử dụng Misoca API (oauth2) với Python

Với bài viết này giúp chúng ta có thể nắm được. ・Tìm hiểu cách xử lý API misoca bằng Python.

1 1 121

- vừa được xem lúc

[Series Pandas DataFrame] Phân tích dữ liệu cùng Pandas (Phần 3)

Tiếp tục phần 2 của series Pandas DataFrame nào. Let's go!!. Ở phần trước, các bạn đã biết được cách lấy dữ liệu một row hoặc column trong Pandas DataFame rồi phải không nào. 6 Hoc.

1 1 136

- vừa được xem lúc

Lập trình socket bằng Python

Socket là gì. Một chức năng khác của socket là giúp các tầng TCP hoặc TCP Layer định danh ứng dụng mà dữ liệu sẽ được gửi tới thông qua sự ràng buộc với một cổng port (thể hiện là một con số cụ thể), từ đó tiến hành kết nối giữa client và server.

0 0 148

- vừa được xem lúc

[Series Pandas DataFrame] Phân tích dữ liệu cùng Pandas (Phần 2)

Nào, chúng ta cùng đến với phần 2 của series Pandas DataFrame. Truy xuất Labels và Data. Bạn đã biết cách khởi tạo 1 DataFrame của mình, và giờ bạn có thể truy xuất thông tin từ đó. Với Pandas, bạn có thể thực hiện các thao tác sau:.

0 0 163