- vừa được xem lúc

Rust & Jupyter Notebook - Phân tích dữ liệu với Polars (Phần 03)

0 0 1

Người đăng: RustDEV VietNam

Theo Viblo Asia

polars cung cấp nhiều hànm, công cụ phục vụ việc "transform" dữ liệu trong DataFrame. Thoạt nhìn thì các hàm này có vẻ sẽ thực hiện những chức năng như nhau mà trong thực tế chúng có thể cùng thực hiện một chức năng thật, chẳng hạn .replace().with_column() đều có thể thực hiện việc chuyển kiểu dữ liệu hay chuyển đổi giá trị dữ liệu của một cột. Tuy nhiên, hành vi thực hiện nội tại của chúng lại khác nhau vì chúng được thiết kế với các mục đích khác nhau. Việc nắm rõ mục đích của từng hàm, phương thức sẽ giúp chúng ta chọn lựa và sử dụng đúng công cụ cho đúng mục đích và quan trọng hơn là tránh được những vấn đề không mong muốn.

Bên cạnh đó, việc xác định được mục đích của từng cột dữ liệu cũng sẽ giúp chúng ta xác định được kiểu dữ liệu tối ưu cho mục đích đó ngay từ đầu để có thể tối ưu được việc sử dụng tài nguyên hệ thống và tăng tốc xử lý đặc biệt khi làm việc với những khối dữ liệu lớn. Chẳng hạn, chỉ cần bình tĩnh một chút để đánh giá kiểu dữ liệu trước khi thực hiện công tác phân tích, chúng ta hoàn toàn có thể giảm kích thước dữ liệu tới 4 lần ngay từ khi tải nạp từ tệp tin dữ liệu thô.

Hãy cùng chúng tôi tìm hiểu và thực hành những nội dung trên trong video “#0037 - Phân tích dữ liệu với polars (Phần 03)” trên kênh Youtube RustDEV Vietnam.

Bình luận

Bài viết tương tự

- vừa được xem lúc

[Series Pandas DataFrame] Phân tích dữ liệu cùng Pandas (Phần 3)

Tiếp tục phần 2 của series Pandas DataFrame nào. Let's go!!. Ở phần trước, các bạn đã biết được cách lấy dữ liệu một row hoặc column trong Pandas DataFame rồi phải không nào. 6 Hoc.

1 1 153

- vừa được xem lúc

[Series Pandas DataFrame] Phân tích dữ liệu cùng Pandas (Phần 2)

Nào, chúng ta cùng đến với phần 2 của series Pandas DataFrame. Truy xuất Labels và Data. Bạn đã biết cách khởi tạo 1 DataFrame của mình, và giờ bạn có thể truy xuất thông tin từ đó. Với Pandas, bạn có thể thực hiện các thao tác sau:.

0 0 183

- vừa được xem lúc

[Series Pandas DataFrame] Phân tích dữ liệu cùng Pandas (Phần 1)

Pandas DataFrame là một cấu trúc chứa dữ liệu hai chiều và các nhãn tương ứng của nó. DataFrames được sử dụng rộng rãi trong data science, machine learning, scientific computing và nhiều lĩnh vực sử dụng nhiều dữ liệu khác.

0 0 38

- vừa được xem lúc

[Series Pandas DataFrame] Phân tích dữ liệu cùng Pandas (Phần 7)

Làm việc với Time Series trong Pandas. Pandas thật sự vượt trội trong việc xử lý với Time Series.

0 0 44

- vừa được xem lúc

Polars - thư viện xử lý dữ liệu DataFrame nhanh hơn cả Pandas!!!!

Hello mọi người, hẳn là mọi người vẫn hay dùng Pandas để xử lý dữ liệu dạng DataFrame đúng không nhỉ? Hôm nay mình sẽ giới thiệu một thư viện mới Polars - một thư viện xử lý dữ liệu dạng bảng biểu đượ

0 0 30

- vừa được xem lúc

Tổng hợp dữ liệu trong DataFrame

Mở đầu. Khi làm việc với dữ liệu trong DataFrame, một trong những nhiệm vụ quan trọng là tổng hợp và tóm tắt dữ liệu .

0 0 28