Tag Data engineer

Bước chân vào lĩnh vực Data Engineer, bạn sẽ nhận ra rằng tham gia các dự án Data Engineer thực tế là chìa khóa để kết nối giữa lý thuyết và ứng dụng thực tế. Không chỉ giúp bạn nắm bắt cách xử lý dữ

0 0 18

28/11/2024 - vừa được xem lúc 21/09/2025

Top 5 kỹ năng Data Engineer cần biết trong 2025

#Data engineer

#data engineering

#indaacademy

Muốn trở thành một Data Engineer trong năm 2025 tới, bạn phải nắm rõ bộ kỹ năng cần thiết của vị trí này. Từ khả năng lập trình SQL, Python đến việc nắm vững các nền tảng đám mây như AWS hay GCP, mỗi

0 0 20

27/11/2024 - vừa được xem lúc 24/09/2025

Analytics Engineer là gì? Lộ trình Data Analyst chuyển nghề làm Analytics Engineer

Trong thị trường việc làm hiện nay, sự chuyển mình từ Data Analyst/DA sang Analytics Engineer (kỹ sư phân tích) đang trở thành xu hướng phổ biến. Các doanh nghiệp ngày càng cần những chuyên gia không

0 0 24

15/11/2024 - vừa được xem lúc 21/09/2025

So sánh điểm khác nhau giữa ETL và ELT

#Data engineer

#etl

#elt

Trong một thế giới bùng nổ của dữ liệu, các tổ chức đang đối mặt với một lượng thông tin khổng lồ và nhu cầu quản lý những thông tin giá trị từ dữ liệu này càng ngày càng tăng. Do đó các Data Engineer

0 0 14

05/10/2024 - vừa được xem lúc 26/09/2025

SQL Và Một Số Câu Hỏi Thường Gặp

#SQL

#Data engineer

1. INNER JOIN, LEFT JOIN, RIGHT JOIN, and FULL OUTER JOIN in SQL. . .

0 0 26

28/08/2024 - vừa được xem lúc 11/09/2025

Triển vọng và mức lương của Data Engineer

#Data engineer

#indaacademy

Trong thời đại mà dữ liệu thúc đẩy sự đổi mới và đưa ra quyết định mang tính bước ngoặt trong doanh nghiệp, vai trò của Data Engineer chưa bao giờ quan trọng như thời điểm hiện tại. Trong thời đại chu

0 0 22

09/08/2024 - vừa được xem lúc 22/09/2025

Những điều cần biết về Analytics Engineer

#Data engineer

#data analyst

#analytics

Chúng ta đều biết rằng ngành khoa học dữ liệu liên tục phát triển kéo theo các chức danh và vai trò công việc liên tục được tăng thêm. Trong những ngày đầu, hầu hết các vai trò trong ngành đều đi kèm

0 0 23

06/08/2024 - vừa được xem lúc 18/09/2025

Sử Dụng AWS Glue Data Catalog và Athena Để Đơn Giản Hóa Quản Lý và Truy Vấn Dữ Liệu

#Amazon Web Services (AWS)

#Data engineer

#Data Analytics

Giới Thiệu Về AWS Glue Data Catalog và AWS Athena. Trong lĩnh vực phân tích dữ liệu hiện đại, khả năng tổ chức và truy vấn dữ liệu một cách hiệu quả là yếu tố then chốt.

0 0 26

25/07/2024 - vừa được xem lúc 11/09/2025

[Data Science] Dựng Apache Airflow phiên bản cực nhẹ ở local với Docker Compose

#Data engineer

#Apache Airflow

Đã có bao giờ bạn tự hỏi rằng khi dựng Airflow ở local hay home server cho mục đích học tập và testing DAG, vậy thì làm gì mà lại ngốn nhiều RAM và CPU dữ vậy trời? Mới đây thôi, mình vừa thử mang lên

0 0 20

16/06/2024 - vừa được xem lúc 8 giờ trước

Vai Trò và Tầm Quan Trọng của "Indexes" Trong Tối Ưu Hóa Truy vấn Cơ Sở Dữ Liệu

#Data engineer

#database_mysql

1 Khái quát về Index. Các Index rất quan trọng trong các hệ thống cơ sở dữ liệu vì chúng nâng cao đáng kể hiệu quả xử lý truy vấn.

0 0 23

14/06/2024 - vừa được xem lúc 8 giờ trước

Hash-Distributed Table, Round-Robin Table, Replicated Table - Azure Synapse Service

#Data engineer

#Azure cloud services

1. Has-Distributed Tables. 1.1 Định nghĩa.

0 0 23

12/06/2024 - vừa được xem lúc 11/09/2025

Khái Quát về Severless SQL Pools

#Data engineer

#Azure cloud services

Giới Thiệu. .

0 0 22

10/06/2024 - vừa được xem lúc 8 giờ trước

Sơ Lược Về Azure Synapse Service

#Data engineer

#Microsoft Azure Service

Giới thiệu. Azure Synapse Service, trước đây được gọi là kho dữ liệu Azure SQL (Azure SQL Data Warehouse), là một dịch vụ phân tích tích hợp, toàn diện do Microsoft Azure cung cấp.

0 0 26

08/06/2024 - vừa được xem lúc 24/09/2025

Setting Up and Using Spark Operator with Kubernetes

Spark Operator is a Kubernetes Operator designed for Spark. It aims to define and execute Spark applications as easily as other workloads on Kubernetes by using and managing Kubernetes custom resource

0 0 25

07/06/2024 - vừa được xem lúc 28/09/2025

APACHE BEAM - Tóm tắt về Apache Beam

#Big Data

#Data engineer

#batch processing và stream processing

APACHE BEAM LÀ GÌ. . Là open-source. Là một mô hình lập trình thống nhất để xác định và thực thi các luồng xử lý dữ liệu (data processing pipelines).

0 0 26

05/06/2024 - vừa được xem lúc 30/09/2025

Hadoop Architecture, Data Lake, and Apache Spark

#Apache Spark

#Data engineer

Hadoop là gì và nó hoạt động như thế nào. . YARN - Cluster Resource Manager. .

0 0 21

09/12/2023 - vừa được xem lúc 8 giờ trước

Hướng dẫn cài đặt sử dụng databricks

Databricks là một nền tảng mạnh mẽ và linh hoạt cho phân tích dữ liệu và máy học, và nó đã trở thành một công cụ quan trọng trong lĩnh vực khoa học dữ liệu. Databricks cung cấp phiên bản cộng đồng miễ

0 0 36

26/09/2023 - vừa được xem lúc 14/09/2025

[DBT] Kết Nối DBT Với Big Query

Lời mở đầu. Ở bài trước - Giới thiệu DBT - mình đã đề cập đến việc dùng dbt kết nối và làm việc với các data platform khác.

0 0 42

28/06/2023 - vừa được xem lúc 21/09/2025

Cái nhìn tổng thể về các công nghệ và công cụ hàng đầu trong Data Engineering

#Data engineer

#programming language

#data engineering

#công nghệ trong data engineering

#công cụ trong data engineering

Trong thế giới số hóa hiện đại ngày nay, không có gì quan trọng hơn việc hiểu và khai thác dữ liệu. Data Engineering, một lĩnh vực nổi bật trong ngành khoa học dữ liệu, đã trở thành trung tâm của nhiề

0 0 35

13/06/2023 - vừa được xem lúc 23/09/2025

Bài viết về Airflow cho người mới như mình

#Data engineer

#airflow

#ContentCreator

Mở đầu. Lướt dạo một vòng thì bài viết Airflow trên Viblo cũng có một số bài tương đối chi tiết như Tất tần tật về Airflow (P1) của anh Hoàng hay Một số điểm cần lưu ý khi sử dụng Airflow - Phần 1 của

0 0 37