Tag Data engineer

Tìm kiếm bài viết trong Tag Data engineer

- vừa được xem lúc

Hướng dẫn cài đặt sử dụng databricks

Databricks là một nền tảng mạnh mẽ và linh hoạt cho phân tích dữ liệu và máy học, và nó đã trở thành một công cụ quan trọng trong lĩnh vực khoa học dữ liệu. Databricks cung cấp phiên bản cộng đồng miễ

0 0 6

- vừa được xem lúc

[DBT] Kết Nối DBT Với Big Query

Lời mở đầu. Ở bài trước - Giới thiệu DBT - mình đã đề cập đến việc dùng dbt kết nối và làm việc với các data platform khác.

0 0 15

- vừa được xem lúc

Cái nhìn tổng thể về các công nghệ và công cụ hàng đầu trong Data Engineering

Trong thế giới số hóa hiện đại ngày nay, không có gì quan trọng hơn việc hiểu và khai thác dữ liệu. Data Engineering, một lĩnh vực nổi bật trong ngành khoa học dữ liệu, đã trở thành trung tâm của nhiề

0 0 12

- vừa được xem lúc

Bài viết về Airflow cho người mới như mình

Mở đầu. Lướt dạo một vòng thì bài viết Airflow trên Viblo cũng có một số bài tương đối chi tiết như Tất tần tật về Airflow (P1) của anh Hoàng hay Một số điểm cần lưu ý khi sử dụng Airflow - Phần 1 của

0 0 12

- vừa được xem lúc

Cứ thực hành Airflow dễ hiểu và đơn giản đã, chưa làm gì phức tạp cả

Mở đầu. Tiếp nối bài viết chỉ toàn lý thuyết Bài viết về Airflow cho người mới như mình thì chúng ta đi ngay tới bài thực hành này thôi.

0 0 15

- vừa được xem lúc

ETL vs ELT không đơn giản chỉ là LT và TL?

Giới thiệu. Một trong những việc mà những người làm việc với Data cần làm, đặc biệt là Data Engineering, cần quan tâm đó là việc trích xuất dữ liệu từ nhiều nguồn, đổ về một chỗ (Data Warehouse, Data

0 0 7

- vừa được xem lúc

Thảo luận về performance của Pandas: Pandas 2.0 liệu có đột phá?

Đây là bài viết tản mạn. Bình thường, ngay khi công cụ này có vấn đề, chúng ta liền tìm sang một công cụ khác.

0 0 6

- vừa được xem lúc

Cùng thiết lập Multi Node Cluster trong Hadoop 2.x nào!

Trong bài viết trước của mình, mình đã giới thiệu về Hadoop và các thành phần của Hadoop. Hadoop là một hệ sinh thái mã nguồn mở được sử dụng để lưu trữ và xử lý dữ liệu lớn.

0 0 12

- vừa được xem lúc

Top các công cụ dành cho Data Analyst

Ngành Phân tích Dữ liệu đang là một trong những nghề Hot nhất và đang phát triển nhanh trên toàn thế giới. Theo phát triển, đang có rất nhiều công cụ dành cho việc Phân tích Dữ liệu – cả trả tiền và m

0 0 16

- vừa được xem lúc

Hướng dẫn cài đặt Pentaho

PENTAHO là gì. Trong bài viết này, mình chia sẻ cho các bạn về cách cài đặt công cụ Pentaho.

0 0 19

- vừa được xem lúc

TOP CÁC CÔNG CỤ DATA ENGINEER CẦN HỌC

Data Engineering là một trong những công việc hấp dẫn nhất thế kỷ 21 bởi mức lương tốt và cơ hội việc làm rộng mở. Trong doanh nghiệp, Data Engineer chịu trách nhiệm thiết kế, xây dựng và bảo trì các

0 0 19

- vừa được xem lúc

Data Modeling là gì? Lợi ích mà data modeling?

1. Data modeling là gì. Ví dụ: mô hình dữ liệu của cửa hàng bán ô tô. .

0 0 9

- vừa được xem lúc

Tổng quát về công cụ tích hợp dữ liệu Oracle Data Integrator (ODI)

Bắt đầu chúng Oracle Data Integrator (ODI) là một giải pháp độc đáo đáp ứng tất cả các nhu cầu tích hợp của người dùng. Năm 2018, Oracle Data Integrator được vinh danh là công cụ tích hợp đứng đầu tro

0 0 18

- vừa được xem lúc

11 quy tắc quan trọng trong thiết kế Cơ sở dữ liệu

Quy tắc 1: Bản chất của ứng dụng (OLTP hoặc OLAP) là gì. >>> Đọc thêm:.

0 0 30

- vừa được xem lúc

Kho dữ liệu (Data Warehouse) là gì? Phân biệt kho dữ liệu và cơ sở dữ liệu

Kho dữ liệu (tiếng Anh: Data Warehouse) là kho lưu trữ điện tử của một lượng lớn thông tin của một doanh nghiệp hoặc tổ chức. Khái niệm.

0 0 15

- vừa được xem lúc

11 bước để Triển khai kho dữ liệu (DWH)

Để triển khai kho dữ liệu (Data warehouse) thành công thì chúng ta có thể tham khảo các bước làm dưới đây:. Quy trình triển khai kho dữ liệu. . .

0 0 21

- vừa được xem lúc

Mô hình hoá dữ liệu: Data Warehouse Modeling

Data Warehouse Modeling là quá trình thiết kế các lược đồ thông tin chi tiết và tóm tắt của kho dữ liệu. Mục tiêu của Data Warehouse Modeling là phát triển một lược đồ mô tả thực tế, hoặc ít nhất là m

0 0 23

- vừa được xem lúc

Kiến thức cơ bản về kiến trúc DWH: Data Warehouse Architecture

Data Warehouse Architecture là một phương pháp xác định kiến trúc tổng thể của quá trình xử lý và trình bày giao tiếp dữ liệu tồn tại cho máy tính của khách hàng cuối trong doanh nghiệp. Mỗi kho dữ li

0 0 14

- vừa được xem lúc

Data Mart là gì? Tìm hiểu tổng quan về Data mart

Data Mart là một tập hợp con của kho thông tin tổng, thường hướng đến một mục đích cụ thể hoặc chủ đề dữ liệu chính có thể được phân phối để cung cấp nhu cầu kinh doanh. Data Marts là kho lưu trữ hồ s

0 0 21

- vừa được xem lúc

MetaData là gì? MetaData cần thiết trong Data Warehouse không ?

Metadata là dữ liệu về dữ liệu hoặc tài liệu về thông tin được người dùng yêu cầu. Trong Data Warehouse, metadata là một trong những khía cạnh thiết yếu.

0 0 26

- vừa được xem lúc

Hiểu đơn giản về Airflow Executor

Airflow Executor là một thành phần quan trọng của Apache Airflow, được coi là "trạm làm việc" cho tất cả các nhiệm vụ theo lịch trình. Trong bài viết này chúng ta sẽ thảo luận chi tiết về Airflow exec

0 0 14