Tag Big Data

Tìm kiếm bài viết trong Tag Big Data

14/08/2025 - vừa được xem lúc 11/09/2025

Data vault : Xây dựng kho dữ liệu doanh nghiệp (Enterprise Data Warehouse - EDW)

Tổng quan về Data Vault. 1. Giới thiệu. Xây dựng kho dữ liệu doanh nghiệp (Enterprise Data Warehouse - EDW) với khả năng mở rộng cao, linh hoạt và dễ bảo trì.

0 0 11

23/03/2025 - vừa được xem lúc 17/09/2025

Ô khách hàng khó tính và cục ji sần siêu to khổng lồ

Đặt vấn đề. bạn có 1 ông khách hàng (Bên cam) khá là khó tính, bạn được giao cho 1 nhiệm vụ là làm trang user management, vì biz làm ăn nhỏ nên chỉ khoảng 1000 users và ông ta không thích cái tính năn

0 0 24

01/12/2024 - vừa được xem lúc 16/09/2025

Cài Đặt Cluster KAFKA sử dụng KRAFT

#Big Data

#apache kafka

#Data pipeline

Giới Thiệu. Theo cách cài đặt Apache Kafka truyền thống thì chúng ta phải cài đặt thêm cụm ZooKeeper để thực hiện các công việc quan trọng như lưu trữ metadata, quản lý broker, kiểm soát các topic và

0 0 18

20/11/2024 - vừa được xem lúc 18/09/2025

👨‍💻 Top Freelancer Platforms and Useful Tips To Get High-Paying Jobs 💸

1. Top Freelancer Platforms ️✨. Here are some of the top freelancer platforms for IT and software jobs, where developers, designers, and IT professionals can find remote work opportunities:. .

0 0 40

18/11/2024 - vừa được xem lúc 16/09/2025

👨‍💻 Top Freelancer Platforms and Useful Tips To Get High-Paying Jobs 💸

1. Top Freelancer Platforms. Here are some of the top freelancer platforms for IT and software jobs, where developers, designers, and IT professionals can find remote work opportunities:. .

0 0 25

01/11/2024 - vừa được xem lúc 17/09/2025

💻 Common Kafka Commands and Core Concepts 📨

1. Quick Setup. We can quickly start Kafka using Docker Compose Follow Quick Setup Guide, and to test Kafka setup with the CLI (Command Line Interface), follow these steps:. .

0 0 24

27/10/2024 - vừa được xem lúc 11/09/2025

Hành Trình Phát Triển Hạ Tầng Kỹ Thuật của Facebook: Từ Khởi Nguồn Đến Hệ Thống Phân Tán Toàn Cầu

#Facebook

#sharpBusinessanalyst

#Big Data

#Scale

#System Architecture

Bài viết này khám phá hành trình phát triển hạ tầng kỹ thuật của Facebook từ những ngày đầu khi còn là một hệ thống tập trung đơn giản, đến khi trở thành một nền tảng phân tán toàn cầu với hệ thống No

0 0 29

21/10/2024 - vừa được xem lúc 11/09/2025

"Thợ xây" tìm hiểu về Big Data từ con số "0"

#Big Data

Để tìm hiểu một vấn đề mới và chưa trải bao giờ điều đầu tiên mình luôn cố gắng nhìn vấn đề đó tổng quan nhất và tìm kiếm động lực nào để khiến thế giới công nghệ có hẳn một lĩnh vực riêng cho nó, bài

0 0 17

27/08/2024 - vừa được xem lúc 17/09/2025

Research on association rules

Lời mở đầu. Với sự phát triển của công nghệ thông tin thì khối lượng dữ liệu lưu trữ ngày càng lớn, và giữa những lượng dữ liệu khổng lồ đó lại ẩn chứa một số thông tin được coi là chìa khóa dẫn đến t

0 0 24

07/07/2024 - vừa được xem lúc 11/09/2025

Job Counting: Bài Toán Hóc Búa Mà Uber Giải Quyết "Trong Tích Tắc"

#kiến trúc microservices

Trên là một câu hỏi rất hay về việc xử lý lượng dữ liệu vô cùng lớn và có nhiều giải pháp được các bạn trong cộng đồng đưa ra. Chung bài toán gần như vậy, nay chúng ta cùng tìm hiểu bài toán tại Uber,

0 0 29

08/06/2024 - vừa được xem lúc 17/09/2025

Setting Up and Using Spark Operator with Kubernetes

Spark Operator is a Kubernetes Operator designed for Spark. It aims to define and execute Spark applications as easily as other workloads on Kubernetes by using and managing Kubernetes custom resource

0 0 24

07/06/2024 - vừa được xem lúc 14/09/2025

APACHE BEAM - Tóm tắt về Apache Beam

#Big Data

#Data engineer

#batch processing và stream processing

APACHE BEAM LÀ GÌ. . Là open-source. Là một mô hình lập trình thống nhất để xác định và thực thi các luồng xử lý dữ liệu (data processing pipelines).

0 0 25

24/09/2023 - vừa được xem lúc 17/09/2025

[Data Warehouse] Kiến Thức Tổng Quan Về Data Warehouse (Kho Dữ Liệu)

Lời mở đầu. Bài này là mình dịch và sửa lại từ một bài viết thấy khá hay, chi tiết và đầy đủ.

0 0 48

27/08/2023 - vừa được xem lúc 11/09/2025

Tìm Hiểu Về Hadoop

#Big Data

#Apache Hadoop

Mở Đầu. Hiện nay, dữ liệu được tạo ra một cách nhanh chóng và liên tục, từ các ứng dụng trực tuyến, thiết bị di động, máy tính cá nhân, các bộ cảm biến và nhiều nguồn khác.

0 0 26

03/08/2023 - vừa được xem lúc 17/09/2025

An Introduction to Delta Lake and Performance Testing Data Processing with Apache Spark - Part 1

Giới thiệu về Delta Lake. Delta Lake là một lớp lưu trữ mã nguồn mở, mang đến giao dịch ACID (đề cập bên dưới), bảo vệ schema và xử lý khối công việc dữ liệu lớn.

0 0 40

30/05/2023 - vừa được xem lúc 17/09/2025

Giải thích và Ứng dụng của PySpark.sql.Window trong Xử lý Dữ liệu phân tán

#Big Data

#data science

#Pyspark

Giới thiệu. Trong việc xử lý dữ liệu phân tán và tính toán song song, PySpark là một trong những công cụ phổ biến và mạnh mẽ nhất. Trong PySpark, pyspark.sql.

0 0 35

04/04/2023 - vừa được xem lúc 11/09/2025

Khai thác hiệu quả sức mạnh của Big Data cho doanh nghiệp

#Big Data

#Digital Marketing

#marketing analysis

. Big Data đóng một vai trò quan trọng trong việc hỗ trợ các doanh nghiệp thu thập một khối lượng lớn các dữ liệu của người dùng. Từ đó, các doanh nghiệp có thể triển khai các kế hoạch marketing hiệu

0 0 35

04/04/2023 - vừa được xem lúc 11/09/2025

Hadoop thì có liên quan gì tới Big Data?

Ở nội dung các bài viết trước, mình có giới thiệu qua về nội dung khóa học Data Science Fundamental và Data Analytics Fundamental để làm những bước đệm cho việc học về Data Science nói chung. Chắc hẳn

0 0 30