- vừa được xem lúc

Data Mart là gì? Tìm hiểu tổng quan về Data mart

0 0 34

Người đăng: Trưởng Nguyễn

Theo Viblo Asia

Data Mart là một tập hợp con của kho thông tin tổng, thường hướng đến một mục đích cụ thể hoặc chủ đề dữ liệu chính có thể được phân phối để cung cấp nhu cầu kinh doanh. Data Marts là kho lưu trữ hồ sơ phân tích được thiết kế để tập trung vào các chức năng kinh doanh cụ thể cho một cộng đồng cụ thể trong một tổ chức. Các Data Warehouse có nguồn gốc từ các tập hợp con dữ liệu trong Data Warehouse, mặc dù trong phương pháp thiết kế Data Warehouse từ dưới lên, Data Warehouse được tạo từ sự kết hợp của các Data Warehouse tổ chức.

Việc sử dụng cơ bản của trung tâm dữ liệu là các ứng dụng Business Intelligence (BI). BI được sử dụng để thu thập, lưu trữ, truy cập và phân tích bản ghi. Nó có thể được sử dụng bởi các doanh nghiệp nhỏ hơn để tận dụng dữ liệu mà họ đã tích lũy được vì nó ít tốn kém hơn so với việc triển khai một Data Warehouse.

Lý do tạo trung tâm dữ liệu

  • Tạo dữ liệu tập thể bởi một nhóm người dùng
  • Dễ dàng truy cập vào data thường xuyên cần thiết
  • Dễ dàng sáng tạo
  • Cải thiện thời gian phản hồi của khách hàng
  • Chi phí thấp hơn so với việc triển khai một Data Warehouse hoàn chỉnh
  • Khách hàng tiềm năng được xác định rõ ràng hơn so với trong một Data Warehouse toàn diện
  • Nó chỉ chứa dữ liệu kinh doanh thiết yếu và ít lộn xộn hơn.

Các loại Data Marts

Chủ yếu có hai cách tiếp cận để thiết kế data mart. Những cách tiếp cận này là

  • Dependent Data Marts
  • Independent Data Marts

Dependent Data Marts

Dependent Data Marts là một tập hợp con hợp lý của một tập con vật lý của một Data Warehouse cao hơn. Theo kỹ thuật này, các data mart được coi như các tập con của Data Warehouse. Trong kỹ thuật này, trước hết một Data Warehouse được tạo ra để từ đó có thể tạo thêm các Data Warehouse khác nhau. Các Data Warehouse này phụ thuộc vào Data Warehouse và trích xuất bản ghi cần thiết từ đó. Trong kỹ thuật này, khi Data Warehouse tạo ra data mart; do đó, không cần tích hợp data mart. Nó còn được gọi là cách tiếp cận từ trên xuống.

Independent Data Marts

Cách tiếp cận thứ hai là Các Data Warehouse độc lập (IDM) Ở đây, trước tiên các Data Warehouse độc lập được tạo, sau đó một Data Warehouse được thiết kế bằng cách sử dụng các Data Warehouse độc lập này. Theo cách tiếp cận này, vì tất cả các data mart được thiết kế độc lập; do đó, việc tích hợp các data mart là bắt buộc. Nó cũng được gọi là phương pháp tiếp cận từ dưới lên vì các data mart được tích hợp để phát triển một Data Warehouse.

Ngoài hai loại này, còn một loại nữa tồn tại được gọi là “Hybrid Data Marts”.

Hybrid Data Marts

Nó cho phép kết hợp dữ liệu từ ngoài Data Warehouse. Điều này phù hợp cho nhiều trường hợp; đặc biệt là trong trường hợp tích hợp Adhoc, chẳng hạn như thêm mới nhóm một tổ chức.

Các bước triển khai Data Mart

Các bước quan trọng trong việc triển khai data mart là thiết kế lược đồ, xây dựng bộ lưu trữ vật lý, điền vào data mart với dữ liệu từ các hệ thống nguồn, truy cập nó để đưa ra quyết định sáng suốt và quản lý nó theo thời gian. Vì vậy, các bước là:

Designing

Bước thiết kế là bước đầu tiên trong quy trình data mart. Giai đoạn này bao gồm tất cả các chức năng từ việc khởi tạo yêu cầu đối với trung tâm dữ liệu thông qua việc thu thập dữ liệu về các yêu cầu và phát triển thiết kế logic và vật lý của trung tâm dữ liệu.

Nó bao gồm các nhiệm vụ sau:

  • Thu thập các yêu cầu kinh doanh và kỹ thuật
  • Xác định nguồn dữ liệu
  • Chọn tập hợp con dữ liệu thích hợp
  • Thiết kế kiến trúc logic và vật lý của data mart.

Constructing

Bước này bao gồm việc tạo cơ sở dữ liệu vật lý và các cấu trúc logic được liên kết với data mart để cung cấp khả năng truy cập nhanh và hiệu quả vào dữ liệu.

Nó bao gồm các nhiệm vụ sau:

  • Tạo cơ sở dữ liệu vật lý và các cấu trúc logic, chẳng hạn như không gian bảng được liên kết với Data Warehouse.
  • Tạo các đối tượng lược đồ như bảng và chỉ mục được mô tả trong bước thiết kế.
  • Xác định cách tốt nhất để thiết lập các bảng và cấu trúc truy cập.

Populating

Bước này bao gồm tất cả các tác vụ liên quan đến việc lấy dữ liệu từ nguồn, làm sạch nó, sửa đổi nó theo đúng định dạng và mức độ chi tiết, và chuyển nó vào data mart.

Nó bao gồm các nhiệm vụ sau:

  • Ánh xạ các nguồn dữ liệu đến các nguồn dữ liệu mục tiêu
  • Trích xuất dữ liệu
  • Làm sạch và chuyển đổi thông tin.
  • Đang tải dữ liệu vào data mart
  • Tạo và lưu trữ siêu dữ liệu

Accessing

Bước này liên quan đến việc đưa dữ liệu vào sử dụng: truy vấn dữ liệu, phân tích dữ liệu, tạo báo cáo, biểu đồ và đồ thị và xuất bản chúng.

Nó bao gồm các nhiệm vụ sau:

  • Thiết lập và lớp trung gian (Meta Layer) để công cụ front-end sử dụng. Lớp này chuyển các hoạt động cơ sở dữ liệu và tên đối tượng thành các điều kiện kinh doanh để khách hàng cuối có thể tương tác với trung tâm dữ liệu bằng cách sử dụng các từ liên quan đến các chức năng nghiệp vụ.
  • Thiết lập và quản lý kiến trúc cơ sở dữ liệu như bảng tóm tắt giúp các truy vấn đồng ý thông qua các công cụ front-end thực thi nhanh chóng và hiệu quả.

Managing

Bước này bao gồm việc quản lý Data Warehouse trong suốt thời gian tồn tại của nó. Trong

bước này, các chức năng quản lý được thực hiện như:

  • Cung cấp quyền truy cập an toàn vào dữ liệu.
  • Quản lý sự tăng trưởng của dữ liệu.
  • Tối ưu hóa hệ thống để có hiệu suất tốt hơn.
  • Đảm bảo tính khả dụng của sự kiện dữ liệu với các lỗi hệ thống

Nguồn: Internet

Để hiểu hơn cũng như tham khảo thêm các kiến thức về dữ liệu, mọi người có thể truy cập vào https://indaacademy.vn/blog/ nhé. Cảm ơn mọi người nhiều nhé. Hẹn mọi người vào kiến thức tiếp theo.

Bình luận

Bài viết tương tự

- vừa được xem lúc

Nhập môn lý thuyết cơ sở dữ liệu - Phần 2: Mô hình thực thể liên kết

**Chào các bạn, hôm nay mình tiếp tục viết tiếp phần 2 cho series Nhập môn lý thuyết cơ sở dữ liệu. Chắc hẳn qua bài trước các bạn tìm được lý do vì sao mình phải học môn này rồi chứ.

0 0 68

- vừa được xem lúc

Các vai trò chính trong Data Ecosystem - [Data Analyst Series]

Ngày nay, các tổ chức đang sử dụng dữ liệu để khám phá các cơ hội và mang lại lợi ích trong tương lai. Điển hình là tạo các mô hình trong các giao dịch tài chính để phát hiện gian lận, sử dụng các côn

0 0 47

- vừa được xem lúc

Tìm hiểu về Apache Spark

Ngày nay có rất nhiều hệ thống đang sử dụng Hadoop để phân tích và xử lý dữ liệu lớn. Ưu điểm lớn nhất của Hadoop là được dựa trên một mô hình lập trình song song với xử lý dữ liệu lớn là MapReduce, m

0 0 52

- vừa được xem lúc

Data Warehouse là gì? Top 7 ứng dụng quan trọng của kho dữ liệu

Data Warehouse là gì? Lợi ích và ứng dụng của kho dữ liệu Data Warehouse là gì? Với sự bùng nổ về mặt thông tin và dữ liệu như hiệu này thì đây luôn là những câu hỏi được rất nhiều bạn thắc mắc, đặc b

0 0 35

- vừa được xem lúc

Phân biệt: Database, Data Warehouse, Data Mart, Data Lake, Data Lakehouse, Data Fabric, Data Mesh

Chào mọi người,. Hôm nay, tiếp tục Series Phân tích dữ liệu kinh doanh, mình sẽ chia sẻ với mọi người những khái niệm phổ biến nhất liên quan về thiết kế hệ thống dữ liệu bên dưới nhé, vì khi làm phân

0 0 39

- vừa được xem lúc

Kỹ sư dữ liệu và lộ trình trở thành data engineer (DE) với 4 bước

Data Engineer hay còn gọi là kỹ sư dữ liệu là một trong những vị trí quan trọng trong lĩnh vực khoa học dữ liệu. Với sự phát triển của kỷ nguyên số, nhu cầu chuyển đổi số của các doanh nghiệp ngày càn

0 0 36