Giới thiệu
- Vấn đề đặt ra: hệ thống phân tích dữ liệu của doanh nghiệp thường bao gồm một số dịch vụ sử dụng các định dạng dữ liệu độc quyền do các dịch vụ này được cung cấp từ các nhà cung cấp khác nhau. Điều này làm cho việc tích hợp trở nên phức tạp, tốn thời gian và chi phí, và các hệ thống kết quả thường rất dễ hỏng.
- Vào ngày 23/5/2023 vừa qua, một giải pháp mới của Microsoft ra đời: Microsoft Fabric
- Microsoft Fabric là một giải pháp được đánh giá là cover được tất cả các dịch vụ về dữ liệu mà một doanh nghiệp cần, từ dữ liệu đến khoa học dữ liệu , phân tích dữ liệu thời gian thực và các dự đoán đối với dữ liệu.
- Điều này đồng nghĩ với việc các doanh nghiệp sẽ không cần sử dụng nhiều dịch vụ từ nhiều nhà cung cấp, thay vào đó là sử dụng nhiều dịch vụ về phân tích dữ liệu từ một nhà cung cấp duy nhất: Microsoft
- được xây dựng trên nền tảng của Phần mềm dưới dạng Dịch vụ (SaaS),
Điều gì làm nên sự khác biệt của Microsoft Fabric?
Fabric là một sản phẩm phân tích đầu cuối giải quyết mọi khía cạnh nhu cầu phân tích của một tổ chức. Nhưng theo trang chủ Microsoft có nêu lên thì có năm khía cạnh khiến Fabric khác biệt với các giải pháp khác của thị trường:
Fabric là một nền tảng phân tích hoàn chỉnh
- Mỗi dự án đều sẽ gồm nhiều hệ thống con, mỗi hệ thống con thường yêu cầu các sản phẩm từ nhiều nhà cung cấp. Vì vậy việc tích hợp các sản phẩm này là một sự tốn kém, phức tạp
- Với Fabric, khách hàng có thể sử dụng 1 sản phầm duy nhất có kiến trúc cung cấp tất cả các yêu cầu cần thiết cho nhà phát triển, từ lưu trữ, truy xuất đến phân tích, dự đoán, báo cáo hay trình bày đối với dữ liệu
- Với cách cung cấp trải nghiệm dạng phầm mềm dạng dịch vụ (SaaS) thì mọi thứ đều được tích hợp, tối ưu hóa tự động, người dùng có thể đăng ký và sử dụng một cách nhanh chóng mà không cần cài đặt lên máy tính hay maý chủ riêng
Fabic là một Lake-centric và Open
-
Lake-centric:
- Vấn đề đặt ra là Data Warehouses ngày nay tương đối lộn xộn, phức tạp bởi mỗi sản phẩm trong một hệ thống con có thể có các định dạng dữ liệu riêng, điều này có thể gây ra sự trùng lặp hoặc khó đồng nhất
- Fabric đi kèm một Cloud Data Lake, đó là OneLake.
- OneLake cung cấp một hệ thống lưu trữ thống nhất, duy nhất cho các nhà phát triển, nơi việc khám phá và chia sẻ dữ liệu trở nên dễ dàng với các chính sách và bảo mật được thực thi tập trung.
- OneLake cho phép dễ dàng chia sẻ dữ liệu giữa người dùng và ứng dụng mà không cần phải di chuyển và sao chép thông tin một cách không cần thiết.
-
Open:
- Ở đây nói tới định dạng dữ liệu mở
- Khách hàng chỉ cần tải dữ liệu vào Lake một lần và tất cả các công việc có thể hoạt động trên cùng một dữ liệu mà không cần phải nhập riêng dữ liệu đó.
- Điều đó cũng có nghĩa là OneLake hỗ trợ dữ liệu có cấu trúc ở mọi định dạng và dữ liệu phi cấu trúc, mang đến cho khách hàng sự linh hoạt hoàn toàn.
- Một bản sao dữ liệu duy nhất trong OneLake có thể cung cấp trực tiếp cho tất cả khối lượng công việc.
Fabric được hỗ trợ bởi AI
- Microsoft đang kết hợp Fabric với dịch vụ Azure OpenAI ở mọi layers
- Điều này giúp khách hàng khai thác toàn bộ tiềm năng dữ liệu của họ
- Cho phép các nhà phát triển tận dụng sức mạnh của AI đối với dữ liệu và hỗ trợ người dùng là doanh nghiệp hiểu thông tin chuyên sâu từ dữ liệu của họ
Fabric trao quyền cho mọi người dùng trong doanh nghiệp
- Nhu cầu doanh nghiệp muốn thúc đẩy một nền văn hóa dữ liệu, tức là mọi người trong tổ chức đều có thể đưa ra những quyết định tốt hơn dựa trên dữ liệu
- Fabric tích hợp sâu với các ứng dụng Microsoft 365 mà mọi người thường xuyên sử dụng hiện nay.
- Cụ thể, Power BI là một phần cốt lõi của Fabric và được tích hợp trên Microsoft 365. Điều này có nghĩa là người dùng có thể dễ dàng khám phá và truy cập dữ liệu liên quan từ OneLake ngay từ Microsoft 365 (Excel, Teams, PowerPoint, ...)
- Ví dụ người dùng Microsoft Excel có thể trực tiếp khám phá và phân tích dữ liệu trong OneLake và tạo báo cáo nhờ Power BI chỉ bằng một nút bấm, hay nhúng các báo cáo từ Power BI vào trong các bạn trình bày PowerPoint của họ
Fabric giảm chi phí thông qua khả năng thống nhất
- Như đã nêu nhiều lần thì các hệ thống phân tích dữ liệu ngày nay thường kết hợp từ các sản phẩm từ nhiều nhà cung cấp trong 1 dự án duy nhất, điều này chắc chắn sẽ tốn kém hơn nhiều so với việc khách hàng mua một giải pháp có thể cover được tất cả các dịch vụ cần cho một hệ thống phân tích
7 thành phần chính của Microsoft Fabric
- Data Factory: cung cấp hơn 150 trình kết nối với các nguồn dữ liệu on-premises(các nguồn dữ liệu được lưu trữ và quản lý trên cơ sở hạ tầng máy chủ và lưu trữ trong nội bộ của một tổ chức hoặc doanh nghiệp) và trên cloud, bên cạnh đó Data Factory cung cấp khả năng kéo thả để chuyển đổi dữ liệu và sắp xếp data pipeline
- Synapse Data Engineering: Là một dịch vụ phân tích dữ liệu trên Cloud của Azure, cung cấp các công cụ để xử lý và phân tích dữ liệu lớn.
- Synapse Data Science: Là một dịch vụ phân tích dữ liệu trên Cloud của Azure, cung cấp các công cụ để xây dựng và triển khai các mô hình học máy và AI.
- Synapse Data Warehousing: Là một dịch vụ data warehouse trên Cloud của Azure, cung cấp khả năng lưu trữ và truy xuất dữ liệu lớn.
- Synapse Real-Time Analytic: Là một dịch vụ phân tích dữ liệu trên Cloud của Azure, cho phép phân tích dữ liệu trực tiếp thông qua các luồng dữ liệu thời gian thực.
- Power BI: Là một công cụ phân tích dữ liệu và Business Intelligence của Microsoft, cho phép bạn tạo và chia sẻ các báo cáo, trực quan hóa dữ liệu và thực hiện phân tích dữ liệu.
- Data Activator: Không phải là một thành phần chính của Microsoft Azure. Tuy nhiên, có thể đây là một sản phẩm hoặc công cụ của bên thứ ba liên quan đến việc kích hoạt dữ liệu hoặc các tác vụ liên quan đến dữ liệu.
Fabric tập hợp tất cả những trải nghiệm này thành một nền tảng thống nhất để cung cấp nền tảng phân tích dữ liệu lớn toàn diện nhất trong ngành.
Tổng kết
Sau một mớ toàn chữ thì mình muốn mọi người hiểu một điều bản chất như sau: Các sản phẩm của Microsoft như Azure Synapse Analytics, Azure Data Factory hay Azure Data Explorer đã có từ trước rồi, và Fabric đại diện cho sự phát triển của các dịch vụ đó dưới dạng giải pháp SaaS đơn giản hóa có thể kết nối với các dịch vụ PaaS đó, tức là theo mình thì để học toàn diện về Fabric thì tối thiểu chúng ta cần hiểu 7 thành phần đã nêu trên là gì và làm việc với nó ra sao. MÌnh sẽ tiếp tục cập nhật kiến thức về Fabric trong các bài viết sắp tới.
Mình cũng có thấy 1 trang có giúp chúng ta trang bị một chút cho Fabric, mọi người có thể xem qua tại đây. Cảm ơn mọi người đã đọc bài viết của mình ^^
Tài liệu
- Bring your data into the era of AI - Microsoft
- Get Started with Microsoft Fabric – All in-one place for all your Analytical needs…. Part 1
- Introducing Microsoft Fabric: Data analytics for the era of AI
- New business opportunities with Microsoft Fabric – the data platform for the era of AI
- Microsoft Fabric là gì & 7 thành phần chính