Microsoft Fabric là gì?

Microsoft Fabric là một giải pháp phân tích toàn diện cho doanh nghiệp, bao gồm mọi thứ từ di chuyển dữ liệu đến khoa học dữ liệu, phân tích thời gian thực và thông tin kinh doanh. Nó cung cấp một bộ dịch vụ đầy đủ, bao gồm data lake, data engineering, và data integration, tất cả trong một nơi.

Với Fabric, bạn không cần phải kết hợp các dịch vụ khác nhau từ nhiều nhà cung cấp. Thay vào đó, bạn có thể tận hưởng một sản phẩm tích hợp, toàn diện và dễ sử dụng, được thiết kế để đơn giản hóa nhu cầu phân tích của bạn.

Nền tảng được xây dựng trên cơ sở của Software as a Service (SaaS), mang lại sự đơn giản và tích hợp một cách hoàn toàn mới.

Nền tảng SaaS

Microsoft Fabric kết hợp các thành phần mới và hiện có từ Power BI, Azure Synapse và Azure Data Factory vào một môi trường tích hợp duy nhất. Các thành phần này sau đó được trình bày trong các trải nghiệm người dùng được tùy chỉnh.

Diagram of the software as a service foundation beneath the different experiences of Fabric.

Fabric tập hợp các trải nghiệm như Data Engineering, Data Factory, Data Science, Data Warehouse, Real-Time Analytics, và Power BI vào một nền tảng SaaS chung. Tích hợp này mang lại các lợi ích sau:

  • Một loạt các phân tích tích hợp sâu trong ngành.
  • Chia sẻ kinh nghiệm qua những trải nghiệm quen thuộc và dễ học.
  • Developers có thể dễ dàng truy cập và tái sử dụng tất cả các tài sản.
  • Một hồ nước dữ liệu thống nhất giúp bạn giữ nguyên dữ liệu ở nơi nó đang có trong khi sử dụng các công cụ phân tích ưa thích của bạn.
  • Quản lý tập trung và quản lý trên tất cả các trải nghiệm.

Với trải nghiệm SaaS của Microsoft Fabric, tất cả dữ liệu và các dịch vụ được tích hợp một cách mượt mà. Nhóm IT có thể cấu hình tập trung các khả năng doanh nghiệp cốt lõi và quyền hạn được áp dụng tự động trên tất cả các dịch vụ cơ bản. Ngoài ra, các nhãn nhạy cảm với dữ liệu (data sensitivity labels) được kế thừa tự động trên tất cả các mục trong bộ sản phẩm.

Fabric cho phép người sáng tạo tập trung vào việc tạo ra tác phẩm tốt nhất của họ, giải phóng họ khỏi việc cần tích hợp, quản lý hoặc hiểu rõ cơ sở hạ tầng cơ bản hỗ trợ trải nghiệm.

Các thành phần của Microsoft Fabric

Microsoft Fabric cung cấp bộ trải nghiệm phân tích toàn diện được thiết kế để hoạt động một cách mượt mà cùng nhau. Mỗi trải nghiệm được tùy chỉnh cho một đối tượng cụ thể và một nhiệm vụ cụ thể. Fabric bao gồm các trải nghiệm hàng đầu trong ngành trong các danh mục sau để đáp ứng nhu cầu phân tích từ đầu đến cuối.

Screenshot of the Fabric menu of experiences.
  • Data Engineering – Data Engineering cung cấp một nền tảng Spark hàng đầu thế giới với trải nghiệm soạn thảo tuyệt vời, giúp kỹ sư dữ liệu thực hiện biến đổi dữ liệu quy mô lớn thông qua hồ nước. Tích hợp của Microsoft Fabric Spark với Data Factory cho phép lên lịch và triển khai sổ ghi chú và công việc Spark.
  • Data Factory – Azure Data Factory kết hợp sự đơn giản của Power Query với quy mô và sức mạnh của Azure Data Factory. Bạn có thể sử dụng hơn 200 kết nối native để kết nối với nguồn dữ liệu trên cơ sở và trong đám mây.
  • Data Science – Data Science giúp bạn xây dựng, triển khai và vận hành mô hình học máy một cách mượt mà trong trải nghiệm Fabric của bạn. Nó tích hợp với Azure Machine Learning để cung cấp theo dõi thử nghiệm và đăng ký mô hình tích hợp sẵn. Các nhà khoa học dữ liệu được ủy quyền để làm phong phú dữ liệu tổ chức với dự đoán và cho phép các nhà phân tích kinh doanh tích hợp những dự đoán đó vào báo cáo BI của họ. Điều này giúp chuyển từ hiểu biết mô tả sang hiểu biết dự đoán.
  • Data Warehouse – Data Warehouse cung cấp hiệu suất và quy mô SQL hàng đầu trong ngành. Nó hoàn toàn tách biệt tính toán khỏi lưu trữ, cho phép mở rộng độc lập của cả hai thành phần. Ngoài ra, nó lưu trữ dữ liệu một cách tự nhiên trong định dạng Delta Lake mở.
  • Real-Time Analytics – Quan sát dữ liệu được thu thập từ các nguồn khác nhau như ứng dụng, thiết bị IoT, tương tác của con người và nhiều nguồn khác nữa. Đây hiện đang là danh mục dữ liệu phát triển nhanh nhất. Dữ liệu này thường có định dạng bán cấu trúc như JSON hoặc Văn bản. Nó đến với khối lượng lớn, với các lược đồ chuyển động. Những đặc điểm này làm cho nó khó khăn cho các nền tảng lưu trữ dữ liệu truyền thống để làm việc. Real-Time Analytics là nền tảng hàng đầu cho phân tích, quan sát dữ liệu.
  • Power BI – Power BI là nền tảng Business Intelligence hàng đầu thế giới. Nó đảm bảo rằng chủ doanh nghiệp có thể truy cập tất cả dữ liệu trong Fabric một cách nhanh chóng và một cách trực quan để đưa ra quyết định tốt hơn với dữ liệu.

Fabric kết hợp tất cả những trải nghiệm này vào một nền tảng thống nhất để cung cấp nền tảng phân tích dữ liệu lớn toàn diện nhất trong ngành công nghiệp.

Microsoft Fabric cho phép tổ chức và cá nhân chuyển đổi các kho dữ liệu lớn và phức tạp thành công việc và phân tích có thể thực hiện được, và là một triển khai của kiến trúc mạng lưới dữ liệu. 

OneLake và lakehouse – sự thống nhất của lakehouses

Nền tảng Microsoft Fabric thống nhất kiến trúc OneLake và lakehouse trên toàn doanh nghiệp.

OneLake

Data lake là nền tảng trên đó tất cả các dịch vụ Fabric được xây dựng. Microsoft Fabric Lake còn được gọi là OneLake. Nó được tích hợp vào dịch vụ Fabric và cung cấp một vị trí thống nhất để lưu trữ tất cả dữ liệu tổ chức nơi các trải nghiệm hoạt động.

OneLake được xây dựng trên ADLS (Azure Data Lake Storage) Gen2. Nó cung cấp một trải nghiệm SaaS duy nhất và một kho lưu trữ dành cho dữ liệu phục vụ cả những nhà phát triển chuyên nghiệp và công dân. Trải nghiệm SaaS của OneLake đơn giản hóa các trải nghiệm, loại bỏ nhu cầu cho người dùng phải hiểu bất kỳ khái niệm cơ sở hạ tầng nào như nhóm tài nguyên, RBAC (Kiểm soát Truy cập Dựa trên Vai trò), Quản lý Tài nguyên Azure, tính dự phòng hoặc các vùng. Ngoài ra, nó không yêu cầu người dùng phải có tài khoản Azure.

OneLake loại bỏ các kho dữ liệu phổ biến và hỗn loạn ngày nay, mà những nhà phát triển cá nhân tạo ra khi họ cấu hình và cung cấp các tài khoản lưu trữ cách biệt của riêng họ. Thay vào đó, OneLake cung cấp một hệ thống lưu trữ đơn nhất, thống nhất cho tất cả các nhà phát triển, nơi khám phá và chia sẻ dữ liệu là chuyện dễ dàng và tuân thủ chính sách và cài đặt bảo mật một cách trung tâm và đồng đều.

Cấu trúc tổ chức của OneLake và lakehouse

OneLake có cấu trúc phân cấp để đơn giản hóa quản lý trên toàn tổ chức của bạn. Nó được tích hợp vào Microsoft Fabric và không yêu cầu bất kỳ việc cấu hình nào trước. Chỉ có một OneLake cho mỗi khách hàng và nó cung cấp một không gian tệp hệ thống đơn nhất trải dài qua người dùng, vùng và thậm chí là đám mây. Dữ liệu trong OneLake được chia thành các container quản lý dễ dàng.

Tenant tương ứng với gốc (root) của OneLake và nằm ở cấp độ cao nhất của cấu trúc phân cấp. Bạn có thể tạo bất kỳ số lượng không gian làm việc nào trong một tenant, có thể được xem xét như là các thư mục.

Hình ảnh dưới đây thể hiện các mục Fabric khác nhau nơi dữ liệu được lưu trữ. Đây là một ví dụ về cách các mục khác nhau trong Fabric sẽ lưu trữ dữ liệu trong OneLake. Như được hiển thị, bạn có thể tạo nhiều không gian làm việc trong một tenant, tạo nhiều lakehouse trong mỗi không gian làm việc. Một lakehouse là một bộ sưu tập các tệp, thư mục và bảng đại diện cho một cơ sở dữ liệu trên một hồ nước dữ liệu (data lake).

Diagram of the hierarchy of items like lakehouses and semantic models within a workspace within a tenant.

Mọi nhà phát triển và đơn vị kinh doanh trong tenant có thể ngay lập tức tạo các không gian làm việc của riêng họ trong OneLake. Họ có thể đưa dữ liệu vào các lakehouses của họ, bắt đầu xử lý, phân tích và hợp tác trên dữ liệu, giống như OneDrive trong Office.

Tất cả các trải nghiệm tính toán của Microsoft Fabric đều được kết nối trước với OneLake, giống như các ứng dụng Office được kết nối trước để sử dụng OneDrive tổ chức. Các trải nghiệm như Data Engineering, Data Warehouse, Data Factory, Power BI, and Real-Time Analytics sử dụng OneLake như kho lưu trữ native của chúng. Chúng không cần bất kỳ cấu hình bổ sung nào.

Diagram of different experiences all accessing the same OneLake data storage.

OneLake được thiết kế để cho phép gắn kết ngay lập tức các tài khoản lưu trữ PaaS hiện tại vào OneLake với tính năng Shortcut. Không cần di chuyển hoặc chuyển đổi bất kỳ dữ liệu hiện tại nào. Bằng cách sử dụng shortcut, bạn có thể truy cập dữ liệu được lưu trữ trong Azure Data Lake Storage.

Ngoài ra, shortcut cho phép bạn dễ dàng chia sẻ dữ liệu giữa người dùng và ứng dụng mà không cần di chuyển hoặc nhân đôi thông tin. Khả năng shortcut mở rộng đến các hệ thống lưu trữ khác, cho phép bạn tạo và phân tích dữ liệu trên nhiều đám mây với bộ nhớ cache thông minh, giảm chi phí xuất dữ liệu và đưa dữ liệu gần hơn đến tính toán.

Nguồn: https://learn.microsoft.com/en-us/fabric/get-started/microsoft-fabric-overview#saas-foundation

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.