Kết nối với Microsoft OneLake

Microsoft OneLake cung cấp quyền truy cập mở vào tất cả các mục Fabric của bạn thông qua API và SDK thế hệ 2 Azure Data Lake Storage (ADLS) hiện có. Thay vào đó, bạn có thể truy cập dữ liệu của mình trong OneLake thông qua bất kỳ API, SDK hoặc công cụ nào tương thích với ADLS Gen2 chỉ bằng cách sử dụng URI OneLake. Bạn có thể tải dữ liệu lên Lakehouse thông qua Azure Storage Explorer hoặc đọc bảng delta thông qua lối tắt từ Azure Databricks.

Vì OneLake là phần mềm dưới dạng dịch vụ (SaaS) nên một số thao tác, chẳng hạn như quản lý quyền hoặc cập nhật các mục, phải được thực hiện thông qua trải nghiệm Fabric thay vì API ADLS Gen2.

Cú pháp URI

Vì OneLake tồn tại trên toàn bộ đối tượng thuê Microsoft Fabric của bạn nên bạn có thể tham chiếu đến mọi thứ trong đối tượng thuê của mình theo không gian làm việc, mục và đường dẫn của nó:

HTTP

https://onelake.dfs.fabric.microsoft.com/<workspace>/<item>.<itemtype>/<path>/<fileName>

OneLake cũng hỗ trợ tham chiếu các không gian làm việc và mục bằng mã định danh duy nhất toàn cầu (GUID). OneLake chỉ định GUID và GUID không thay đổi, ngay cả khi không gian làm việc hoặc tên mục thay đổi. Bạn có thể tìm thấy GUID liên quan cho không gian làm việc hoặc mục của mình trong URL trên cổng Fabric. Bạn phải sử dụng GUID cho cả không gian làm việc và mục và không cần loại mục.

HTTP

https://onelake.dfs.fabric.microsoft.com/<workspaceGUID>/<itemGUID>/<path>/<fileName>

Khi áp dụng một công cụ để sử dụng trên OneLake thay vì ADLS Gen2, hãy sử dụng ánh xạ sau:

  • Tên tài khoản luôn là onelake.
  • Tên vùng chứa là tên không gian làm việc của bạn.
  • Đường dẫn dữ liệu bắt đầu tại mục. Ví dụ:/mylakehouse.lakehouse/Files/.

OneLake cũng hỗ trợ Azure Blob Filesystem driver (ABFS) để có khả năng tương thích cao hơn với ADLS Gen2 và Azure Blob Storage. Trình điều khiển ABFS sử dụng mã nhận dạng lược đồ riêng abfsvà định dạng URI khác để xử lý các tệp và thư mục trong tài khoản ADLS Gen2. Để sử dụng định dạng URI này trên OneLake, hãy hoán đổi không gian làm việc cho hệ thống tệp và bao gồm mục và loại mục.

HTTP

abfs[s]://<workspace>@onelake.dfs.fabric.microsoft.com/<item>.<itemtype>/<path>/<fileName>

Ủy quyền

Bạn có thể xác thực API OneLake bằng Microsoft Entra ID bằng cách chuyển qua tiêu đề ủy quyền. Nếu một công cụ hỗ trợ đăng nhập vào tài khoản Azure của bạn để bật tính năng chuyển mã thông báo, bạn có thể chọn bất kỳ đăng ký nào. OneLake chỉ yêu cầu mã thông báo người dùng của bạn và không quan tâm đến đăng ký Azure của bạn.

Khi gọi trực tiếp OneLake qua API DFS, bạn có thể xác thực bằng mã thông báo mang cho tài khoản Microsoft Entra của mình.

Để kiểm tra OneLake nhanh chóng, đặc biệt bằng cách sử dụng các lệnh gọi API trực tiếp, đây là một ví dụ đơn giản sử dụng PowerShell để đăng nhập vào tài khoản Azure của bạn, truy xuất mã thông báo trong phạm vi lưu trữ và sao chép nó vào khay nhớ tạm của bạn để dễ dàng sử dụng ở nơi khác.

PowerShell

az login --allow-no-subscriptions
$bearerToken = Get-AzAccessToken -ResourceTypeName Storage
$testToken.Token | Set-Clipboard

Nơi lưu trữ dữ liệu

OneLake hiện không đảm bảo vị trí dữ liệu trong một khu vực cụ thể khi sử dụng điểm cuối toàn cầu (https://onelake.dfs.fabric.microsoft.com).. Khi bạn truy vấn dữ liệu ở một khu vực khác với khu vực không gian làm việc của bạn, có khả năng dữ liệu có thể rời khỏi khu vực của bạn trong quá trình phân giải điểm cuối. Nếu bạn lo ngại về nơi lưu trữ dữ liệu, việc sử dụng điểm cuối khu vực chính xác cho không gian làm việc của bạn sẽ đảm bảo dữ liệu của bạn nằm trong khu vực hiện tại và không vượt qua bất kỳ ranh giới khu vực nào. Bạn có thể khám phá điểm cuối khu vực chính xác bằng cách kiểm tra vùng dung lượng mà không gian làm việc được gắn vào.

Tất cả các điểm cuối khu vực của OneLake đều tuân theo cùng một định dạng: https://<region>-onelake.dfs.fabric.microsoft.com.  Ví dụ: một không gian làm việc gắn liền với năng lực ở khu vực Tây Hoa Kỳ 2 sẽ có thể truy cập được thông qua điểm cuối khu vực https://westus-onelake.dfs.fabric.microsoft.com.

Các vấn đề chung

Nếu một công cụ hoặc gói tương thích với ADLS Gen2 không hoạt động trên OneLake thì vấn đề phổ biến nhất là xác thực URL. Vì OneLake sử dụng điểm cuối (dfs.fabric.microsoft.com)  khác với ADLS  Gen2 (dfs.core.windows.net), nên một số công cụ không nhận ra điểm cuối OneLake và chặn nó. Một số công cụ cho phép bạn sử dụng điểm cuối tùy chỉnh (chẳng hạn như PowerShell). Mặt khác, việc thêm điểm cuối của OneLake làm điểm cuối được hỗ trợ thường là một cách khắc phục đơn giản. Nếu bạn gặp sự cố xác thực URL hoặc có bất kỳ sự cố nào khác khi kết nối với OneLake, hãy cho chúng tôi biết.

Mẫu

Tạo tập tin

RequestPUT https://onelake.dfs.fabric.microsoft.com/{workspace}/{item}.{itemtype}/Files/sample?resource=file
HeadersAuthorization: Bearer <userAADToken>
ResponseResponseCode: 201 Created
Headers:
x-ms-version : 2021-06-08
x-ms-request-id : 272526c7-0995-4cc4-b04a-8ea3477bc67b
x-ms-content-crc64 : OAJ6r0dQWP0=
x-ms-request-server-encrypted : true
ETag : 0x8DA58EE365
Body:

Nguồn: https://learn.microsoft.com/en-us/fabric/onelake/onelake-access-api

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.