Khả năng kết nối với kho dữ liệu trong Microsoft Fabric

Fabric, bạn có thể truy cập thông qua một Tabular Data Stream, hay TDS endpoint, quen thuộc với tất cả các ứng dụng web hiện đại tương tác với một điểm cuối SQL Server. Điều này được gọi là Chuỗi Kết Nối SQL trong giao diện người dùng Microsoft Fabric.

Bài viết này cung cấp hướng dẫn cách kết nối với SQL analytics endpoint hoặc Warehouse của bạn.

Để bắt đầu, bạn cần hoàn thành các điều kiện tiên quyết sau:

  • Bạn cần truy cập vào một SQL analytics endpoint hoặc Warehouse trong một không gian làm việc có dung lượng Premium với quyền Contributor hoặc cao hơn.

Xác thực Warehouse trong Fabric

Trong Microsoft Fabric, có hai loại người dùng được xác thực thông qua chuỗi kết nối SQL:

  • Nguyên tắc người dùng Microsoft Entra ID (trước đây là Azure Active Directory), hoặc nhận dạng người dùng.
  • Nguyên tắc dịch vụ Microsoft Entra ID (trước đây là Azure Active Directory).

Chuỗi kết nối SQL yêu cầu cổng TCP 1433 mở. TCP 1433 là số cổng SQL Server tiêu chuẩn. Chuỗi kết nối SQL cũng tuân theo mô hình bảo mật SQL analytics endpoint hoặc Warehouse cho việc truy cập dữ liệu. Dữ liệu có thể được lấy cho tất cả các đối tượng mà người dùng có quyền truy cập.

Truy xuất chuỗi kết nối SQL

Để lấy chuỗi kết nối, làm theo các bước sau:

  1. Điều hướng đến không gian làm việc của bạn, chọn Warehouse và chọn Tùy chọn khác.Screenshot of a workspace item for a warehouse. The More options button is boxed.
    Chọn Sao chép chuỗi kết nối SQL để sao chép chuỗi kết nối vào clipboard của bạn.Ảnh chụp màn hình không gian làm việc với menu ngữ cảnh đang mở.

Bắt đầu với SQL Server Management Studio (SSMS)

Các bước sau đây nêu chi tiết cách bắt đầu tại không gian làm việc Microsoft Fabric và kết nối kho với SQL Server Management Studio (SSMS).

  1. Khi bạn mở SSMS, cửa sổ Connect to Server xuất hiện. Nếu đã mở, bạn có thể kết nối thủ công bằng cách chọn Object Explorer > Connect > Database Engine .
    Ảnh chụp màn hình hiển thị vị trí chọn Công cụ cơ sở dữ liệu trên menu Kết nối.
  2. Khi cửa sổ Kết nối với máy chủ được mở, dán chuỗi kết nối đã sao chép từ phần trước của bài viết này vào ô Tên máy chủ. Chọn Kết nối và tiếp tục với các thông tin đăng nhập phù hợp cho xác thực. Hãy nhớ rằng chỉ có hỗ trợ xác thực đa yếu tố của Microsoft Entra (MFA).Ảnh chụp màn hình hiển thị cửa sổ Kết nối với máy chủ.
  3. Sau khi kết nối được thiết lập, Object Explorer sẽ hiển thị kho được kết nối từ không gian làm việc cũng như các bảng và dạng xem tương ứng của nó, tất cả đều sẵn sàng để được truy vấn.
    Ảnh chụp màn hình hiển thị vị trí tên máy chủ được kết nối xuất hiện trong khung Object Explorer.

Khi kết nối qua SSMS (hoặc ADS), bạn sẽ thấy cả điểm cuối phân tích SQL và Kho được liệt kê là kho và rất khó để phân biệt giữa hai loại mục cũng như chức năng của chúng. Vì lý do này, chúng tôi đặc biệt khuyến khích bạn áp dụng quy ước đặt tên cho phép bạn dễ dàng phân biệt giữa hai loại mục khi làm việc trong các công cụ bên ngoài trải nghiệm cổng thông tin Microsoft Fabric.

Kết nối bằng Power BI

Điểm cuối phân tích SQL Warehouse hoặc Lakehouse là nguồn dữ liệu gốc và được hỗ trợ đầy đủ trong Power BI và không cần sử dụng chuỗi Kết nối SQL. Trung tâm dữ liệu hiển thị tất cả các kho mà bạn có quyền truy cập trực tiếp. Điều này cho phép bạn dễ dàng tìm thấy kho của mình theo không gian làm việc và:

  1. Chọn Warehouse
  2. Chọn thực thể
  3. Tải dữ liệu – chọn chế độ kết nối dữ liệu: nhập hoặc DirectQuery

Kết nối bằng OLE DB

Chúng tôi hỗ trợ kết nối với điểm cuối phân tích Warehouse hoặc SQL bằng OLE DB. Đảm bảo bạn đang chạy Microsoft OLE DB Driver for SQL Server. 

Kết nối bằng ODBC

Microsoft Microsoft Fabric hỗ trợ kết nối với điểm cuối phân tích Warehouse hoặc SQL bằng ODBC. Đảm bảo bạn đang chạy latest ODBC Driver for SQL Server. Sử dụng xác thực Microsoft Entra ID (trước đây là Azure Active Directory).

Kết nối bằng JDBC

Microsoft Fabric cũng hỗ trợ kết nối đến Warehouse hoặc điểm kết quả phân tích SQL bằng cách sử dụng trình điều khiển Java database connectivity (JDBC).

  1. Khi thiết lập kết nối qua JDBC, kiểm tra các phụ thuộc sau:
  2. Thêm các thành phần, chọn Thêm thành phần và thêm bốn phụ thuộc sau trong cửa sổ như sau, sau đó chọn Tải xuống/Cập nhật để tải tất cả các phụ thuộc.
    Ảnh chụp màn hình hiển thị nơi chọn Tải xuống/Cập nhật.
  3. Chọn Kiểm tra kết nối và chọn Hoàn tất .
    Ảnh chụp màn hình của tab Khai báo phụ thuộc.

Kết nối bằng dbt

Dbt là một framework biến đổi dữ liệu sử dụng các best practices của kỹ thuật phần mềm như kiểm thử và quản lý phiên bản để giảm mã, tự động quản lý các phụ thuộc và cung cấp dữ liệu đáng tin cậy hơn – tất cả đều sử dụng SQL.

Các plugin dbt cho các nền tảng dữ liệu cụ thể cho phép người dùng kết nối với cửa hàng dữ liệu theo sự lựa chọn của họ. Để kết nối với Synapse Data Warehouse trong Microsoft Fabric từ dbt, sử dụng dbt-fabric adapter. Tương tự, nguồn dữ liệu SQL pool cố định của Azure Synapse Analytics có adapter riêng của mình, dbt-synapse.

Cả hai adapter đều hỗ trợ xác thực Microsoft Entra ID (trước đây là Azure Active Directory) và cho phép các nhà phát triển sử dụng xác thực az cli. Tuy nhiên, xác thực SQL không được hỗ trợ cho dbt-fabric.

DBT Fabric DW Adapter sử dụng thư viện pyodbc để thiết lập kết nối với Warehouse. Thư viện pyodbc là một hiện thực ODBC trong ngôn ngữ Python sử dụng Python Database API Specification v2.0. Thư viện pyodbc truyền trực tiếp chuỗi kết nối đến trình điều khiển cơ sở dữ liệu thông qua SQLDriverConnect trong cấu trúc kết nối msodbc đến Microsoft Fabric bằng dịch vụ proxy TDS (Tabular Data Streaming).

Kết nối bằng các phương tiện khác

Mọi công cụ của bên thứ ba đều có thể sử dụng chuỗi Kết nối SQL thông qua trình điều khiển ODBC hoặc OLE DB để kết nối với điểm cuối phân tích SQL hoặc Microsoft Microsoft Fabric Warehouse bằng cách sử dụng xác thực Microsoft Entra ID (trước đây là Azure Active Directory).

Ứng dụng tùy chỉnh

Trong Microsoft Fabric, một SQL analytics endpoint của Warehouse và Lakehouse cung cấp một chuỗi kết nối SQL. Dữ liệu có thể được truy cập từ một hệ sinh thái lớn của các công cụ SQL, miễn là chúng có thể xác thực bằng Microsoft Entra ID (trước đây là Azure Active Directory).

Những cân nhắc và hạn chế

  • Đăng nhập bằng SQL Authentication không được hỗ trợ.
  • Kết quả hoạt động nhiều (MARS) không được hỗ trợ cho Warehouse của Microsoft Fabric. MARS bị tắt mặc định, tuy nhiên, nếu MultipleActiveResultSets được bao gồm trong chuỗi kết nối, nó nên được loại bỏ hoặc đặt thành false.
  • Khi kết nối đến một warehouse, bạn có thể nhận được một lỗi “Kích thước token vượt quá kích thước tải trọng tối đa được phép”. Điều này là do có một số lượng lớn các warehouse trong không gian làm việc hoặc là thành viên của một số lượng lớn các nhóm Microsoft Entra. Trong trường hợp lỗi này, hãy làm việc với quản trị viên không gian làm việc để làm sạch các Warehouses không sử dụng và thử lại kết nối, hoặc liên hệ với bộ phận hỗ trợ nếu vấn đề vẫn tiếp tục.
  • Kết nối linked server từ SQL Server không được hỗ trợ.

Nguồn: https://learn.microsoft.com/en-us/fabric/data-warehouse/connectivity

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.