Data Warehouse – Thông tin truy vấn trong kho dữ liệu Fabric

Trong Microsoft Fabric, tính năng insights truy vấn là một giải pháp có khả năng mở rộng, bền vững và có thể mở rộng để nâng cao trải nghiệm phân tích SQL. Với dữ liệu truy vấn lịch sử, thông tin tổng hợp và quyền truy cập vào văn bản truy vấn thực sự, bạn có thể phân tích và điều chỉnh hiệu suất truy vấn của mình. Tính năng QI cung cấp thông tin về các truy vấn chạy trong ngữ cảnh của người dùng chỉ, các truy vấn hệ thống không được xem xét.

Tính năng insights truy vấn cung cấp một vị trí trung tâm cho dữ liệu truy vấn lịch sử và thông tin có thể thực hiện trong 30 ngày, giúp bạn đưa ra quyết định có thông tin để tăng cường hiệu suất của kho dữ liệu hoặc điểm cuối phân tích SQL của bạn. Khi một truy vấn SQL chạy trong Microsoft Fabric, tính năng insights truy vấn thu thập và tổng hợp dữ liệu thực thi của nó, cung cấp cho bạn thông tin quý giá. Bạn có thể xem toàn bộ văn bản truy vấn cho các vai trò Quản trị viên, Thành viên và Đóng góp viên.

  • Historical Query Data:: Tính năng insights truy vấn lưu trữ dữ liệu lịch sử về việc thực thi truy vấn, giúp bạn theo dõi sự thay đổi hiệu suất theo thời gian. Các truy vấn hệ thống không được lưu trữ trong insights truy vấn.
  • Aggregated Insights: Tính năng insights truy vấn tổng hợp dữ liệu thực thi truy vấn thành thông tin có thể thực hiện hơn, chẳng hạn như xác định các truy vấn chạy lâu hoặc người dùng hoạt động nhiều nhất.

Trước khi bắt đầu

Bạn phải có quyền truy cập vào điểm cuối phân tích SQL hoặc Warehouse trong không gian làm việc có dung lượng Cao cấp với quyền của người đóng góp trở lên.

Bạn cần insights truy vấn khi nào?

Tính năng insights truy vấn giải quyết nhiều câu hỏi và mối quan tâm liên quan đến hiệu suất truy vấn và tối ưu hóa cơ sở dữ liệu, bao gồm:

Phân tích hiệu suất truy vấn

  •  Hiệu suất truy vấn của chúng ta trong quá khứ như thế nào?
  •  Có các truy vấn chạy lâu cần chú ý không?
  •  Chúng ta có thể xác định các truy vấn gây ra các điểm trở ngại về hiệu suất không?

Tối ưu hóa và điều chỉnh truy vấn

  • Các truy vấn nào được thường xuyên chạy, và hiệu suất của chúng có thể được cải thiện không?
  • Chúng ta có thể xác định các truy vấn đã thất bại hoặc bị hủy bỏ không?
  • Chúng ta có thể theo dõi sự thay đổi về hiệu suất truy vấn theo thời gian không?
  • Có các truy vấn nào luôn hiển thị hiệu suất kém không?

Giám Sát Hoạt Động Người Dùng

  • Ai đã gửi một truy vấn cụ thể?
  • Ai là người dùng hoạt động nhiều nhất hoặc người dùng có nhiều truy vấn chạy lâu nhất?

Có ba chế độ xem hệ thống để cung cấp câu trả lời cho những câu hỏi này:

Bạn có thể xem thông tin chi tiết về truy vấn ở đâu?

Các chế độ xem tự động tạo được đặt trong schema queryinsights tại điểm cuối phân tích SQL và Warehouse. Trong Fabric Explorer của một Warehouse ví dụ, tìm các chế độ xem insights truy vấn trong Schemas, queryinsights, Views.

A screenshot from the Fabric Explorer showing where to find query insights views under Schemas, queryinsights, Views.

Sau khi truy vấn của bạn hoàn thành việc thực thi, bạn sẽ thấy dữ liệu thực thi của nó trong các chế độ xem queryinsights của Warehouse hoặc điểm cuối phân tích SQL mà bạn đã kết nối. Nếu bạn chạy một truy vấn chéo cơ sở dữ liệu trong ngữ cảnh của WH_2, truy vấn của bạn xuất hiện trong insights truy vấn của WH_2. Các truy vấn đã hoàn thành có thể mất tới 15 phút để xuất hiện trong insights truy vấn tùy thuộc vào khối lượng công việc đồng thời đang được thực thi. Thời gian để truy vấn xuất hiện trong insights truy vấn tăng khi số lượng truy vấn đồng thời được thực thi tăng.

Làm cách nào các truy vấn tương tự được tổng hợp để tạo ra insights?

Các truy vấn được coi là giống nhau bởi tính năng insights truy vấn nếu, ngoại trừ giá trị định mệnh, hai truy vấn có sự khớp chính xác trong văn bản truy vấn. Dấu cách trắng và ký tự xuống dòng khiến cho các truy vấn được coi là khác nhau.

Ví dụ, các truy vấn sau được coi là giống nhau sau khi các định mệnh của chúng được tham số hóa:

SQL

SELECT * FROM Orders
WHERE OrderDate BETWEEN '1996-07-01' AND '1996-07-31';

SQLC

SELECT * FROM Orders
WHERE OrderDate BETWEEN '2000-07-01' AND '2006-07-31';

Ví dụ

Xác định các truy vấn được chạy bởi bạn trong vòng 30 phút qua.

The following query uses queryinsights.exec_requests_history and the built-in USER_NAME() function, which returns your current session user name.

SQL

SELECT * FROM queryinsights.exec_requests_history 
WHERE start_time >= DATEADD(MINUTE, -30, GETUTCDATE())
AND login_name = USER_NAME();

Xác định các truy vấn được chạy thường xuyên nhất sử dụng một chuỗi con trong văn bản truy vấn.

Truy vấn sau trả về các truy vấn mới nhất phù hợp với một chuỗi cụ thể, được sắp xếp theo số lần thực thi thành công giảm dần.

SQL

SELECT * FROM queryinsights.frequently_run_queries
WHERE last_run_command LIKE '%<some_label>%'
ORDER BY number_of_successful_runs DESC;

Xác định các truy vấn chạy lâu sử dụng một chuỗi con trong văn bản truy vấn.

Truy vấn sau trả về các truy vấn phù hợp với một chuỗi cụ thể, được sắp xếp theo thời gian thực thi truy vấn trung bình giảm dần.

SQL

SELECT * FROM queryinsights.long_running_queries
WHERE last_run_command LIKE '%<some_label>%'
ORDER BY median_total_elapsed_time_ms DESC;

Nguồn: https://learn.microsoft.com/en-us/fabric/data-warehouse/query-insights

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.