Báo cáo về chi phí và sử dụng trong Data Warehouse của Synapse

Bài viết giải thích báo cáo về việc sử dụng công suất tính toán trong Data Warehouse của Synapse trên Microsoft Fabric, bao gồm hoạt động đọc và ghi đối với Data Warehouse, cũng như hoạt động đọc trên điểm kết nối phân tích SQL của Lakehouse.

Khi bạn sử dụng dung lượng Fabric, phí sử dụng của bạn sẽ xuất hiện trong cổng Azure trong đăng ký của bạn trong Microsoft Cost Management .

Dung tích

Trong Fabric, dựa trên SKU Năng lực mà bạn mua, bạn có quyền sử dụng một bộ Đơn vị Năng lực (CUs) được chia sẻ trên tất cả các công việc trong Fabric. Để biết thêm thông tin về các giấy phép được hỗ trợ, xem tại giấy phép Microsoft Fabric .

Năng lực là một bộ tài nguyên dành riêng, có sẵn vào một thời điểm nhất định để sử dụng. Năng lực xác định khả năng của một tài nguyên thực hiện một hoạt động hoặc sản xuất đầu ra. Các tài nguyên khác nhau sử dụng Đơn vị Năng lực (CUs) vào các thời điểm khác nhau

Năng lực trong Fabric của Synapse Data Warehouse

Trong mô hình Dịch vụ được xây dựng trên Năng lực, Fabric Data Warehousing nhằm tận dụng tối đa năng lực đã mua và cung cấp khả năng nhìn thấy việc sử dụng.

Đơn vị Năng lực (CUs) được tiêu thụ bởi kho dữ liệu bao gồm hoạt động đọc và ghi đối với Data Warehouse, cũng như hoạt động đọc trên điểm kết nối phân tích SQL của Lakehouse.

Nói một cách đơn giản, 1 Đơn vị Năng lực của Fabric = 0.5 vCore của Warehouse. Ví dụ, một SKU Năng lực của Fabric là F64 có 64 Đơn vị Năng lực, tương đương với 32 vCore của Warehouse.

Tính toán báo cáo sử dụng

Ứng dụng này cung cấp khả năng nhìn thấy việc sử dụng dung lượng của tất cả các workloads trên Fabric tại một địa điểm. Người quản trị có thể sử dụng ứng dụng để theo dõi dung lượng, hiệu suất của các workloads và cách chúng được sử dụng so với dung lượng đã mua.

Ban đầu, bạn phải là một quản trị viên dung lượng để cài đặt ứng dụng Microsoft Fabric Capacity Metrics. Sau khi cài đặt, bất kỳ người nào trong tổ chức cũng có thể được cấp quyền hoặc chia sẻ để xem ứng dụng. Để biết thêm thông tin, xem vào… Cài đặt ứng dụng Microsoft Fabric Metrics .

Sau khi bạn đã cài đặt ứng dụng, chọn Warehouse từ danh sách dropdown của mục Chọn loại hàng: (Select item kind:). Biểu đồ đa chỉ số dạng ribbon và bảng dữ liệu Items (14 ngày) hiện chỉ hiển thị hoạt động trong Kho (Warehouse).

An animated gif of the Fabric Capacity Metrics compute page in the Microsoft Fabric Capacity Metrics app.

Hạng mục vận hành kho

Bạn có thể phân tích việc sử dụng khả năng tính toán chung theo loại công việc, trên toàn bộ tenant (người thuê). Việc sử dụng được theo dõi bằng tổng số Capacity Unit Seconds (CU(s)). Bảng hiển thị thống kê việc sử dụng trong 14 ngày gần đây.

Cả kho (Warehouse) và điểm cuối phân tích SQL đều được tổng hợp dưới Kho (Warehouse) trong ứng dụng Metrics, vì cả hai đều sử dụng tính toán SQL. Các loại hoạt động xuất hiện trong tầm nhìn này là:

  • Query Kho (Warehouse): Tính phí tính toán cho tất cả các câu lệnh T-SQL do người dùng tạo ra và hệ thống tạo ra trong một Kho.
  • Query SQL analytics endpoint: Tính phí tính toán cho tất cả các câu lệnh T-SQL do người dùng tạo ra và hệ thống tạo ra trong một điểm cuối phân tích SQL.
  • OneLake Compute: Tính phí tính toán cho tất cả các đọc và ghi dữ liệu được lưu trữ trong OneLake

Ví dụ:

A screenshot of the Data warehouse operation categories in the Microsoft Fabric Capacity Metrics app.

Biểu đồ khám phá mốc thời gian

Biểu đồ trong ứng dụng Microsoft Fabric Capacity Metrics này thể hiện việc sử dụng tài nguyên so với dung lượng đã mua. 100% sử dụng đại diện cho toàn bộ lưu lượng thông qua một Capacity SKU và được chia sẻ bởi tất cả các trải nghiệm Fabric. Điều này được biểu thị bằng đường nét đứt màu vàng. Bằng cách chọn một điểm thời gian cụ thể trong biểu đồ, nút Khám phá (Explore) sẽ trở nên khả dụng, mở ra một trang chi tiết để phân tích chi tiết.

Nhìn chung, tương tự như Power BI, các hoạt động được phân loại là tương tác hoặc nền và được biểu thị bằng màu sắc. Hầu hết các hoạt động trong danh mục Kho được báo cáo như là nền để tận dụng việc làm mịn hoạt động trong vòng 24 giờ để cho phép mô hình sử dụng linh hoạt nhất. Phân loại kho dữ liệu như là nền giảm tần suất của đỉnh sử dụng Capacity Unit (CU) từ việc kích thích.

A screenshot of the explore button in the Microsoft Fabric Capacity Metrics app.

Biểu đồ điều tra chi tiết theo điểm thời gian.

A screenshot of the Timepoint drill through graph in the Microsoft Fabric Capacity Metrics app.

Bảng này trong ứng dụng Microsoft Fabric Capacity Metrics cung cấp một cái nhìn chi tiết về việc sử dụng tại các điểm thời gian cụ thể. Lượng dung lượng được cung cấp bởi SKU cụ thể mỗi 30 giây được hiển thị cùng với phân loại của các hoạt động tương tác và nền. Bảng hoạt động tương tác đại diện cho danh sách các hoạt động được thực hiện tại điểm thời gian đó.

Bảng hoạt động nền có thể xuất hiện để hiển thị các hoạt động được thực hiện nhiều trước điểm thời gian đã chọn. Điều này là do các hoạt động nền trải qua quá trình 24 giờ…

Các trường hợp sử dụng hàng đầu cho chế độ xem này bao gồm:

  • Nhận diện người dùng đã lên lịch hoặc thực hiện một thao tác: các giá trị có thể là “[email protected]”, “System” hoặc “Power BI Service”..
    • Các ví dụ về các câu lệnh được tạo ra bởi người dùng bao gồm việc chạy truy vấn T-SQL hoặc hoạt động trong cổng thông tin Fabric, chẳng hạn như trình soạn thảo truy vấn SQL hoặc trình soạn thảo truy vấn trực quan.
    • Các ví dụ về các câu lệnh được tạo ra bởi “System” bao gồm các hoạt động đồng bộ siêu dữ liệu và các nhiệm vụ nền hệ thống khác được chạy để tăng tốc độ thực hiện truy vấn.
  • Xác định trạng thái của một hoạt động: các giá trị có thể là “Success”, “InProgress”, “Cancelled”, “Failure”, “Invalid” hoặc “Rejected”.
    • Trạng thái “Cancelled” đại diện cho các truy vấn bị hủy trước khi hoàn thành..
    • Trạng thái “Rejected” có thể xảy ra do hạn chế tài nguyên.
  • Xác định một hoạt động đã tiêu tốn nhiều tài nguyên: sắp xếp bảng theo Total CU(s) giảm dần để tìm các truy vấn đắt đỏ nhất, sau đó sử dụng Operation Id để xác định duy nhất một hoạt động. Đây là distributed statement ID, có thể được sử dụng trong các công cụ theo dõi khác như dynamic management views (DMVs) để theo dõi toàn diện, chẳng hạn như dist_statement_id trong… sys.dm_exec_requests .

Ví dụ thanh toán

Hãy xem xét truy vấn sau:

SQL

SELECT * FROM Nyctaxi;

Ví dụ cho mục đích trình diễn, giả sử chỉ số thanh toán tích luỹ là 100 CU giây.

Chi phí của truy vấn này là CU giây nhân giá trị mỗi CU. Giả sử trong ví dụ này, giá trị mỗi CU là $0.18/giờ. Một giờ có 3600 giây. Vì vậy, chi phí của truy vấn này sẽ là (100 x 0.18)/3600 = $0.005.

Các con số được sử dụng trong ví dụ này chỉ mang tính chất minh họa và không phải là chỉ số thanh toán thực tế.

Xem xét

Hãy xem xét các sắc thái báo cáo sử dụng sau:

  • Báo cáo chéo cơ sở dữ liệu: Khi một truy vấn T-SQL kết hợp qua nhiều kho (hoặc giữa một Kho và một điểm cuối phân tích SQL), việc sử dụng được báo cáo đối với nguồn tài nguyên nguồn gốc.
  • Truy vấn trên các quan điểm bảng hệ thống và quan điểm quản lý động đều là các truy vấn có tính phải thanh toán.
  • Trường Khoảng thời gian được báo cáo trong Ứng dụng Chỉ số Công suất Vải chỉ nhằm mục đích cung cấp thông tin. Nó phản ánh thời lượng thực thi câu lệnh và có thể không bao gồm toàn bộ thời lượng từ đầu đến cuối để hiển thị kết quả trở lại ứng dụng web như Trình soạn thảo truy vấn SQL.

Nguồn: https://learn.microsoft.com/en-us/fabric/data-warehouse/usage-reporting

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.