Khắc phục sự cố trong Warehouse

Bài viết này cung cấp hướng dẫn về cách khắc phục các vấn đề phổ biến trong Warehouse trên Microsoft Fabric.

Lỗi kết nối tạm thời

Một lỗi tạm thời, còn được gọi là lỗi tạm, có nguyên nhân cơ bản mà sớm sẽ tự giải quyết. Nếu kết nối đến Warehouse trước đây hoạt động tốt nhưng bắt đầu gặp sự cố mà không có sự thay đổi về quyền người dùng, chính sách tường lửa và cấu hình mạng, hãy thử các bước sau trước khi liên hệ hỗ trợ:

  1. Kiểm tra trạng thái của Warehouse và đảm bảo nó không tạm dừng .
  2. Đừng thử lại lệnh không thành công ngay lập tức. Thay vào đó, đợi từ 5 đến 10 phút, thiết lập một kết nối mới, sau đó thử lại lệnh. Đôi khi hệ thống Azure nhanh chóng chuyển tài nguyên phần cứng để cân bằng tải tốt hơn cho các tải công việc khác nhau. Hầu hết các sự kiện cấu hình lại này hoàn thành trong ít hơn 60 giây. Trong khoảng thời gian cấu hình lại này, bạn có thể gặp vấn đề khi kết nối đến cơ sở dữ liệu của bạn. Kết nối cũng có thể thất bại khi dịch vụ được khởi động lại tự động để giải quyết một số vấn đề cụ thể.
  3. Kết nối sử dụng một ứng dụng khác và/hoặc từ máy khác.

Lỗi truy vấn do vấn đề không gian tempdb

Tempdb là một cơ sở dữ liệu hệ thống được sử dụng bởi engine cho các nhu cầu lưu trữ tạm thời khác nhau trong quá trình thực thi truy vấn. Người dùng không thể truy cập hoặc cấu hình nó. Truy vấn có thể thất bại do tempdb hết không gian. Thực hiện những bước sau để giảm việc sử dụng không gian của tempdb:

  1. Tham khảo bài viết về số liệu thống kê để xác minh số liệu thống kê cột phù hợp đã được tạo trên tất cả các bảng.
  2. Đảm bảo tất cả các thống kê bảng được cập nhật sau các giao dịch DML lớn.
  3. Các truy vấn có các JOIN phức tạp, GROUP BY, và ORDER BY và dự kiến trả về một tập kết quả lớn sẽ sử dụng nhiều không gian tempdb hơn trong quá trình thực thi. Cập nhật truy vấn để giảm số lượng cột GROUP BY và ORDER BY nếu có thể.
  4. Chạy lại truy vấn khi không có truy vấn nào khác đang chạy để tránh hạn chế tài nguyên trong quá trình thực thi truy vấn.

Hiệu suất truy vấn dường như suy giảm theo thời gian

Nhiều yếu tố có thể ảnh hưởng đến hiệu suất của một truy vấn, chẳng hạn như sự thay đổi trong kích thước bảng, sự chệch lệch dữ liệu, đồng thời làm việc, tài nguyên có sẵn, mạng, v.v. Chỉ vì một truy vấn chạy chậm không nhất thiết có nghĩa là có vấn đề về hiệu suất truy vấn. Hãy thực hiện các bước sau để điều tra truy vấn cụ thể:

  1. Nhận diện sự khác biệt trong tất cả các yếu tố ảnh hưởng đến hiệu suất giữa các kịch bản chạy tốt và chạy kém.
  2. Tham khảo bài viết về số liệu thống kê để xác minh rằng thống kê cột đã được tạo đúng trên tất cả các bảng.
  3. Đảm bảo tất cả số liệu thống kê trong bảng được cập nhật sau các giao dịch DML lớn.
  4. Kiểm tra độ lệch dữ liệu trong các bảng cơ sở.
  5. Tạm dừng và tiếp tục dịch vụ. Sau đó, chạy lại truy vấn khi không có truy vấn hiện hoạt nào khác đang chạy. Bạn có thể giám sát khối lượng công việc của kho bằng DMV.

Truy vấn thất bại sau khi chạy trong thời gian dài. Không có dữ liệu được trả về cho máy khách.

Câu lệnh SELECT có thể đã hoàn thành thành công ở phía máy chủ và thất bại khi cố gắng trả kết quả truy vấn về cho máy khách. Hãy thử theo các bước sau để cô lập vấn đề:

  1. Sử dụng các công cụ máy khách khác nhau để chạy lại cùng một truy vấn.
  2. Nếu bước 1 thất bại, hãy chạy một lệnh CTAS với câu lệnh SELECT gặp sự cố để gửi kết quả truy vấn SELECT đó đến một bảng khác trong cùng kho dữ liệu. Việc sử dụng CTAS tránh việc kết quả truy vấn được gửi trở lại máy khách. Nếu lệnh CTAS hoàn thành thành công và bảng đích được điền đầy đủ, thì khả năng lỗi ban đầu của truy vấn có thể xuất phát từ vấn đề trước mặt kho dữ liệu hoặc các vấn đề liên quan đến máy khách.

Những điều cần thu thập trước khi liên hệ với bộ phận hỗ trợ của Microsoft

  • Cung cấp Workspace ID của Kho dữ liệu.
  • Cung cấp Statement ID và Distributed request ID. Chúng được trả về dưới dạng thông báo sau khi truy vấn hoàn thành hoặc thất bại.
  • Cung cấp văn bản chính xác của thông báo lỗi.
  • Cung cấp thời gian khi truy vấn hoàn thành hoặc thất bại.

Nguồn: https://learn.microsoft.com/en-us/fabric/data-warehouse/troubleshoot-synapse-data-warehouse

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.