Real-Time Analytics trong Microsoft Fabric là một nền tảng phân tích dữ liệu lớn hoàn toàn quản lý được tối ưu hóa cho dữ liệu dạng streaming và dạng chuỗi thời gian. Nó sử dụng một ngôn ngữ truy vấn và công cụ với hiệu suất xuất sắc để tìm kiếm dữ liệu có cấu trúc, một phần có cấu trúc và không có cấu trúc với hiệu suất cao. Real-Time Analytics được tích hợp đầy đủ với toàn bộ bộ sản phẩm của Fabric, cả cho việc tải dữ liệu và các kịch bản hiển thị tiên tiến. Để biết thêm thông tin, xem bài viết này.
Tình huống
Hướng dẫn này dựa trên dữ liệu mẫu dạng luồng gọi là Dữ liệu chuyến đi của New York Yellow Taxi. Bộ dữ liệu này chứa các hồ sơ chuyến đi của các taxi màu vàng ở New York, với các trường ghi lại ngày/giờ đón và trả khách, vị trí đón và trả khách, khoảng cách chuyến đi, cước phí theo chi tiết, loại giá, loại thanh toán và số lượng hành khách được báo cáo bởi tài xế. Dữ liệu này không chứa thông tin vĩ độ và kinh độ, mà sẽ được tải từ một container blob và được kết hợp với dữ liệu luồng gọi trong một bước sau.
Bạn sẽ sử dụng khả năng xử lý luồng và truy vấn của Real-Time Analytics để trả lời các câu hỏi chính về thống kê chuyến đi, nhu cầu taxi ở các quận của New York và các thông tin liên quan, cũng như xây dựng các báo cáo Power BI.
Cụ thể, trong hướng dẫn này, bạn sẽ tìm hiểu thông qua các hướng dẫn này:
- Real-Time Analytics (P1) – Tạo nguồn tài nguyên
- Real-Time Analytics (P2) – Lấy dữ liệu với Eventstream
- Real-Time Analytics (P3) – Lấy dữ liệu lịch sử
- Real-Time Analytics (P4) – Khám phá dữ liệu của bạn với KQL và SQL
- Real-Time Analytics (P5) – Sử dụng các truy vấn KQL nâng cao
- Real-Time Analytics (P6) – Xây dựng báo cáo Power BI
- Real-Time Analytics (P7) – Dọn dẹp tài nguyên
Điều kiện tiên quyết
Để hoàn thành thành công hướng dẫn này, bạn cần có một không gian làm việc có khả năng hỗ trợ Microsoft Fabric.
Nguồn: https://learn.microsoft.com/en-us/fabric/real-time-analytics/tutorial-introduction