Duyệt qua Fabric Lakehouse Explorer

Trang Lakehouse Explorer hoạt động như trung tâm tập trung cho tất cả các tương tác của bạn trong môi trường Lakehouse. Đây là cổng thông tin của bạn để dễ dàng tải dữ liệu vào Lakehouse, điều hướng qua dữ liệu, xem trước nội dung và thực hiện các công việc liên quan đến dữ liệu khác nhau. Trang này được chia thành ba phần chính: Lakehouse Explorer, Main View và Ribbon.

Lakehouse explorer

Lakehouse Explorer cung cấp một biểu đồ thống nhất, đồ họa về toàn bộ Lakehouse của bạn, mang đến cho người dùng một giao diện trực quan để điều hướng, truy cập và quản lý dữ liệu.

  • Table Section là một biểu diễn thân thiện với người dùng về khu vực được quản lý trong Lakehouse của bạn. Khu vực này thường được tổ chức và quản lý để tạo điều kiện cho việc xử lý và phân tích dữ liệu hiệu quả. Ở đây, bạn sẽ tìm thấy tất cả các bảng của mình, có chúng được tạo tự động hoặc tạo và đăng ký một cách rõ ràng trong metastore. Bạn có thể chọn một bảng để xem trước, kiểm tra cấu trúc của bảng, truy cập các tệp dữ liệu cơ bản và thực hiện các hành động khác liên quan đến dữ liệu của bạn.
  • Unidentified Area là một không gian độc đáo trong khu vực được quản lý của Lakehouse của bạn. Nó hiển thị bất kỳ thư mục hoặc tệp nào hiện có trong khu vực được quản lý mà thiếu các bảng liên quan trong SyMS. Ví dụ, nếu người dùng tải lên các tệp không được hỗ trợ như hình ảnh hoặc tệp âm thanh vào khu vực được quản lý, chúng sẽ không được phát hiện tự động và liên kết với các bảng. Thay vào đó, chúng xuất hiện trong khu vực chưa xác định này. Mục đích chính của phần này là thúc đẩy người dùng để hoặc loại bỏ những tệp này khỏi khu vực được quản lý hoặc chuyển chúng đến Phần Tệp để xử lý tiếp theo.
  • File Section đại diện cho khu vực không được quản lý của Lakehouse của bạn và có thể được coi là một ‘vùng đáp xuống’ cho dữ liệu thô được nhập từ nhiều nguồn. Trước khi dữ liệu này có thể được sử dụng cho phân tích, thường cần thêm xử lý. Trong phần này, bạn có thể điều hướng qua các thư mục, chọn một thư mục để xem trước, tải một thư mục vào một bảng và thực hiện nhiều hành động khác. Đáng chú ý rằng File Section hiển thị đối tượng cấp thư mục một cách độc quyền. Để xem các đối tượng cấp tệp, bạn cần sử dụng khu vực Main View.

Khu vực Main view

Khu vực Main view của trang Lakehouse là nơi mà hầu hết các tương tác dữ liệu diễn ra. Giao diện thay đổi tùy thuộc vào cái bạn chọn. Vì trình duyệt đối tượng chỉ hiển thị một cấp thư mục của hồ, khu vực xem chính là nơi bạn sử dụng để điều hướng qua các tệp, xem trước tệp và bảng, và thực hiện nhiều công việc khác nhau.

Xem trước bảng

Bảng xem trước dữ liệu của chúng tôi được trang bị một bộ tính năng mạnh mẽ, giúp nâng cao trải nghiệm tương tác với dữ liệu của bạn, làm cho công việc với dữ liệu trở nên mượt mà hơn. Dưới đây là một số tính năng quan trọng:

  • Sắp xếp cột theo thứ tự tăng dần hoặc giảm dần chỉ với một cú nhấp chuột đơn giản. Tính năng này mang lại sự kiểm soát đầy đủ về tổ chức dữ liệu của bạn khi làm việc với các mô hình ngữ nghĩa lớn hoặc khi bạn cần nhanh chóng xác định xu hướng.
  • Lọc dữ liệu theo chuỗi con hoặc bằng cách chọn từ danh sách các giá trị có sẵn trong bảng của bạn.
  • Thay đổi kích thước cột để tùy chỉnh chế độ xem dữ liệu theo sở thích của bạn. Tính năng này giúp bạn ưu tiên dữ liệu quan trọng hoặc mở rộng phạm vi nhìn để bao gồm một phạm vi thông tin rộng lớn hơn.

Xem trước tệp

Xem trước các tệp dữ liệu trong một Lakehouse mang lại nhiều lợi ích cải thiện chất lượng dữ liệu, sự hiểu biết và hiệu suất quản lý dữ liệu tổng thể. Nó giúp các chuyên gia dữ liệu ra quyết định có thông tin, tối ưu hóa phân phối tài nguyên và đảm bảo rằng phân tích của họ dựa trên dữ liệu đáng tin cậy và có giá trị. Xem trước có sẵn cho các loại tệp sau: bmp, css, csv, gif, html, jpeg, jpg, js, json, md, mjs, png, ps1, py, svg, ts, tsx, txt, xml, yaml.

Ribbon

Thanh Ribbon của Lakehouse là thanh công cụ truy cập nhanh, cung cấp một cách thuận tiện để thực hiện các nhiệm vụ cần thiết trong Lakehouse của bạn. Từ đây, bạn có thể làm mới Lakehouse, cập nhật cài đặt, tải dữ liệu hoặc tạo các mô hình ngữ nghĩa tùy chỉnh mới một cách dễ dàng.

Các cách khác nhau để tải dữ liệu vào Lakehouse

Có một số cách để tải dữ liệu vào Lakehouse của bạn từ trang explorer:

  • Local file/folder upload: Dễ dàng tải dữ liệu từ máy địa phương trực tiếp vào Phần Tệp của Lakehouse của bạn. Tìm hiểu thêm tại đây.
  • Notebook code: Sử dụng các thư viện Spark có sẵn để kết nối với các nguồn dữ liệu và tải dữ liệu vào các khung dữ liệu, sau đó lưu nó vào Lakehouse của bạn. Tìm thêm thông tin tại đây.
  • Copy tool in pipelines: Kết nối với nhiều nguồn dữ liệu khác nhau và đưa dữ liệu về định dạng ban đầu hoặc chuyển đổi dữ liệu thành bảng Delta. Tìm hiểu thêm tại đây.
  • Dataflows Gen 2: Tạo luồng dữ liệu để nhập dữ liệu, chuyển đổi và xuất bản dữ liệu vào Lakehouse của bạn. Tìm hiểu thêm tại đây.
  • Shortcut: Tạo lối tắt để kết nối với dữ liệu hiện có vào Lakehouse của bạn mà không cần phải sao chép trực tiếp. Tìm thêm thông tin tại đây.
  • Samples: Nhập nhanh dữ liệu mẫu để bắt đầu khám phá các mô hình và bảng ngữ nghĩa.

Khám phá các trường hợp sử dụng khác nhau để hiểu cách tốt nhất.

Truy cập điểm cuối SQL Analytics của Lakehouse

Có thể truy cập điểm cuối SQL analytics trực tiếp từ trải nghiệm Lakehouse bằng cách sử dụng hộp thoảng xuống ở góc phải trên cùng của thanh ribbon. Sử dụng phương thức truy cập nhanh này, bạn sẽ ngay lập tức chuyển đến chế độ t-sql, cho phép bạn làm việc trực tiếp trên các bảng Delta trong hồ để chuẩn bị chúng cho báo cáo.

Nguồn: https://learn.microsoft.com/en-us/fabric/data-engineering/navigate-lakehouse-explorer

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.