Mang dữ liệu của bạn đến OneLake với Lakehouse

Hướng dẫn này là hướng dẫn nhanh để tạo lakehouse và bắt đầu với các phương pháp cơ bản để tương tác với nó. Sau khi hoàn thành hướng dẫn này, bạn sẽ có một Lakehouse được cung cấp bên trong Microsoft Fabric hoạt động trên OneLake.

Tạo một lakehouse

  1. Đăng nhập vào Microsoft Fabric .
  2. Chuyển sang Data Engineering experience bằng cách sử dụng biểu tượng ở góc dưới bên trái trang chủ của bạn.
  3. Chọn Workspaces từ menu bên trái.
  4. Để mở không gian làm việc của bạn, hãy nhập tên của nó vào hộp văn bản tìm kiếm nằm ở trên cùng và chọn nó từ kết quả tìm kiếm.
  5. Ở góc trên bên trái của trang chủ không gian làm việc, chọn New rồi chọn Lakehouse.
  6. Đặt tên cho lakehouse của bạn và chọn Create.
    Ảnh chụp màn hình hiển thị nơi nhập tên hồ mới của bạn.
  7. Một lakehouse mới được tạo và nếu đây là vật phẩm OneLake đầu tiên của bạn thì OneLake sẽ được cung cấp ngầm.

Tại thời điểm này, bạn có một lakehouse chạy trên OneLake. Tiếp theo, thêm một số dữ liệu và bắt đầu tổ chức trong lakehouse của bạn.

Tải dữ liệu vào lakehouse

  1. Trong trình duyệt file ở bên trái, chọn Files rồi chọn New subfolder. Đặt tên cho thư mục con của bạn và chọn Create.
    Ảnh chụp màn hình hiển thị vị trí chọn Thư mục con mới trong menu.
  2. Bạn có thể lặp lại bước này để thêm nhiều thư mục con hơn nếu cần.
  3. Chọn một thư mục và chọn Upload files lên từ danh sách.
  4. Chọn tệp bạn muốn từ máy cục bộ rồi chọn Upload.
    Ảnh chụp màn hình của màn hình tải lên tập tin.
  5. Bây giờ bạn đã thêm dữ liệu vào OneLake. Để thêm dữ liệu hàng loạt hoặc lên lịch tải dữ liệu vào OneLake, hãy sử dụng nút Get data để tạo quy trình.
  6. Chọn biểu tượng More ( … ) cho tệp bạn đã tải lên và chọn Properties từ menu.
    Màn hình Properties hiển thị nhiều chi tiết khác nhau cho tệp, bao gồm URL và đường dẫn Hệ thống tệp Azure Blob (ABFS) để sử dụng với Notebook. Bạn có thể sao chép ABFS vào Sổ tay vải để truy vấn dữ liệu bằng Spark.

Bây giờ bạn đã tạo lakehouse đầu tiên của mình với dữ liệu được lưu trữ trong OneLake.

Nguồn: https://learn.microsoft.com/en-us/fabric/onelake/create-lakehouse-onelake

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.