Hướng dẫn này là hướng dẫn nhanh để tạo lakehouse và bắt đầu với các phương pháp cơ bản để tương tác với nó. Sau khi hoàn thành hướng dẫn này, bạn sẽ có một Lakehouse được cung cấp bên trong Microsoft Fabric hoạt động trên OneLake.
Tạo một lakehouse
- Đăng nhập vào Microsoft Fabric .
- Chuyển sang Data Engineering experience bằng cách sử dụng biểu tượng ở góc dưới bên trái trang chủ của bạn.
- Chọn Workspaces từ menu bên trái.
- Để mở không gian làm việc của bạn, hãy nhập tên của nó vào hộp văn bản tìm kiếm nằm ở trên cùng và chọn nó từ kết quả tìm kiếm.
- Ở góc trên bên trái của trang chủ không gian làm việc, chọn New rồi chọn Lakehouse.
- Đặt tên cho lakehouse của bạn và chọn Create.
- Một lakehouse mới được tạo và nếu đây là vật phẩm OneLake đầu tiên của bạn thì OneLake sẽ được cung cấp ngầm.
Tại thời điểm này, bạn có một lakehouse chạy trên OneLake. Tiếp theo, thêm một số dữ liệu và bắt đầu tổ chức trong lakehouse của bạn.
Tải dữ liệu vào lakehouse
- Trong trình duyệt file ở bên trái, chọn Files rồi chọn New subfolder. Đặt tên cho thư mục con của bạn và chọn Create.
- Bạn có thể lặp lại bước này để thêm nhiều thư mục con hơn nếu cần.
- Chọn một thư mục và chọn Upload files lên từ danh sách.
- Chọn tệp bạn muốn từ máy cục bộ rồi chọn Upload.
- Bây giờ bạn đã thêm dữ liệu vào OneLake. Để thêm dữ liệu hàng loạt hoặc lên lịch tải dữ liệu vào OneLake, hãy sử dụng nút Get data để tạo quy trình.
- Chọn biểu tượng More ( … ) cho tệp bạn đã tải lên và chọn Properties từ menu.
Màn hình Properties hiển thị nhiều chi tiết khác nhau cho tệp, bao gồm URL và đường dẫn Hệ thống tệp Azure Blob (ABFS) để sử dụng với Notebook. Bạn có thể sao chép ABFS vào Sổ tay vải để truy vấn dữ liệu bằng Spark.
Bây giờ bạn đã tạo lakehouse đầu tiên của mình với dữ liệu được lưu trữ trong OneLake.
Nguồn: https://learn.microsoft.com/en-us/fabric/onelake/create-lakehouse-onelake