Quản lý thư viện trong môi trường Fabric

Môi trường Microsoft Fabric cung cấp cấu hình linh hoạt để chạy các công việc Spark của bạn. Thư viện cung cấp mã có thể tái sử dụng mà các nhà phát triển muốn đưa vào công việc của họ. Ngoại trừ các thư viện tích hợp đi kèm với mỗi thời gian chạy Spark, bạn có thể cài đặt các thư viện công cộng và tùy chỉnh trong môi trường Fabric của mình. Và bạn có thể dễ dàng đính kèm môi trường vào sổ ghi chép của mình và định nghĩa công việc Spark.

Thư viện công cộng

Các thư viện công cộng có nguồn gốc từ các kho lưu trữ như PyPI và Conda mà Fabric hiện đang hỗ trợ.

Ảnh chụp màn hình của môi trường Thư viện công cộng.

Thêm thư viện công cộng mới

Để thêm thư viện công cộng mới, hãy chọn nguồn và chỉ định tên cũng như phiên bản của thư viện. Ngoài ra, bạn có thể tải lên tệp .yml đặc tả môi trường Conda để chỉ định các thư viện công cộng. Nội dung của tệp .yml đã tải lên được trích xuất và thêm vào danh sách.

Ghi chú
Tính năng tự động hoàn thành tên thư viện trong quá trình thêm được giới hạn ở các thư viện phổ biến nhất. Nếu thư viện bạn muốn cài đặt không có trong danh sách đó, bạn sẽ không nhận được lời nhắc tự động hoàn thành. Thay vào đó, hãy tìm kiếm thư viện trực tiếp trong PyPI hoặc Conda bằng cách nhập tên đầy đủ của nó. Nếu tên thư viện hợp lệ, bạn sẽ thấy các phiên bản có sẵn. Nếu tên thư viện không hợp lệ, bạn sẽ nhận được cảnh báo rằng thư viện không tồn tại.

Lọc thư viện công cộng

Nhập từ khóa vào hộp tìm kiếm trên trang Public Libraries, để lọc danh sách thư viện công cộng và tìm thư viện bạn cần.

Xóa thư viện công cộng

Tùy chọn thùng rác cho mỗi thư viện xuất hiện khi bạn di chuột qua hàng tương ứng. Ngoài ra, bạn có thể xóa nhiều thư viện công cộng bằng cách chọn chúng, rồi chọn Delete trên dải băng.

Xem phần phụ thuộc

Mỗi thư viện công cộng có nhiều phụ thuộc khác nhau. Tùy chọn phụ thuộc chế độ xem xuất hiện khi bạn di chuột qua hàng tương ứng.

Xuất sang yaml

Fabric cung cấp tùy chọn xuất danh sách thư viện công cộng đầy đủ sang tệp YAML và tải nó xuống thư mục cục bộ của bạn.

Thư viện tùy chỉnh

Thư viện tùy chỉnh đề cập đến mã do bạn hoặc tổ chức của bạn xây dựng. Fabric hỗ trợ các tệp thư viện tùy chỉnh ở định dạng .whl, .jar và .tar.gz.

Ghi chú
Fabric chỉ hỗ trợ tệp .tar.gz cho ngôn ngữ R. Sử dụng định dạng tệp .whl cho ngôn ngữ Python.
Ảnh chụp màn hình màn hình Thư viện tùy chỉnh của môi trường.

Tải lên thư viện tùy chỉnh

Bạn có thể tải thư viện tùy chỉnh từ thư mục cục bộ của mình lên môi trường Fabric.

Xóa thư viện tùy chỉnh

Tùy chọn thùng rác cho mỗi thư viện xuất hiện khi bạn di chuột vào hàng tương ứng. Ngoài ra, bạn có thể xóa nhiều thư viện tùy chỉnh bằng cách chọn chúng, rồi chọn Delete trên dải băng.

Tải xuống tất cả các thư viện tùy chỉnh

Nếu được nhấp vào, các thư viện tùy chỉnh sẽ tải từng cái một vào thư mục tải xuống mặc định cục bộ của bạn.

Nguồn: https://learn.microsoft.com/en-us/fabric/data-engineering/environment-manage-library

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.