Data Factory – Di chuyển dữ liệu từ Azure SQL DB vào Lakehouse thông qua trợ lý sao chép

Hướng dẫn này mô tả các bước để di chuyển dữ liệu vào Lakehouse.

Hai cách tiếp cận được cung cấp bằng cách sử dụng trợ lý sao chép:

  1. Cách tiếp cận đầu tiên di chuyển dữ liệu nguồn vào bảng đích với định dạng delta.
  2. Cách tiếp cận thứ hai di chuyển dữ liệu nguồn vào tệp đích.

Điều kiện tiên quyết

Để bắt đầu, bạn phải hoàn thành các điều kiện tiên quyết sau:

Di chuyển tệp vào Lakehouse dưới dạng bảng ở định dạng delta thông qua trợ lý sao chép

Hãy làm theo các bước sau để thiết lập hoạt động sao chép của bạn.

Bước 1: Bắt đầu với trợ lý sao chép

  1. Mở đường dẫn dữ liệu hiện có hoặc tạo đường dẫn dữ liệu mới.
  2. Chọn Copy data trên khung vẽ để mở công cụ Copy Assistant để bắt đầu. Hoặc chọn Use copy assistant từ danh sách thả xuống Copy data trong tab Activities trên dải băng.
Screenshot showing the two places you can access the copy assistant.

Bước 2: Cấu hình nguồn dữ liệu

1. Chọn nguồn dữ liệu của bạn bằng cách chọn loại nguồn dữ liệu. Trong hướng dẫn này, chúng tôi sẽ sử dụng Cơ sở dữ liệu Azure SQL làm ví dụ. Cuộn xuống trên màn hình Choose data source để tìm và chọn Azure SQL Database rồi chọn Next.

Screenshot showing where to choose your data source in the Copy data screen.

2. Tạo kết nối với nguồn dữ liệu của bạn bằng cách chọn New Connection và điền thông tin kết nối được yêu cầu trên bảng điều khiển.

Screenshot showing where to select New connection.

Sau khi bạn điền các thông tin kết nối được yêu cầu trên bảng, chọn Next.
Khi kết nối của bạn được tạo thành công, bạn sẽ thấy danh sách các bảng bạn có thể chọn.

Screenshot showing where to refresh your connection information.

3. Chọn bảng cần di chuyển. Sau đó, chọn Next

Bước 3: Cấu hình điểm đến

1. Chọn Lakehouse làm điểm đến rồi đi tiếp.

Screenshot showing where to select your copy destination.

Chọn trực tiếp Lakehouse hiện tại của bạn từ không gian làm việc hiện tại rồi chuyển sang phần tiếp theo.
2. Định cấu hình cài đặt bảng của bạn trong Lakehouse. Chọn Tables trong Root folder và chỉ định table name. Chọn Next để tiếp tục.

Screenshot of where to select your table destination.

3. Chọn OK để hoàn tất trải nghiệm trợ lý.

Screenshot showing where to select ok on the Review and create screen.

Bước 4: Lưu đường dẫn dữ liệu của bạn và chạy nó để tải dữ liệu

1. Chọn Save. Sau đó chọn Run

Screenshot showing where to select Run.

2. Chọn biểu tượng glasses để xem chi tiết cho từng lần chạy hoạt động sao chép:

Screenshot showing where to select the glasses icon and the resulting detail screen.

Bước 5: Xem bảng của bạn từ Lakehouse

1. Đi tới Lakehouse của bạn và làm mới Lake view của bạn để xem dữ liệu mới nhất được nhập.

2. Chuyển sang Table view để xem dữ liệu trong bảng.
Ảnh chụp màn hình hiển thị vị trí chuyển sang chế độ xem Bảng.

Ghi chú
Hiện tại dữ liệu được đưa vào các thư mục Lakehouse Tables (khu vực được quản lý) chỉ ở định dạng Delta. Những tệp đó sẽ được tự động đăng ký dưới dạng bảng và hiển thị trong Chế độ xem bảng từ cổng thông tin Lakehouse. Chỉ các thư mục lớp đầu tiên trong Bảng mới được đăng ký dưới dạng bảng delta. Tính năng duyệt hoặc xem trước từ bảng Lakehouse chưa được hỗ trợ. Dữ liệu được tải vào cùng một bảng sẽ được thêm vào. Xóa hoặc Cập nhật vào bảng chưa được hỗ trợ.

Nguồn: https://learn.microsoft.com/en-us/fabric/data-factory/tutorial-move-data-lakehouse-copy-assistant

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.