Khả năng mới của GPT-3: Chỉnh sửa và chèn

Chúng tôi đã phát hành phiên bản GPT-3 và Codex mới có thể chỉnh sửa hoặc chèn nội dung vào văn bản hiện có thay vì chỉ hoàn thành văn bản hiện có.

Chúng tôi đã phát hành phiên bản GPT-3 và Codex mới  có thể chỉnh sửa hoặc chèn nội dung vào văn bản hiện có thay vì chỉ hoàn thành văn bản hiện có. Những khả năng mới này giúp việc sử dụng API OpenAI để sửa đổi nội dung hiện có trở nên thiết thực hơn, chẳng hạn như viết lại một đoạn văn bản hoặc tái cấu trúc mã. Điều này mở ra các trường hợp sử dụng mới và cải thiện những trường hợp sử dụng hiện có; ví dụ: tính năng chèn đã được thử nghiệm trong  GitHub Copilot với những kết quả ban đầu đầy hứa hẹn.

Đọc tài liệu chỉnh sửa

Đọc tài liệu chèn

GPT-3 và Codex theo truyền thống đã thêm văn bản vào cuối nội dung hiện có, dựa trên văn bản có trước đó. Cho dù làm việc với văn bản hay mã, việc viết không chỉ là việc thêm vào—đó là một quá trình lặp đi lặp lại trong đó văn bản hiện có được sửa đổi. GPT-3 và Codex hiện có thể chỉnh sửa văn bản, thay đổi nội dung hiện có hoặc thêm văn bản vào giữa nội dung.

Chèn vào giữa văn bản

Khả năng chèn mới thêm văn bản có liên quan theo ngữ cảnh vào giữa nội dung hiện có. Việc cung cấp bối cảnh trong tương lai cho mô hình có thể cải thiện chất lượng hoàn thiện cho các ứng dụng như viết văn bản dài, chuyển đổi giữa các đoạn văn, theo dàn ý hoặc hướng dẫn mô hình đến phần kết thúc.

Phần 1. Lễ tốt nghiệp cấp 3

Hôm nay là ngày trọng đại! ___

Trong ví dụ trên, mục đích là điền văn bản vào giữa hai tiêu đề phần của dàn bài. Nếu không có bối cảnh của các phần trong tương lai, mô hình sẽ tạo ra phần hoàn thiện không liên quan đến phần thứ hai. Khi bối cảnh của các phần trong tương lai được tính đến, mô hình sẽ tạo ra sự hoàn thiện gắn kết hai phần lại với nhau.

Insert đặc biệt hữu ích cho việc viết mã. Trên thực tế, Codex là động lực ban đầu của chúng tôi để phát triển khả năng này, vì trong quá trình phát triển phần mềm, chúng tôi thường thêm mã vào giữa tệp hiện có, nơi mã xuất hiện trước và sau khi hoàn thành. Trong ví dụ trên, mô hình hoàn thành thành công chức năng còn thiếu  prunetrong khi kết nối với mã đã được viết. Chúng tôi cũng thêm chuỗi tài liệu và nội dung nhập bị thiếu, điều này không thể thực hiện được nếu không biết mã theo sau. Trong GitHub Copilot, Insert hiện đang được thử nghiệm với những kết quả ban đầu đầy hứa hẹn.

Khả năng chèn hiện có sẵn trong API ở phiên bản beta, như một phần của điểm cuối hoàn thành và thông qua giao diện mới trong Playground. Khả năng này có thể được sử dụng với các phiên bản mới nhất của GPT-3 và Codex,  text-davinci-002 cũng như  code-davinci-002. Giá cả giống như các phiên bản trước của Davinci.

Chỉnh sửa văn bản hiện có

Một phần có ý nghĩa của việc viết văn bản và mã là dành để chỉnh sửa nội dung hiện có. Chúng tôi đã phát hành một điểm cuối mới trong phiên bản beta có tên là các chỉnh sửa  giúp thay đổi văn bản hiện có thông qua hướng dẫn thay vì hoàn thành nó.

Việc chỉnh sửa hoạt động bằng cách chỉ định văn bản hiện có dưới dạng lời nhắc và hướng dẫn cách sửa đổi nó. Điểm cuối chỉnh sửa có thể được sử dụng để thay đổi giọng điệu hoặc cấu trúc của văn bản hoặc thực hiện các thay đổi có chủ đích như sửa lỗi chính tả. Chúng tôi cũng nhận thấy các chỉnh sửa hoạt động tốt trên các lời nhắc trống, do đó cho phép tạo văn bản tương tự như  điểm cuối hoàn thành. Trong ví dụ trên, chúng tôi sử dụng các chỉnh sửa để (1) thêm bài thơ, (2) đổi bài thơ sang ngôi thứ nhất, (3) chuyển bài thơ thành một chữ cái, có lời chào và chữ ký phù hợp.

Điểm cuối chỉnh sửa đặc biệt hữu ích cho việc viết mã. Nó hoạt động tốt cho các tác vụ như tái cấu trúc, thêm tài liệu, dịch giữa các ngôn ngữ lập trình và thay đổi phong cách mã hóa. Ví dụ trên bắt đầu bằng dữ liệu đầu vào JSON chứa các thành phố được xếp hạng theo dân số. Với lần chỉnh sửa đầu tiên của chúng tôi, Codex sẽ xóa trường xếp hạng khỏi JSON và thay đổi các chữ viết tắt của trạng thái thành tên đầy đủ. Chỉnh sửa thứ hai chuyển đổi tệp JSON thành YAML được trả về từ một hàm.

Tính năng chỉnh sửa có sẵn dưới dạng điểm cuối chuyên dụng trong API và thông qua giao diện mới trong Playground. Nó được hỗ trợ bởi các mô hình  text-davinci-edit-001 và  code-davinci-edit-001. Điểm cuối chỉnh sửa hiện được sử dụng miễn phí và có sẵn công khai dưới dạng beta.

Nguồn: https://openai.com/blog/gpt-3-edit-insert

spot_img

More from this stream

Recomended

Cập Nhật Google Analytics Quý 2/2024

Bài viết này cung cấp thông tin về các bản phát hành mới nhất trong Google Analytics trong quý 2 năm 2024.

[GA4] – Hiểu rõ về nguồn dữ liệu

Một nguồn dữ liệu là một nơi chứa dữ liệu bạn tải lên Analytics, bao gồm cơ sở dữ liệu, dịch vụ, hoặc tệp CSV bạn tải lên và một ánh xạ của các trường dữ liệu Analytics với các trường trong cơ sở dữ liệu, dịch vụ hoặc CSV bên ngoài của bạn.

Segment là gì?

Segment là một traditional Customer Data Platform (CDP) chuyên về việc thu thập sự kiện và kích hoạt dữ liệu.

Composable CDP là gì?

Composable CDP là một lớp kích hoạt cho phép bạn tạo ra đối tượng khán giả, điều phối hành trình, và gửi dữ liệu hiện tại của bạn đến các công cụ tiếp thị hàng đầu của bạn.

Traditional CDP và Composable CDP

Việc áp dụng rộng rãi của hệ thống lưu trữ dữ liệu đám mây đã cách mạng hóa không gian Customer Data Platform (CDP), dẫn đến sự xuất hiện của một kiến trúc CDP mạnh mẽ hơn, nguyên gốc từ hệ thống lưu trữ dữ liệu đám mây được biết đến là Composable CDP.

Customer Data Platform (CDP) là gì?

Một Customer Data Platform, hay CDP, là một giải pháp hoặc kiến trúc cho phép bạn thu thập, lưu trữ, mô hình hóa và kích hoạt dữ liệu khách hàng của bạn.