Meta Dạy AI Nói Dối, Lập Chiến Lược

[ad_1]

Meta đã đào tạo một đặc vụ AI để chơi một trò chơi cờ liên quan đến trò chuyện với những người chơi khác để thuyết phục họ ủng hộ các chiến lược của mình — và sau đó phản bội họ.

Công ty sở hữu Facebook, Instagram và WhatsApp cho biết Cicero AI của họ có thể có các ứng dụng rộng rãi trong tương lai gần, bao gồm phát triển trợ lý ảo thông minh hơn với việc sử dụng kết hợp các công nghệ như xử lý ngôn ngữ tự nhiên (NLP) và lập luận chiến lược, theo một báo cáo. bài đăng trên blog do công ty phát hành.

Trong một bài báo nghiên cứu trên tạp chí khoa học Science, Meta cho biết Cicero AI của họ đã đạt được hiệu suất ở cấp độ con người trong trò chơi boardgame chiến lược Diplomacy trong một giải đấu trực tuyến, nơi nó chơi 40 trận đấu với 82 người, xếp hạng trong top 10% những người tham gia chơi nhiều hơn một trò chơi.

Ngoại giao khiến bảy người chơi đấu với nhau để giành quyền kiểm soát bản đồ châu Âu. Mỗi lượt bắt đầu với việc người chơi thương lượng với nhau để hỗ trợ cho kế hoạch của họ và kết thúc bằng việc họ đồng thời cố gắng thực hiện nước đi của mình. Nếu không có sự hỗ trợ của những người chơi khác, nhiều nước đi trong số này sẽ thất bại.

Trò chơi đặt ra một thách thức đối với đặc vụ AI, Meta cho biết, vì chiến thắng đòi hỏi nó phải hiểu liệu đối thủ của mình có đang lừa gạt hoặc lên chiến lược theo một cách nhất định để giành chiến thắng trong trò chơi hay không. AI cần mở rộng mức độ đồng cảm nhất định khi chơi trò chơi để hình thành sự hợp tác với những người chơi khác, điều mà AI không cần phải làm khi chơi các trò chơi như cờ vua với đối thủ là con người.

Các tác nhân AI đã trở nên giỏi hơn trong các trò chơi chiến lược trong những năm qua: Năm 1997, phần mềm Deep Blue của IBM đã đánh bại nhà vô địch cờ vua thế giới Gary Kasparov và vào năm 2016, AlphaGo của DeepMind đã đánh bại kỳ thủ cờ vây hàng đầu Lee Sedol. Facebook cũng đã phát triển một công cụ AI khác có thể vượt qua con người trong Poker.

lý luận chiến lược

Cicero được xây dựng trên hai thành phần công nghệ chính: lý luận chiến lược và xử lý ngôn ngữ tự nhiên (NLP). Các nhà nghiên cứu giải thích, trong khi công cụ suy luận chiến lược dự đoán động thái của những người chơi khác và sử dụng thông tin đó để hình thành chiến lược của riêng mình, thì công cụ xử lý ngôn ngữ tự nhiên tạo ra các thông điệp và phân tích phản hồi trong các cuộc trò chuyện với những người chơi khác để đàm phán và đạt được thỏa thuận.

Để giúp tác nhân AI tạo ra các cuộc trò chuyện có liên quan, các nhà nghiên cứu đã bắt đầu với mô hình tạo ngôn ngữ tự nhiên gồm 2,7 tỷ tham số được đào tạo trước trên văn bản từ internet và tinh chỉnh nó với các cuộc trò chuyện giữa những người chơi là con người trong hơn 40.000 trò chơi từ webDiplomacy.net.

Các nhà nghiên cứu cho biết: “Chúng tôi đã phát triển các kỹ thuật để tự động chú thích các tin nhắn trong dữ liệu đào tạo với các bước di chuyển được lên kế hoạch tương ứng trong trò chơi, để tại thời điểm suy luận, chúng tôi có thể kiểm soát việc tạo đối thoại để thảo luận về các hành động mong muốn cụ thể cho tác nhân và các đối tác hội thoại của nó”. bài viết trên blog.

Meta đã mã nguồn mở cho Cicero để các nhà nghiên cứu khác xây dựng dựa trên khả năng của tác nhân AI.

Ngoài ra, công ty đã tạo ra một cổng thông tin để mời các đề xuất nghiên cứu trong lĩnh vực hợp tác giữa con người và AI thông qua NLP sử dụng Ngoại giao làm khái niệm cốt lõi.

Kế hoạch dài hạn

Các công ty công nghệ lớn, chẳng hạn như Microsoft, Google, Amazon, đang chạy đua với nhau để phát triển các trợ lý ảo độc lập thông minh hơn nhằm hỗ trợ nhiều trường hợp sử dụng kinh doanh, từ trung tâm cuộc gọi đến đại lý AI có thể tiến hành phân tích tình cảm và dạy các kỹ năng mới cho một cá nhân. Thị trường xử lý ngôn ngữ tự nhiên (NLP) toàn cầu, bao gồm các trợ lý như vậy, được dự đoán sẽ tăng từ 26,4 tỷ đô la vào năm 2022 lên 161,8 tỷ đô la vào năm 2029, theo một báo cáo từ Fortune Business Insights.

Các nhà nghiên cứu tại Meta dường như gợi ý rằng sự thành công của Cicero trong lĩnh vực ngoại giao sẽ thay thế khả năng của các trợ lý ảo khác hiện nay, trong một bài đăng trên blog cho biết: “Ví dụ: các trợ lý AI hiện tại có thể hoàn thành các nhiệm vụ trả lời câu hỏi đơn giản, như cho bạn biết thời tiết — nhưng nếu họ có thể tổ chức một cuộc trò chuyện lâu dài với mục tiêu dạy bạn một kỹ năng mới thì sao?”

Đây là một cuộc khai thác tại các công cụ như Google Duplex, Amazon Alexa, Microsoft’s Xiaoice và Apple’s Siri. Nhưng Cicero cũng không thích những cuộc trò chuyện dài hạn, vì lý do của nó hoàn toàn là ngắn hạn. Như các nhà nghiên cứu của Meta đã nói trong bài báo trên Science, “Từ góc độ chiến lược, Cicero lý luận về cuộc đối thoại hoàn toàn dựa trên hành động của người chơi trong lượt hiện tại. Nó không mô hình hóa cách đối thoại của nó có thể ảnh hưởng đến mối quan hệ với những người chơi khác trong suốt quá trình dài hạn của trò chơi.”

dịch vụ cài win online từ xa

[ad_2]