Vitalik Buterin cho biết GPT-4 của OpenAI hiện tại đã gần như không thể phiên biệt với con người
Thử nghiệm với GPT-4
Theo đồng sáng lập Ethereum Vitalik Buterin, mô hình trí tuệ nhân tạo tổng quát (AI) GPT-4 của OpenAI đã vượt qua bài kiểm tra Turing.
Bài kiểm tra Turing là một tiêu chuẩn dành cho các hệ thống AI nhằm mục đích xác định mức độ giống con người của một mô hình thoại. Thuật ngữ này được đặt ra nhờ nhà toán học nổi tiếng Alan Turing, người đã đề xuất bài kiểm tra này vào năm 1950.
Theo Turing, vào thời điểm đó, một hệ thống AI có khả năng tạo ra văn bản đánh lừa con người rằng họ đang thực sự trò chuyện với một con người khác sẽ chứng tỏ khả năng “suy nghĩ” của trí tuệ nhân tạo.
Gần 75 năm sau, Vitalik Buterin đã giải thích nghiên cứu sơ bộ gần đây của Đại học California San Diego đã chỉ ra rằng mô hình GPT-4 cuối cùng đã vượt qua bài kiểm tra Turing.
Các nhà nghiên cứu tại Đại học California San Diego gần đây đã xuất bản một bài báo có tiêu đề “People cannot distinguish GPT-4 from a human in a Turing test”. Trong đó, họ cho khoảng 500 đối tượng thử nghiệm bao gồm người tương tác với người và thêm mô hình AI trong một thử nghiệm mù để xác định xem liệu họ có thể tìm ra đâu thực sự là máy.
Theo nghiên cứu, những người tham gia đã xác định nhầm rằng GPT-4 là “con người” trong 56% trường hợp. Điều này có nghĩa là cỗ máy thành công đánh lừa con người nghĩ rằng nó là một trong số họ.
Quan điểm của Vitalik Buterin
Theo Buterin, một hệ thống AI có khả năng đánh lừa hơn một nửa số người mà nó tương tác đủ điều kiện vượt qua bài kiểm tra Turing.
Buterin nói thêm:
“Điều đó có nghĩa là khả năng nhận biết nó là con người hay robot về cơ bản chỉ có xác suất 50/50! Không hẳn, theo 2 lần kiểm tra với người và robot thì trong bài người với người có xác suất chính xác 66% so với 54% giữa người với bot, nhưng mức chênh lệch 12% là rất nhỏ; trong bất kỳ bối cảnh thực tế nào về cơ bản được coi bot AI đã vượt qua bài kiểm tra.”
Sau đó,Vitalik cũng nói thêm rằng bài kiểm tra Turing cho đến nay là cột mốc nổi tiếng nhất được xã hội chấp nhận đối với AI. Vì vậy, thật tốt khi nhắc nhở bản thân rằng cột mốc quan trọng này hiện đã được vượt qua.
Bài kiểm tra Turing
Trí tuệ nhân tạo tổng hợp (AGI) và bài kiểm tra Turing không nhất thiết có liên quan với nhau, mặc dù hai thuật ngữ này thường được kết hợp với nhau. Turing đã xây dựng bài kiểm tra dựa trên sự nhạy bén về toán học của mình và dự đoán một kịch bản trong đó AI có thể đánh lừa con người rằng đó là một trong số họ thông qua cuộc trò chuyện.
Cần hiểu rằng bài kiểm tra Turing là một cấu trúc mơ hồ không có chuẩn mực hoặc cơ sở kỹ thuật thực sự. Không có sự đồng thuận khoa học nào về việc liệu máy móc có khả năng “suy nghĩ” như các sinh vật sống hay không hoặc làm thế nào để đo lường được chỉ số đó. Nói một cách đơn giản, AGI hoặc khả năng “suy nghĩ” của AI hiện không thể đo lường hoặc xác định được bởi cộng đồng khoa học kỹ thuật.
Turing đã đưa ra những dự đoán mang tính khái niệm của mình từ rất lâu trước khi các hệ thống trí tuệ nhân tạo dựa trên mã thông báo ra đời và sự ra đời của các mạng đối nghịch tạo sinh, tiền thân của các hệ thống AI tổng quát ngày nay.
Trí tuệ nhân tạo tổng hợp
Vấn đề phức tạp hơn nữa là ý tưởng về AGI (Artificial general intelligence), thường gắn liền với bài kiểm tra Turing. Theo cách nói khoa học, General intelligence hay “Trí tuệ tổng hợp” là thứ có khả năng thực hiện bất kỳ nhiệm vụ nào dựa trên trí thông minh. Những thứ ngăn cản con người, vì chưa có ai thể hiện được khả năng “tổng hợp” tất cả mọi thứ trong phạm vi trí tuệ của con người. Do đó, “Trí tuệ nhân tạo tổng hợp” sẽ có khả năng tư duy vượt xa khả năng tư duy của bất kỳ con người nào trước đây.
Nói như vậy, rõ ràng là GPT-4 không phù hợp với khái niệm “general intelligence” thực sự theo định nghĩa nghiêm ngặt dựa trên khoa học. Tuy nhiên, điều đó không ngăn được cộng đồng AI sử dụng thuật ngữ “AGI” để chỉ bất kỳ hệ thống AI nào có khả năng đánh lừa một số lượng lớn con người.
VIC Crypto tổng hợp
Tin tức liên quan:
Thống đốc FED Bowman mong muốn chính phủ liên bang hợp tác mở rộng không gian stablecoin
Nền tảng cá cược Polymarket gọi vốn thành công 70 triệu USD với sự góp mặt của Vitalik Buretin
Lộ diện hai quỹ tài chính truyền thống nắm giữ số lượng Bitcoin ETF Spot lớn nhất từ trước đến nay
DTCC, Chainlink hoàn thành thử nghiệm token hóa tài sản với nhiều ngân hàng lớn tại Hoa Kỳ
Vanguard bổ nhiệm CEO mới là cựu lãnh đạo Bitcoin ETF từ BlackRock?