Bản nâng cấp mới nhất của OpenAI cho phép người dùng livestream cùng ChatGPT
Tổ chức tạo ra ChatGPT, OpenAI đã công bố mẫu AI mới nhất của mình, GPT-4o, một chatbot AI giống con người và có thể trò chuyện, diễn giải âm thanh và video của người dùng và phản hồi trong thời gian thực.
Một loạt bản demo do công ty phát hành cho thấy GPT-4 Omni đang giúp đỡ người dùng tiềm năng trong những việc như chuẩn bị cho cuộc phỏng vấn bằng cách đảm bảo rằng họ trông chỉnh tề, hay gọi cho đại lý dịch vụ khách hàng để nhận iPhone thay thế.
Các bản demo khác cho thấy nó có thể chia sẻ những câu chuyện cười, dịch một cuộc trò chuyện song ngữ trong thời gian thực, làm trọng tài cho trận đấu oẳn tù tì giữa hai người dùng và trả lời một cách mỉa mai khi được hỏi. Một bản demo thậm chí còn cho thấy ChatGPT phản ứng như thế nào khi được người dùng giới thiệu với chú chó con của mình lần đầu tiên.
"Xin chào, Bowser! Chẳng phải bạn là sinh vật nhỏ bé đáng yêu nhất sao?" chatbot nói.
“Cảm giác giống như AI trong phim; và tôi vẫn hơi ngạc nhiên rằng đó là sự thật, đạt được thời gian phản hồi và khả năng biểu đạt ở cấp độ con người hóa ra lại là một sự thay đổi lớn".
OpenAI cho biết trong một bài đăng trên X gần đây rằng phiên bản đầu vào chỉ có văn bản và hình ảnh đã được ra mắt vào ngày 13 tháng 5, và phiên bản đầy đủ sẽ ra mắt trong vài tuần tới.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
GPT-4o sẽ có sẵn cho cả người dùng ChatGPT trả phí và miễn phí và sẽ có thể truy cập được từ API của ChatGPT.
OpenAI cho biết chữ “o” trong GPT-4o là viết tắt của “omni” nhằm đánh dấu một bước tiến tới các tương tác giữa người dùng và máy tính tự nhiên hơn.
Introducing GPT-4o, our new model which can reason across text, audio, and video in real time.
— Greg Brockman (@gdb) May 13, 2024
It's extremely versatile, fun to play with, and is a step towards a much more natural form of human-computer interaction (and even human-computer-computer interaction): pic.twitter.com/VLG7TJ1JQx
Khả năng xử lý cùng lúc mọi đầu vào văn bản, âm thanh và hình ảnh trong GPT-4o là một tiến bộ đáng kể so với các công cụ AI trước đây của OpenAI, chẳng hạn như ChatGPT-4 thường mất nhiều thông tin khi buộc phải thực hiện đa tác vụ.
OpenAI cho biết “GPT-4o đặc biệt tốt hơn về khả năng hiểu thị giác và âm thanh so với các mẫu hiện có”, thậm chí còn bao gồm cả việc nắm bắt cảm xúc và kiểu thở của người dùng.
Nó cũng “nhanh hơn nhiều” và “rẻ hơn 50%” so với GPT-4 Turbo trong API của OpenAI.
Công cụ AI mới có thể phản hồi với âm thanh đầu vào chỉ trong 2,3 giây, với thời gian trung bình là 3,2 giây, OpenAI tuyên bố chatbot mới có thể phản hồi tương tự như thời gian trả lời con người trong một cuộc trò chuyện thông thường.
VIC Crypto tổng hợp
Tin tức liên quan:
Bitcoin, Ether ETF của Hong Kong xóa sạch 2 tuần dòng tiền dương chỉ trong một ngày
Hoạt động suy giảm đáng kể của giao thức Runes sau Halving
Trump ủng hộ tiền điện tử và gọi Joe Biden là kẻ không biết gì
Biden cấm công ty khai thác tiền điện tử Trung Quốc sở hữu đất gần căn cứ tên lửa Hoa Kỳ
Tổng hợp chi tiết tất cả các quỹ Ethereum ETF đang chờ phán quyết từ SEC