Nhà phát triển ChatGPT công bố chương trình chuyển văn bản thành video đột phá

(SeaPRwire) – ‘Sora’ có thể tạo ra cảnh phức tạp, nhưng sẽ bị hạn chế trước khi được phát hành chính thức

OpenAI, công ty đứng sau ChatGPT, đã công bố một công cụ mới có thể chuyển đổi văn bản thành video do máy tạo ra. Chương trình sẽ chỉ được phát hành cho công chúng sau khi OpenAI xây dựng các tính năng kiểm duyệt.

Biệt danh “Sora”, chương trình “có thể tạo ra cảnh phức tạp với nhiều nhân vật, loại chuyển động cụ thể, và chi tiết chính xác về chủ thể và nền”, tất cả dựa trên những gợi ý từ người dùng, OpenAI cho biết trong một tuyên bố trên trang web của mình vào thứ Năm.

Sora cũng có thể tạo ra video dựa trên hình ảnh do người dùng gửi lên, hoặc lấy video hiện có và mở rộng chúng với nội dung mới, công ty cho biết.

Trong một loạt bài đăng trên X, OpenAI đã chia sẻ nhiều video do Sora tạo ra, bao gồm một video được tạo từ gợi ý: “Thành phố Tokyo đẹp như tranh vẽ đang sôi động. Camera di chuyển qua đường phố đông đúc của thành phố, theo dõi nhiều người đang tận hưởng thời tiết tuyết rơi đẹp và mua sắm tại các gian hàng gần đó. Những cánh hoa anh đào bay trong gió cùng với những bông tuyết.”

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions.

Prompt: “Beautiful, snowy…

— OpenAI (@OpenAI)

Người sáng lập OpenAI Sam Altman sau đó đã đăng video được gợi ý bởi người theo dõi trên X, bao gồm “Hai chú chó vàng podcast trên đỉnh núi” và một phiên nấu ăn gia đình tự làm gnocchi có vẻ thật của “một bà nội trợ ảnh hưởng truyền thông xã hội”.

OpenAI không nêu rõ khi nào Sora sẽ được phát hành cho công chúng. Công ty cho biết rằng trước tiên nó sẽ được giao cho đội “Red Team” của mình để đảm bảo rằng nó không thể được sử dụng để tạo ra cảnh “bạo lực cực đoan, nội dung tình dục, hình ảnh thù ghét, sự giống hệt người nổi tiếng hoặc sở hữu trí tuệ của người khác.”

Công ty cũng lưu ý rằng công nghệ này vẫn dễ mắc sai lầm và lỗi. “Nó có thể gặp khó khăn trong việc mô phỏng chính xác vật lý của một cảnh phức tạp, và có thể không hiểu cụ thể các trường hợp nguyên nhân và hậu quả. Ví dụ, một người có thể cắn một miếng bánh quy, nhưng sau đó, miếng bánh quy đó có thể không có dấu răng cắn,” OpenAI cho biết trên trang web của mình.

Công nghệ trí tuệ nhân tạo đã cải thiện nhanh chóng trong hai năm qua, với mô hình ngôn ngữ GPT của OpenAI ban đầu chỉ dùng cho chương trình trò chuyện vào cuối năm 2022, nhưng chỉ bốn tháng sau đã đạt điểm số ở phần trăm thứ 93 trong bài kiểm tra đọc hiểu SAT và ở phần trăm thứ 89 trong bài kiểm tra toán học SAT.

Altman trước đây đã thừa nhận rằng anh “hơi sợ” công nghệ tiềm năng của mình. Tuy nhiên, bất chấp việc cấm khách hàng sử dụng OpenAI “để phát triển hoặc sử dụng vũ khí, làm tổn thương người khác hoặc phá hủy tài sản, hoặc tham gia vào các hoạt động không được phép vi phạm an ninh của bất kỳ dịch vụ hoặc hệ thống nào,” tổ chức vẫn công bố vào tháng 1 rằng họ đang hợp tác với quân đội Mỹ trên một số dự án trí tuệ nhân tạo.

OpenAI đã hợp tác với Bộ Quốc phòng sau khi bỏ lệnh cấm trước đó về việc sử dụng công nghệ của mình cho “quân sự và chiến tranh”, giám đốc điều hành của công ty Anna Makanju cho biết tại hội nghị Diễn đàn Kinh tế Thế giới hàng năm ở Davos.

Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.

Lĩnh vực: Tin nổi bật, Tin tức hàng ngày

SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.