Nội dung ngày đầu tiên
Giới thiệu
Chào mừng bạn đến với tuần đầu tiên của khóa học! Hôm nay, chúng ta sẽ xây dựng nền tảng vững chắc về công nghệ tạo video bằng AI.
1. AI tạo sinh (Generative AI) là gì?
AI tạo sinh là một nhánh của trí tuệ nhân tạo có khả năng tạo ra nội dung mới, độc đáo như văn bản, hình ảnh, âm nhạc và video, thay vì chỉ phân tích hoặc xử lý dữ liệu có sẵn. Đối với video, các mô hình này học hỏi từ một lượng lớn dữ liệu video và văn bản để hiểu mối liên hệ giữa mô tả và hình ảnh chuyển động.
2. Công nghệ cốt lõi: Mô hình khuếch tán (Diffusion Models)
Đây là công nghệ đột phá đằng sau hầu hết các trình tạo video AI hiện đại.
- Quá trình xuôi (Forward Process): Bắt đầu với một video rõ nét, mô hình dần dần thêm nhiễu (noise) vào từng khung hình cho đến khi nó trở thành một mớ hỗn độn ngẫu nhiên.
- Quá trình ngược (Reverse Process): Đây là quá trình tạo video. Mô hình học cách đảo ngược quá trình trên: bắt đầu từ nhiễu ngẫu nhiên và một mô tả văn bản (prompt), nó dần dần loại bỏ nhiễu để tái tạo lại một video rõ nét khớp với mô tả.
3. Giới thiệu các 'ông lớn':
- Gemini (Google): Một mô hình đa phương thức (multimodal) mạnh mẽ, không chỉ tạo video mà còn hiểu và xử lý văn bản, hình ảnh, âm thanh. Điểm mạnh là sự tích hợp sâu với hệ sinh thái Google.
- Sora (OpenAI): Gây chấn động thế giới với khả năng tạo ra các video dài (lên đến 1 phút) với độ chân thực và nhất quán đáng kinh ngạc. Sora hiểu sâu về vật lý trong thế giới thực.
- Veo (Google): Đối thủ cạnh tranh trực tiếp với Sora, tập trung vào việc tạo ra các cảnh quay chất lượng cao, đậm chất điện ảnh và cho phép kiểm soát sáng tạo chi tiết hơn.
Bài tập thực hành:
- Xem video demo chính thức của Sora và Veo. Ghi lại 3 điểm khác biệt hoặc ấn tượng nhất của bạn về mỗi mô hình.
- Suy nghĩ về một ý tưởng video ngắn (5-10 giây) mà bạn muốn tạo ra. Viết ra mô tả ý tưởng đó bằng 1-2 câu.
Mục tiêu học tập
Học cách sử dụng các công cụ AI tạo sinh như GeminiGen, Sora 2 và Veo 3 để tạo ra các video không giới hạn và miễn phí.