Sora

Sora는 OpenAI가 선보인 혁신적인 AI 비디오 생성 모델로, 사용자의 텍스트 지시를 바탕으로 최대 1분 길이의 고품질 비디오를 생성할 수 있습니다. 이 모델은 물리적 세계를 이해하고 시뮬레이션하는 능력을 갖추고 있어, 사용자가 상상하는 다양한 장면을 사실적으로 재현합니다. 예를 들어, 도쿄의 네온 불빛이 가득한 거리를 걷는 스타일리시한 여성의 모습부터, 눈 덮인 초원을 걷는 거대한 매머드의 장면까지, Sora는 복잡한 장면과 다수의 캐릭터, 특정 유형의 움직임을 정확하게 표현할 수 있습니다.

Sora는 언어에 대한 깊은 이해를 바탕으로 사용자의 프롬프트를 정확히 해석하고, 생동감 있는 캐릭터와 감정을 표현합니다. 또한, 단일 생성 비디오 내에서 여러 샷을 생성하며, 캐릭터와 시각적 스타일을 일관되게 유지합니다. 이 모델은 확산 모델(diffusion model)을 기반으로 하며, 정적 노이즈처럼 보이는 비디오에서 시작해 여러 단계에 걸쳐 노이즈를 제거함으로써 비디오를 생성합니다.

현재 Sora는 물리적 시뮬레이션, 공간적 세부 사항, 시간에 따른 사건의 정확한 묘사 등에서 개선의 여지가 있습니다. OpenAI는 Sora를 출시하기 전에, 오용 가능성을 평가하기 위해 레드 팀과 협력하고 있으며, 생성된 비디오가 사용 정책을 준수하는지 확인하기 위한 도구를 개발 중입니다. Sora는 창의적인 전문가들에게 유용한 도구가 될 것으로 기대되며, OpenAI는 이 기술의 긍정적인 활용 사례를 모색하기 위해 전 세계의 정책 결정자, 교육자, 예술가들과 협력할 계획입니다.