人民網日本語版 2024年8月5日(月) 18時30分
拡大
中国独自開発の汎用動画生成大規模言語モデル(LLM)「Vidu」がこのほど全世界に向けてリリースされた。
(1 / 2 枚)
テキストを入力するか画像をアップロードすると、すぐにリアルな動画が生成される。こんなことを可能にした中国独自開発の汎用動画生成大規模言語モデル(LLM)「Vidu」がこのほど全世界に向けてリリースされた。この動画生成LLMは、テキストから動画を生成する機能と画像から動画を生成する機能の二つのコア機能を備え、動画は4秒または8秒の長さを選択することができ、画像の解像度は最高で1080pに達し、4秒の動画を生成するのに30秒しかかからない。新華社が伝えた。
【その他の写真】
Viduは清華大学が北京生数科技と共同で開発したもので、4月に行われた2024年中関村フォーラム年次総会で初めて発表された。清華大学人工知能(AI)研究院副院長で同社首席サイエンティストの朱軍(ジュウ・ジュン)氏は、「Viduで生成される動画は長時間、高一貫性、高ダイナミクスという特徴が備わり、テキストと画像から高解像度の動画を生成することができ、高い流暢性と高ダイナミクスの画像効果を維持することができる。現時点で、Viduは1回当たり最長32秒の動画を生成できる」と説明した。
また、「Viduは実在の物理的世界をシミュレーションすることができ、細部にこだわり複雑かつ物理法則に合ったシーンを生成することもできる。合理的な光と影の効果、人物の細かい表情などを生成でき、深みと複雑さを備えたシュールレアリスティックなコンテンツを生み出すこともできる。SF、西部劇、ロマンス、アニメなど複数タイプの映画について、Viduはそれぞれのスタイルに合った画面を生成でき、煙や霧、まぶしい光など、映画・テレビレベルの視覚効果の画面も生成できる」と説明した。
Viduはダイナミクスの面で、複雑な動的映像を生成することが可能で、大規模で正確なアクションを生成でき、画面の中で遠景、近景、中景、クローズアップなどのレンズの切り替えが可能で、ロングショット、ズーム、トランジションなどの効果も直接生成できるという。
同社によると、テキストからの動画生成機能と画像からの動画生成機能の二つの基本的機能のほか、ユーザーにより多様で個性を表現できる動画の創作体験を提供するため、Viduは「アニメスタイル」と「キャラクター一貫性」の二つの新機能をリリースした。画像からの動画生成セクションで「キャラ一貫性」機能を利用すると、ユーザーは人の画像か自分で設定したキャラクターのイラストをアップロードし、テキストを打ち込み、画像の中のキャラクターを指定して、好みのシーンで好みのアクションをさせることができる。この機能により動画制作プロセスが簡略化され、創作の自由度も増した。
Viduを使用するのに申請の必要はなく、ユーザーはメールアドレスを登録すればすぐに体験できる。Viduの技術的飛躍は開発チームが機械学習(マシンラーニング)とマルチモーダル大規模言語モデルで長年にわたり積み上げてきた成果が土台になっており、その中核技術のアーキテクチャはチームが22年に提起し、その後も独自開発を続けてきたものだ。(提供/人民網日本語版・編集/KS)
この記事のコメントを見る
Record China
2024/7/30
anomado
2024/7/17
2024/7/16
2024/7/12
2024/7/11
ピックアップ
we`re
RecordChina
お問い合わせ
Record China・記事へのご意見・お問い合わせはこちら
業務提携
Record Chinaへの業務提携に関するお問い合わせはこちら
この記事のコメントを見る