豆包旗下视频生成模型VideoWorld现已开源
2025-02-13
填写文字,插入到文章(开头、中间、末尾)!
品玩2月10日讯,据豆包大模型团队官方公众号消息,在北京交通大学和中国科学技术大学的联合研究下,由豆包大模型团队提出的 “VideoWorld” 视频生成实验模型近日正式开源。
填写文字,插入到文章(开头、中间、末尾)!
“VideoWorld” 通过分析和处理大量视频数据,实现了复杂的推理、规划和决策能力。研究团队的实验显示,模型在仅有300M 参数的情况下,便取得了显著的效果。与现有依赖语言或标签数据的模型不同,VideoWorld 能够独立进行知识学习,尤其在折纸、打领结等复杂任务中,能够提供更加直观的学习方式。
为了验证该模型的有效性,研究团队搭建了围棋对战和机器人模拟操控两种实验环境。围棋作为一项高度策略性游戏,可以有效评估模型的规则学习和推理能力,而机器人任务则考察模型在控制和规划方面的表现。在训练阶段,模型通过观看大量视频演示数据,逐步建立起对未来画面的预测能力。
填写文字,插入到文章(开头、中间、末尾)!