|
|
星辰大模型升级多模态视频生成能力 天翼智铃推出30秒长视频动画制作
在六一儿童节来临之际,天翼智铃依托中国电信自研星辰多模态大模型,正式发布“动物大冒险”AI童趣创作平台,该平台实现了30秒级连续动画视频的稳定生成,攻克了行业长期存在的长视频内容一致性难题,标志着国产多模态大模型在端到端视频生成领域取得关键技术突破。
当前主流AI视频生成模型普遍面临“5秒墙”技术瓶颈:超过 5秒的视频生成中,主体一致性不足,常出现角色漂移、场景跳脱、情节断裂等问题,10秒以上视频的内容连贯性更是呈指数级下降,创作者需要进行多次“抽卡”才能获得可用片段,且无法保证整体风格统一。这一核心痛点严重制约了AI视频技术从“碎片化生成”向“完整叙事创作”的演进。 中国电信星辰大模型团队通过构建国内首个端到端长视频生成全链路Pipeline技术栈,实现以动物为主题的30秒级连续视频稳定生成,在叙事完整性、主体一致性、画面流畅度上同步提升,也为后续拓展泛化主题的长视频生成奠定技术基础。 1. 层次化语义剧本生成引擎 基于专用剧本生成模型,采用因果注意力机制和儿童语料微调,根据“动物 - 地点 - 活动”三个关键词,自动编排儿童故事逻辑,生成包含起承转合的多幕式儿童故事结构,通过语义约束解码算法确保故事逻辑自洽、节奏符合儿童认知规律,让视频情节完整、节奏舒适。 2. 时空锚定的主体一致性技术 设计“关键帧—首尾帧”双锚定架构,通过剧本模型精准控制故事转折点,稳定动物主角形象与核心场景,有效解决角色变形和身份丢失问题,实现主体在30秒内的姿态、服饰、表情连续变化。 3. 全局风格统一渲染系统 采用多尺度特征融合技术和时空一致性损失函数,对生成的所有帧进行全局风格校准。自动提取首帧的色彩、光影、材质特征,并将其传递到后续所有帧中,通过多帧融合与画面平滑处理,实现全程画风一致、转场自然,呈现出适配儿童审美的温馨质感。
天翼智铃根据关键词自动生成剧本和分镜画面 这样一段清晰连贯、情节完整、画风精美的“动物大冒险”动画,从构思到成片,全程不用编写脚本、组织分镜、剪辑拼接,AI自动完成全部工序,片刻即成。小朋友只需输入“动物名”、“地点”、“活动”三个关键词,即可一键生成30秒连续流畅的童趣视频。生成的作品不仅可以保存至本地、分享到社交平台,还能一键设置为中国电信视频彩铃,让AI创作成果转化为个性化的通信体验,让爸爸妈妈时刻展现自己孩子的AI作品。
熊猫在竹林寻宝
海豚在海底歌唱 随着人工智能走进日常生活,AI创作成为普通人也能轻松使用的创意方式。此次创新兼具温度与价值,既是天翼智铃送给孩子们的节日礼物,也是中国电信践行云改数转智惠战略的生动体现,充分展现了星辰大模型在多模态领域的技术实力。中国电信将继续坚持基础大模型自研和核心技术自主创新,用科技赋能美好生活。
|
|||||||||||