口述视频,中国厂商参战楚庄王称霸,樊姬功不可没(116)
⭐发布日期:2024年10月09日 | 来源:橘子娱乐
【澳门一肖一码100%精准一】 |
【4949精准澳门彩最准确的】 |
【949494王中王内部精选】 | 【2024澳门码今晚结果】 | 【7777788888澳门】 | 【新澳精准资料免费提供】 | 【澳门今晚一肖一码】 | 【澳门资料大全正版资料查询2020】 | 【新澳高手论坛资料大全最新】 | 【今天澳门特马开的什么波绝】 |
【新澳精准资料免费提供510期】 | 【新澳门六开彩资料查询】 | 【新澳澳门免费资料网址是什么】 | 【2004新澳门天天开好彩大全】 | 【澳门王中王100%的资料论坛】 | 【今晚澳门特马开什么号码342】 | 【2024澳门天天开好彩资料】 | 【澳门最快最准资料免费手机网站】 |
过去半年,AI生成视频一直被处于断断续续推进状态,口述视频也成为了中国厂商不断入局的一大赛道。
视频也能口述?这个正在奔现。
在OpenAI文生视频大模型Sora发布后,国内企业争相入局,国产文生视频大模型迈入加速阶段。
过去半年,AI 生成视频一直处在断断续续推进的状态。
号称国内首个自研视频大模型的 Vidu,以及后续字节、腾讯等多家国产厂商推出视频生成模型,都在时不时引发外界的关注。
近日,又一国产视频大模型加入战局,快手“可灵”视频生成大模型官网正式上线。
21日,快手可灵大模型发布重磅更新:正式开放图生视频功能,支持将静态图像转化为5秒钟视频,用户可通过提示词文本控制图像中物体的运动;同时推出视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约3分钟视频。
相较此前各家放出的视频大模型以展示视频为主,本次亮相的可灵大模型不但效果对标Sora,且已在快手旗下的快影App开放邀测体验。
据快手方面介绍,可灵大模型为快手AI团队自研,采用Sora相似的技术路线,结合多项自研技术创新,其生成的视频分辨率达1080p,时长最高可达2分钟(帧率30fps),支持自由的宽高比。
此外,官方还宣称,可灵大模型能够生成大幅度的合理运动,并使其符合客观运动规律。
在官方给出的视频范例中,一位宇航员在月球上奔跑,随着镜头慢慢抬升,宇航员的步态和影子都能保持合理恰当。
几乎同时,美图宣布将在7月底上线新品MOKI,该产品基于美图奇想大模型的视频生成能力,可帮助用户生成AI短片。
然而, 也有观点认为,相比一拥而上的大语言模式,视频大模型更慢热,且少了巨头的身影。
为什么会如此?
大厂们不感兴趣吗?
同时,在上一轮大语言模型竞争中,快手和美图的存在感较低。
而在视频大模型赛道,这两家企业最大的优势又是什么?
对此,北京商报记者魏蔚和书乐进行了一番交流,本猴以为:
还在冲刺“高考”的大厂,不会直接进击“博士后”。
做视频,不是一堆图组成PPT,大厂不急于这一块发力,且实用性不强,只是一个肌肉展示。
毕竟,视频生成不是将一堆AI绘图连在一起变成动画片。
除了考虑形象一致、符合描述、光影分割、分镜表现等更多细节外,还有对剧情的理解能力、再创造能力。
这些都需要对视频结构、内容解析、拍摄技巧和叙事手法等多个垂直领域进行深度学习。
其难度远不是聊天、绘画或专精于下棋之类靠数据堆积和用户纠错来完成的。
即使是影视领域的大师也常有败笔,让还处在“高考阶段”的人工智能出片,其难度可想而知。
但快手和美图,则需要秀肌肉,哪怕只是一个秀。
快手也好,美图也罢,在视频大模型赛道上,最大的优势只是他们拥有让人工智能深度学习的丰富“学习资料”。
依靠这些“学习资料”,可以规避一定的版权问题,并且通过多年在视频领域的内容积累、垂直细分和标签标注,都让大模型能够更好地“检索”知识,也让其在算法设计上多少有一定的视频专业素养。
但也仅此而已,在技术上依然缺少在人工智能算法上的原始积累。
此外,视频大模型即使成熟,也很难在影视领域有大的突破。
无论是短剧、广告还是长视频或电影,尽管都会内卷“大片特效”。
但受众最终被吸引的还是内容(从编剧到运镜,以及演员演技)。
这些才是大规模商业变现的关键。
愚以为,视频大模型或许更容易在动画领域找到一些商机。
本文由人人都是产品经理作者【张书乐】,微信公众号:【张书乐】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】 |
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】 |
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】 |
【2024全年资料免费大全】 【新澳天天开奖资料大全】 |
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】 |
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【澳门四不像正版资料大全部】 |
发表评论
白若雁
2秒前:但受众最终被吸引的还是内容(从编剧到运镜,以及演员演技)。
IP:31.74.1.*
妮科尔·洛
8秒前:其难度远不是聊天、绘画或专精于下棋之类靠数据堆积和用户纠错来完成的。
IP:25.72.6.*
张勇手
1秒前:据快手方面介绍,可灵大模型为快手AI团队自研,采用Sora相似的技术路线,结合多项自研技术创新,其生成的视频分辨率达1080p,时长最高可达2分钟(帧率30fps),支持自由的宽高比。
IP:44.82.8.*