那么多短视频特效,凭什么抖音出的这么火
ccwgpt 2024-11-21 11:37 22 浏览 0 评论
萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI
说到短视频特效,你或许第一时间会想到“抖音特效”。
没错,抖音的特效似乎总是火到出圈,像用一段视频让你“重返三岁”:
又或是1个动作就打破次元壁,PDD也变得眉清目秀:
事实上,与AI相关的特效技术,国内外也有不少APP在做,但运行到手机上后,最出圈的往往还是抖音。
同类特效,背后所用的AI技术其实是接近的,但抖音做出的特效,渲染真实、运行流畅、爆款也更多。
抖音特效常青的秘诀,究竟是什么?
只要5M,效果堪比虚幻引擎
一款特效的创意无法预测,但渲染效果和运算时间却能被打磨到极致。
其中,渲染效果依靠CV(计算机视觉)+CG(计算机图形学)两类算法的提升,而运算时间则依靠模型的优化。
对于计算机来说,CV算法能让它精准地“看懂”一张照片中的内容。小到特效的贴合度、实时跟踪的精度,大到整个图像的分辨率提升、风格改变,都属于CV算法的范畴。
像合成大菠萝这种贴脸特效,或是高清修复老照片,又或是“重返三岁”、“漫画脸”这类整体画风的迁移,都属于CV算法的“职责”所在。
抖音所用的CV算法,基本靠自研。仅CVPR 2021一场顶会,字节跳动合作入选的论文就有14篇,涵盖NAS、图像修复、行为识别等方向,同时在移动目标检测、细粒度图像识别、视频分类等细分领域竞赛中夺冠。
再说CG算法,它能让计算机做出以假乱真的特效效果,结合CV算法贴合到图片或视频上。
像常见的PBR算法,只是渲染“基操”;电影中常用的粒子系统,抖音同样也会用到手机特效上,此外还有透明材质、bloom效果……都更接近真实场景,而不仅仅是2D贴纸。
然而,无论CV算法还是CG算法,往往都是模型越大,做出的渲染效果才会越好。
影视业界甚至流传这样一个说法:“一个1秒钟的顶级特效,用专业渲染算法去实现的话,可能需要连续渲染上50天。”
这样的特效模型,绝对无法符合用户的实时拍摄需求,更别提流畅度。
但据火山引擎技术专家杨辉表示,抖音5MB的渲染特效,就能达到媲美虚幻引擎实现的效果。
没错,为了确保特效运行流畅,抖音的特效模型严格限制在5MB以内,便于用户实时使用。
这5MB,包含模型、贴图、动画、特效和逻辑触发机制……在内的所有文件。
压缩到极致的运算时间背后,是自研渲染引擎+云渲染技术的结合。
渲染工具上,抖音没有选择采用Unity或是虚幻引擎进行特效制作,而是针对短视频和AR,自行研发了轻量级的渲染引擎。
自研引擎着重对短视频拍摄所需的特效算法进行了增强,舍去了部分游戏专属、短视频不需要的特效,保证渲染的效果。
同时,为了让特效用上更好的渲染算法,抖音自研了云渲染技术,将原本要用手机硬件计算的特效,放到服务器端进行计算,再将效果实时传输给用户。
这样原本计算量在GPU级的渲染特效,现在也能在手机上实时完成,带来的效果提升也显而易见。
例如,渲染算法中的粒子系统,只有用GPU计算,才能发挥出更好的效果(烟花特效);相比之下,CPU计算的粒子系统效果要更为单薄(控雨特效):
但前沿的CV+CG算法和自研工具,只是抖音特效的一部分秘诀。之所以能爆款频出,离不开其成熟的产出流程、覆盖场景全面的工业化体系。
火山引擎:技术井喷
一项技术能否常青,取决于它带来的产品能否批量化生产、适用场景是否全面,对于特效也是如此。抖音特效,已然符合这两个条件:
一方面,据抖音与火山引擎联合发布的《抖音特效数据报告》显示,2021上半年,抖音平台平均每天上线超过100个特效爆款,用户平均每5个投稿里,就有1个使用特效。
这意味着,抖音已经具备了流水化生产特效的能力。同时,这些特效的质量,足以让五分之一的投稿使用它们(抖音的日活用户目前已达到6亿)。
这也让特效设计变得更加容易。在抖音将特效变成一个“创意生产线”之前,特效设计师并不是一个“低门槛”职业。据抖音爆款设计师游洋表示,自己原本是一名影视后期,但却成功当上抖音特效师,身边也有越来越多的同行,正在投身这个职业。
另一方面,抖音特效技术的应用场景,早已不止抖音APP,而已经触及到各行各业。
汽车行业,用特效实现的AR看车;美妆行业,用特效进行AR试妆;传统媒体行业,用数字人技术做出虚拟主持人、虚拟客服……
可以预见的是,抖音特效已经不再是原本拍摄短视频时所用的特效,而正逐渐成为一种“创意数字内容”。
出圈的抖音特效,成为字节增长秘诀中,又一块不可或缺的重要版图。
现在,字节跳动将它们全部公开了——以火山引擎的方式。
没错,就像字节管理能力的“井喷”产物飞书一样,字节技术能力的井喷,带来了火山引擎。
作为字节内部曾经使用的技术平台,火山引擎不止“存储”着抖音所有特效背后的算法技术能力,也包含特效从制作、质量把关到落地的所有工程技术。
制作上,为了加快生产速度、降低技术门槛,字节将抖音特效背后的算法技术,变成了各种模块化组件。
例如,抖音将常用CV、CG算法做成组件后,设计师只需要拖动读条、或是按下按键,就能在特效中用上这一功能。
而包括从训练到推理在内的算法生产过程,抖音全都采用自研推理框架和训练平台,确保最适合APP的运行速度。
质量审核上,特效设计会进行效果评级,资格足够才能予以上线;同时字节内部也成立了专门的创新小组,保证算法的前沿和创新性,设计出更多满足设计师需求的组件(顶会论文就有不少出自这里)。
落地上,抖音还会考虑用户体验度、不同场景下客户的定制化需求。
例如,抖音采取了如不同手机性能的分级策略、运行速度优化等技术措施,将系统崩溃率降低至10万分之一。
同时,采用资源下发等技术,确保用户能在不更新软件的情况下,使用新特效;面对不同场景时,抖音特效的也能适应不同分辨率、接口类型和机型。
这一切,和前沿的算法技术一起,共同构成了抖音特效成功的秘诀。
“字节技术没有秘密”
7月28日,火山引擎和抖音联合宣布,将上万抖音同款特效开放给客户。
这意味着字节正在将包括算法、道具资源在内的抖音特效的所有优势,全部对外提供技术服务,让更多人享受这一集大成的结果。
目前,像懂球帝、心心APP等一众企业产品,已经在使用火山引擎作为自己的业务增长技术。
未来,火山引擎也计划进一步引入最新的技术如端云协同和多人互动,来增强用户和客户的特效体验。
可以想见,更精致的特效、互动性更强的技术,都将成为抖音未来的发展方向。
同时,特效技术的发展,也会进一步给各行业带来更多的惊喜。
以影视和游戏行业为例,这两项技术能极大地减轻视频后期制作、降低游戏美术成本。例如在某个角色身上加个马赛克、或是做个智能贴图,都不需要再一帧帧去手动调整,算法自动就能完成这些步骤。
这样公开自己所有的增长技术,字节害怕同行的竞争吗?
杨辉表示,不害怕:
随着时间推移,任何一项新技术的准入门槛,都会越来越低。我们能做的,不是去打价格战,而是去拓展、更新技术,保证自身的竞争力。
这个角度来说,字节跳动的增长技术,确实没有秘密。
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关推荐
- 腾讯开源框架TarsCpp-rpc设计分析-server(二)
-
2Tars协议2.1是什么借用官方说法:TARS编码协议是一种数据编解码规则,它将整形、枚举值、字符串、序列、字典、自定义结构体等数据类型按照一定的规则编码到二进制数据流中。对端接收到二进制数据流...
- 微服务调用为什么用RPC框架,http不更简单吗?
-
简单点,HTTP是协议,RPC是概念!实现RPC可以基于HTTP协议(Feign),TCP协议(Netty),RMI协议(Soap),WebService(XML—RPC)框架。传输过程中,也因为序列...
- go-zero:开箱即用的微服务框架(gin框架微服务)
-
go-zero是一个集成了各种工程实践的Web和rpc框架,它的弹性设计保障了大并发服务端的稳定性,并且已经经过了充分的实战检验。go-zero在设计时遵循了“工具大于约定和文档”的理...
- SOFARPC :高性能、高扩展性、生产级的 Java RPC 框架
-
#暑期创作大赛#SOFARPC是一个高性能、高扩展性、生产级的JavaRPC框架。在蚂蚁金服,SOFARPC已经使用了十多年,已经发展了五代。SOFARPC致力于简化应用程序之间的RPC...
- 自研分布式高性能RPC框架及服务注册中心ApiRegistry实践笔记
-
痛点1.bsf底层依赖springcloud,影响bsf更新springboot新版本和整体最新技术版本升级。2.eureka已经闭源,且框架设计较重,同时引入eureka会自行引入较多sprin...
- Rust语言从入门到精通系列 - Tonic RPC框架入门实战
-
Rust语言是一种系统级语言,被誉为“没有丧失性能的安全语言”。Rust语言的优势在于其内存安全机制,在编译时就能保证程序的内存安全。Tonic模块是Rust语言的一个RPC(RemoteProce...
- 腾讯开源框架TarsCpp-rpc设计分析-client(一)
-
前言Tars是腾讯开源的微服务平台,包含了一个高性能的rpc框架和服务治理平台,TarsCpp是其C++版本。对于以C++为主要开发语言,同时还想深入了解rpc和微服务框架具体实现的同学来说,Tars...
- 设计了一款TPS百万级别的分布式、高性能、可扩展的RPC框架
-
为啥要开发RPC框架事情是这样的,在开发这个RPC框架之前,我花费了不少时间算是对Dubbo框架彻底研究透彻了。冰河在撸透了Dubbo2.x和Dubbo3.x的源码之后,本来想给大家写一个Dubbo源...
- rpc框架使用教程,超级稳定好用,大厂都在使用
-
rpc是什么远程调用协议如何使用导入依赖<dependency><groupId>org.apache.dubbo</groupId><art...
- Layui 框架实战:动态加载 Select 与二级联动全解析
-
在现代Web开发中,下拉选择框(Select)是用户输入数据时不可或缺的组件。很多时候,我们需要的选项并非静态写死在HTML中,而是需要根据业务逻辑从后端动态获取。更有甚者,我们可能需要实现“...
- 15个能为你节省数百小时的前端设计神器,从UI库到文档生成
-
无论你是刚开始开发之旅的新手,还是疲于应付生产期限的资深程序员,有一个真理始终不变:正确的工具能彻底改变你的工作流程。多年来,我测试了数百个开发工具——有些实用,大多数平庸。但有一批免费网站经受住了时...
- Layui与WinForm通用权限管理系统全解析
-
嘿,小伙伴们,今天咱们来聊聊Layui和WinForm这两个框架在通用权限管理系统中的应用。别担心,我会尽量用简单易懂的语言来讲解,保证让大家都能跟上节奏!首先说说Layui。Layui是一个前端UI...
- 纯Python构建精美UI!MonsterUI让前端开发效率飙升
-
“无需CSS知识,告别类名记忆,11行代码实现专业级卡片组件”在传统Web开发中,构建美观界面需要同时掌握HTML、CSS、JavaScript三剑客,开发者不得不在多种语言间频繁切换。即使使用Boo...
- WebTUI:将终端用户界面(TUI)之美带到浏览器的CSS库
-
在当今Web技术飞速发展的时代,界面设计愈发复杂多样。然而,随着现代化工具的广泛使用,一些开发者开始回归极简风格,追求一种简洁而富有韵味的设计。WebTUI正是这样一款CSS库,它将经典的终...
- 人教版二年级下册生字描红汇总(拼音+笔顺+描红),可打印!
-
可定制内容,评论区留言。本次整理的为人教版二年级下册所有生字,共计300个;写字是小学阶段一项重要的基本功训练,把汉字写得正确、工整、美观,可以提高运用汉字这一交际工具的准确性和效率。对小学生进行写字...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 腾讯开源框架TarsCpp-rpc设计分析-server(二)
- 微服务调用为什么用RPC框架,http不更简单吗?
- go-zero:开箱即用的微服务框架(gin框架微服务)
- SOFARPC :高性能、高扩展性、生产级的 Java RPC 框架
- 自研分布式高性能RPC框架及服务注册中心ApiRegistry实践笔记
- Rust语言从入门到精通系列 - Tonic RPC框架入门实战
- 腾讯开源框架TarsCpp-rpc设计分析-client(一)
- 设计了一款TPS百万级别的分布式、高性能、可扩展的RPC框架
- rpc框架使用教程,超级稳定好用,大厂都在使用
- Layui 框架实战:动态加载 Select 与二级联动全解析
- 标签列表
-
- 框架图 (58)
- flask框架 (53)
- quartz框架 (51)
- abp框架 (47)
- jpa框架 (47)
- springmvc框架 (49)
- 分布式事务框架 (65)
- scrapy框架 (56)
- shiro框架 (61)
- 定时任务框架 (56)
- java日志框架 (61)
- JAVA集合框架 (47)
- mfc框架 (52)
- abb框架断路器 (48)
- ui自动化框架 (47)
- beego框架 (52)
- java框架spring (58)
- grpc框架 (65)
- tornado框架 (48)
- 前端框架bootstrap (54)
- ppt框架 (48)
- 内联框架 (52)
- cad怎么画框架 (58)
- ssm框架实现登录注册 (49)
- oracle字符串长度 (48)