据8月27日消息,字节跳动近期开源了代号OMGD的压缩技术。
这是Byte自研的GAN(生成对抗网络)压缩算法。
在保证生成效果不变的前提下,算力消耗可降低至原来的1/46。
与此前业界最好的压缩效果相比,提升了一倍。
据悉,该技术的论文已入选国际计算机视觉大会ICCV。
GAN是人工智能领域重要的深度学习模型。
广泛应用于图像生成、音乐生成、视频生成等,还可以提高图像质量,实现图像风格化、图像着色等任务。
漫画特效等常用道具都是通过GAN实现的。
由于GAN对计算资源和存储空间的巨大需求,很难将模型直接部署到手机、Pad等移动设备上。
业界一直在努力改进 GAN 压缩方法。
2016年,来自MIT、Adobe和上海交通大学的研究人员提出了GAN压缩算法,成功将计算功耗降低到1/21。
字节跳动此次提出的OMGD方法进一步提升了压缩能力。
OMGD(Online Multi-Granularity Distillation)的意思是“在线多粒度蒸馏”。
据字节跳动技术团队的论文称,该算法可以在训练过程中灵活地优化和压缩GAN模型,从而获得更好的图像效果和更少的计算成本。
测试数据表明,OMGD压缩算法在Pix2Pix和CycleGAN这两种常用的GAN解决方案上是有效的。
Pix2Pix和CycleGAN主要用于图像到图像的“翻译”,例如将照片转换为绘画、黑白图片着色等。
OMGD压缩算法可以将其算力消耗降低至1/40和1/46分别是原来的。
目前,OMGD压缩算法已在抖音等产品中实现,为用户提供更丰富的视频创作能力。
相关技术代码也已在开源社区发布,帮助从业者提高GAN的创新和应用效率。
截至目前,字节跳动已开源机器学习平台Klever、联邦学习平台Fedlearner、高性能分布式训练框架BytePS、LightSeq推理训练引擎等重大项目。
节能环保是字节跳动的重要技术研究方向。
在不久前举行的自然语言处理领域国际顶级会议ACL上,字节跳动的词表学习解决方案获得了年度唯一的“最佳论文”奖。
这篇论文也极其节能,相比主流单词表可以节省92%。
计算能力。