当前位置: 首页 > 科技观察

宅叔自学AI打造大师级,推特人气

时间:2023-03-18 21:37:17 科技观察

本文经AI新媒体量子比特(公众号ID:QbitAI)授权转载,转载请联系出处。近日,日本宅男佐藤做了一个名为AIGahaku的网站,利用AI生成人像。10天内,用户访问量从0猛增到100万,引爆推特。简单易操作,上传一张人脸照片,即可生成大师头像。比技术更神奇的是佐藤本人,因为他是靠自学AI做出来的,不得不佩服宅男的创造力。佐藤患有阿斯伯格症——也就是俗称的“社交恐惧症”,是名副其实的天才病。一般来说,这类患者在某一领域具有特殊的潜力,但并不适合普通人的生活。当然,佐藤的技能点在AI上。此次让大叔名声大噪的TensorFlow内置的cGAN模型Pix2pix,就是大名鼎鼎的GAN的变种。此次的人像生成技术是在TensorFlow内置的cGAN(ConditionalGenerativeAdversarialNetwork)中由pix2pix模型改造而来。不同于GAN的技术通用性,cGAN更强调在特定场景下的表现。例如,AIGahaku只能针对人脸。如果用户上传猫脸,则无法生成结果。GAN的特点在于损失函数的自计算和自动更新,这使得GAN本身具有与迁移学习相结合的潜力。从近几年的发展路径来看,GAN更多的是作为实现迁移学习提出的目标的手段。迁移学习为应用GAN提供了具体指导。TensorFlow内置的pix2pix是一种基于cGAN的图像到图像的翻译模型。模型本身成熟,可直接调用应用于黑白图像着色、图像风格变化等场景。具体到Uncle的使用上,使用pix2pix模型,Uncle实际上是把模型限制在大师画像的生成上,这也体现了模型本身强大的可扩展性。你如何使用它取决于你。在佐藤的另一作PixelMe中,同样使用了pix2pix技术,但生成的是8bit像素风格的头像,一模多用。当然,实际效果因人而异。毕竟严格来说,大叔是对现有模型进行二次开发,原有的算法和数据结构并没有改变,所以性能和效果都受到了原有模型的限制。宅男的AI进阶之路大叔的身世可以说是错综复杂。大学辍学后,他当过面包师,也参加过护士学校的培训班,但他觉得没有一个适合自己,直到他决定发挥自己的聪明才智,投身于AI事业。然后就去做吧,开始从TensorFlow学习。借助GoogleColab的计算资源,大叔从TensorFlow教程开始学习,但是大叔真的适合做AI,不适合蒸糕点。在学习的过程中,佐藤找到了适合自己的方向。迁移学习和GAN可以更好的实现图像再生。使用不同的图像训练数据集可以学习和生成特定的场景。GAN是一种典型的无监督学习方法。核心原理是让两个神经网络“对抗”,不断优化参数,获得最优结果,自我博弈。这项技术主要应用于计算机视觉领域,这也是佐藤选择GAN的主要原因。感谢谷歌的慷慨解囊,大叔使用的网站服务器和计算资源都比较便宜,一天20左右。大叔表示,在可接受的能力范围内,短期内不会寻求商业化。AIforEveryone之后!走红了,大叔也没飘。他认为这是在做自己感兴趣的事情,而不是为了经济利益。出于对技术的热爱,佐藤开始了自己的AI之路,并在两年后得以在线应用。这种为梦想不懈努力的拼搏精神,真的值得我们学习。毕竟,不是每个人都有勇气自学AI。