Hour One联合创始人兼首席技术官Lior Hakim——访谈系列
Hour One联合创始人兼首席技术官Lior Hakim——访谈系列' can be condensed to Lior Hakim, Co-founder and CTO of Hour One - Interview Series
利奥尔·哈基姆(Lior Hakim)是Hour One的联合创始人和首席技术官,Hour One是专业视频通信中虚拟人物制作的行业领先者。这些栩栩如生的虚拟角色完全依据真实人物建模,通过文本传递人类般的表达能力,使企业能够轻松扩展其信息传达的能力和规模。
你能分享一下Hour One的起源故事吗?
Hour One的起源可以追溯到我在加密领域的参与。在那之后,我开始思考云计算可以利用的下一个大趋势是什么,由于机器学习在推荐和预测分析中越来越受欢迎,我当时正在进行一些与机器学习基础设施相关的项目。通过这项工作,我熟悉了早期的生成作品,当时我对生成对抗网络(GANs)特别感兴趣。我利用所有可以得到的计算资源来测试那些当时还很新的技术。当我向一位在该领域拥有公司的朋友展示我的成果时,他告诉我一定要见见奥伦。当我问为什么时,他告诉我也许我们两个都不会再浪费他的时间,而是互相浪费彼此的时间。奥伦是我的联合创始人兼Hour One的首席执行官,他当时是人工智能的早期投资者。尽管我们站在不同的地方,但我们都朝着同一个方向前进,Hour One的创立成为虚拟人类的家是一个不可避免的旅程。
使用了哪些机器学习算法,生成 AI 在整个过程中的作用是什么?
在视频创作领域,机器学习算法在每个阶段都起到重要作用。在剧本阶段,大型语言模型(LLMs)提供宝贵的支持,通过精心制作或完善内容来确保引人入胜的叙事。当我们进入音频阶段时,文本到语音(TTS)算法将文本转化为有机、富有感情的声音。在视觉呈现方面,我们独有的多模态虚拟人基础模型成为核心。该模型结合了生成对抗网络(GANs)和变分自编码器(VAEs),能够传达情境情感、语音表达和生动、吸引人、真实的交流。这些生成技术将文本和音频线索转化为栩栩如生的虚拟人视觉效果,从而产生超逼真的视频输出。LLMs、TTS、GANs、VAEs和我们的多模态模型的协同作用使得生成 AI 不仅是一个部分,而且是现代视频制作的支柱。
Hour One 如何与其他视频生成器区别开来?
在Hour One,我们与其他视频生成器的区别不是源于对竞争的关注,而是源于我们对质量、产品设计和市场策略的根深蒂固的理念。我们的指导原则是始终优先考虑人的因素,确保我们的创作具有真实性和情感共鸣。我们自豪地提供行业最高质量的产品,毫不妥协。通过利用先进的3D视频渲染技术,我们为用户提供真正的电影体验。此外,我们的策略独具观点;我们从一个完善的产品开始,然后快速迭代,追求完美。这种方法确保我们的产品始终处于领先地位,为视频生成设立新的基准。
作为 GPU 领域的专家,你能和我们分享一下你对 NVIDIA 下一代 GH200 Grace Hopper 超级芯片平台的看法吗?
Grace Hopper 架构确实是一个改变游戏规则的技术。如果 GPU 能够有效地使用主机的内存而不完全限制计算,它将在训练过程中打破目前不可能的模型/加速器比例,从而在训练工作规模上实现更大的灵活性。假设 GH200 的全部库存不会被 LLM 训练所吞噬,我们希望能够利用它大大降低我们的多模态架构的原型成本。
目前还有其他芯片吸引了你的注意吗?
我们的主要目标是为用户提供具有价格竞争力的视频内容。考虑到目前对大容量显存 GPU 的需求,我们不断优化并尝试使用各大云服务提供商的任何 GPU 云服务。此外,我们努力在某些工作负载上至少部分独立于平台。因此,我们正在关注 TPU 和其他 ASIC,并密切关注 AMD。最终,任何能够提高 FLOPs/$ 比率的硬件优化路线都将得到探索。
你对视频生成领域的未来发展有什么愿景?
在24个月内,我们将无法区分生成的人类和真实捕捉的人类。这将会改变很多事情,而我们正处于这些进展的前沿。
目前大多数生成的视频都是为计算机和移动设备设计的,我们在实现逼真的生成化身和世界进而用于增强现实和虚拟现实之前需要做哪些改变?
目前,我们具备了为增强现实(AR)和虚拟现实(VR)生成逼真化身和世界的能力。主要障碍是延迟问题。尽管将高质量实时图形传递到AR和VR头戴设备等边缘设备至关重要,但实现无缝传输取决于几个因素。首先,我们依赖于芯片制造技术的进步,以确保更快速和更高效的处理。与此同时,优化功耗对于确保更长时间的使用而不影响体验至关重要。最后,我们预期能够高效地填补生成和实时渲染之间的差距的软件突破。随着这些要素的融合,我们将看到在AR和VR平台上使用逼真化身和环境的激增。
你认为人工智能领域的下一个重大突破会是什么?
当谈到人工智能领域的下一个重大突破时,总是充满了兴奋和期待。虽然我之前提到了一些进展,但我可以分享的是,我们目前正在积极开展几项突破性的创新工作。我很愿意深入了解细节,但目前我鼓励大家密切关注我们即将发布的新产品。人工智能的未来充满了巨大的潜力,我们很高兴能够处于这些开拓性努力的前沿。敬请期待!
关于Hour One,您还有什么其他想分享的吗?
您绝对应该查看我们在Hour One平台上新增的Discord频道和API。