Internet

观看并哭泣(或微笑):Synthesia的AI视频头像现在具有情感

生成式人工智能通过从口头提示中创建 elabor 而逼真的文本和图像而引起了公众的想象。但问题是 —— 往往存在问题的是,当你仔细观察时,结果往往远非完美。

人们指出奇怪的手指,地板平铺消失,数学问题确实是问题:有时它们无法加起来。

现在,Synthesia —— 一个雄心勃勃的人工智能初创公司,专门从事视频领域,特别是为企业用户设计的定制头像,用于创建推广、培训和其他企业视频内容 —— 推出了一项更新,希望借此超越其独特领域的一些挑战。其最新版本具有头像 —— 基于他们工作室捕获的实际人类构建 —— 在输入文本以生成视频时,提供更多情感、更好的嘴唇跟踪,以及更具表现力的自然和人类动作。

这一发布紧随该公司迄今为止取得的一些令人印象深刻的进展。与 OpenAI 等其他生成式人工智能参与者不同,后者采取了两手策略 —— 通过 ChatGPT 等消费者工具大规模提高公众意识,同时构建 B2B 提供,其 API 被独立开发者以及巨大企业使用 —— Synthesia 正致力于追随其他突出的人工智能初创公司应对的方法。

类似于 Perplexity 聚焦于真正擅长生成式人工智能搜索一样,Synthesia 专注于真正擅长如何构建最类似人类的生成式视频头像。更具体地说,它正在为企业市场和培训、营销等用例进行尝试。

这种关注帮助 Synthesia 在变得非常拥挤的人工智能市场中脱颖而出,当炒作落定至更长期的关注点如 ARR、单元经济和与人工智能实施相关的运营成本时,该市场存在着商品化的风险。

Synthesia 将其新的 Expressive Avatars 描述为首创之作:“全球首个完全由人工智能生成的头像。” Synthesia 表示,这是基于大型预训练模型构建的,其突破在于如何将它们结合起来以实现更接近实际人类语言的多模态分布。

Synthesia 表示,这些是即时生成的,意味着更接近我们在现实生活中讲话或反应时的体验。这与一些围绕头像的人工智能视频工具今天的运作方式形成对比:通常这些实际上是许多视频片段,它们被迅速拼接在一起以创建更接近脚本的面部反应,这些脚本被输入其中。其目标是看起来不那么机械化,更加栩栩如生。

先前版本:

新版本:

正如您在这里看到的两个示例,一个来自 Synthesia 的旧版本,一个是于周四发布的版本,还有很长的路要走,对此 CEO Victor Riparbelli 本人也承认。

“当然,它还不是 100%,但很快就会到达,年底之前会如此令人惊叹,”他告诉 TechCrunch。“我认为您也可以看到,其中 AI 部分是非常微妙的。对于人类来说,最微小的细节有如此多信息,像我们的面部肌肉的微小、微小的运动。我认为我们永远无法坐下来描述,‘是的,你在开心时会这样微笑,但那是假的,对吧?’对于人类来说,这样的描述是如此复杂,但可以(捕捉到)在深度学习网络中。它们实际上能够找出模式,然后以可预测的方式复制它。”他补充说,他们接下来要做的是手部。

“手部,就像,非常困难,”他说。

专注于 B2B 还有助于 Synthesia 将其讯息和产品更多地锚定在“安全” AI 使用上。这是必不可少的,尤其是当今社会对于深度伪造的巨大担忧和使用 AI 进行诸如误导和欺诈等恶意用途。尽管如此,Synthesia 并未完全避免在这方面引发争议。Synthesia 的技术此前被滥用,用于在委内瑞拉生产宣传和由亲中社交媒体账户推广的假新闻报道。

该公司指出,他们已经采取进一步措施来尝试限制这种使用。上个月,他们更新了政策,“限制人们可以制作的内容类型,投资于恶意行为者的早期检测,增加致力于人工智能安全工作的团队,以及尝试采用诸如 C2PA 等内容授权技术。”

尽管面临这些挑战,但该公司仍在不断增长。

在上次融资时,Synthesia 估值为 10 亿美元,当时他们筹集了 9000 万美元。值得注意的是,这一融资发生在将近一年前,即 2023 年 6 月。

Riparbelli 在本月早些时候接受采访时表示,目前没有再筹集资金的计划,尽管这并不完全回答了 Synthesia 是否主动接洽的问题。(注意:我们很高兴地邀请 Riparbelli 在本月的伦敦活动中发言,我肯定会再次提及此事。如果您在伦敦,请务必参加。)

我们确切知道的是,构建和运行人工智能需要大量资金,而 Synthesia 一直在进行大规模的建设和运营。

在周四版本发布之前,已有超过 20 万人通过 Synthesia 的 225 位传统头像在 130 多种语言中创作了超过 1800 万个视频演示,公司表示。(它没有揭示其付费层中有多少用户,但有许多大客户,包括 Zoom、BBC、杜邦等大型企业。)这家初创公司的希望当然是随着新版本的推出,这些数字将进一步增加。

Related Articles

Back to top button Back to top button