Sociology

Betaworks最新的“Camp”项目中押注AI代理

玛诗北欧 Thursday, May 23 2024

Betaworks并没有选择推出又一个LLM来跟随AI的潮流，而是选择了一批代理型模型，这些模型自动化了日常任务，然而这些任务并不是那么简单定义的。投资者最新的“Camp”孵化器培训并资助了九家AI代理初创公司，希望他们能够承担当今更为繁琐的任务。

许多这些公司的使用案例听起来很有前景，但是AI往往难以实现其承诺。您会相信一个全新的AI来为您整理电子邮件吗？从网页中提取和结构化信息呢？有人愿意让AI在任何可行的地方安排会议吗？

对于这些服务尚需建立信任，这是大多数改变我们行为的技术都会出现的情况。询问MapQuest获取方向感觉很奇怪，直到不再感觉奇怪 — 现在GPS导航是日常工具。但是AI代理是否也到了这个阶段？Betaworks首席执行官兼创始人John Borthwick认为是的。(披露：前TechCrunch编辑和Disrupt主持人Jordan Crook离开TC加入了该公司）。

“您正在涉及我们花费大量时间思考的内容，”他告诉TechCrunch。“虽然代理AI处于初期阶段 — 并且存在着关于代理成功率等问题 — 自Camp开始以来我们已经看到了巨大进展。”

尽管技术将继续改进，Borthwick解释说一些客户已经准备接受目前的状态。

“历史上，我们看到客户即使涉及高风险任务，也愿意‘冒险’，只要产品是‘足够好的’。最初的 Bill.com，尽管在OCR和电子邮件抓取方面做了一些有趣的事情，但并不总是正确，用户仍然相信它进行了价值数千美元的交易，因为它使一个糟糕的任务变得不那么糟糕。随着时间的推移，通过高度沟通式的界面设计，反馈循环从这些客户那里创造了一个更好、更可靠的产品，”他说。

“目前，Camp产品的早期用户大多是开发人员、创始人和早期技术采用者，这些用户总是愿意耐心测试并对这些产品提供反馈，最终这些产品会转向主流市场。”

Betaworks在最新的“Camp”项目中全力投入增强型AI：‘我们非常感兴趣’

Betaworks Camp是一个为期三个月的加速器，选定的公司在选择的主题中得到产品、战略和关系方面的实践帮助，然后获得一张价值50万美元的支票 — 由Betaworks、Mozilla Ventures、Differential Ventures和Stem AI提供。但这些初创公司在5月7日的演示日前会展示自己的优势。

我们提前看到了阵容，以下是我认为最突出的三个。

Twin使用“行动模型”自动化任务，我们前几个月像Rabbit谈论过。通过对代表软件界面的大量数据进行训练，它可以（这些公司声称）学会如何完成常见任务，这些任务比API可以处理的更复杂，但不至于无法委托给“聪明实习生”。我们在一月份写过他们的介绍。

因此，您不必让后端工程师构建自定义脚本来执行特定任务，您只需用普通语言展示或描述它。比如“将今天收到的所有简历放入Dropbox文件夹，并根据申请人重新命名，然后在Slack中向我发送分享链接”。一旦您调整了工作流程（“糟糕，这次将申请日期添加到文件名中”），它可能就成了该流程运行的新方式。公司的目标是自动化占用我们时间80%的20%任务 — 它能以负担得起的方式做到这一点才是真正的问题（Twin拒绝对其模型和训练过程的性质进行详细说明）。

Skej旨在改善找到适合两个（或三个，或四个…）人的会议时间的过程。您只需在电子邮件或Slack线程中抄送机器人，它将开始协调每个人的可用性和偏好。如果它有时间表的访问权限，它将检查时间表；如果有人说他们更喜欢周四下午，它将考虑这一点；您可以说某些人有优先级；等等。每个与熟练执行助理合作的人都知道他们是不可替代的，但很有可能每个执行助理都希望花更少的时间在“如何呢？不行？这样呢？”这些任务上。

作为一个厌恶社交的人，我没有这个时间表问题，但我欣赏其他人有，并且也愿意使用“设定并忘记”类型的解决方案，他们只需接受结果。并且这是今天的AI代理能力范围之内，主要任务是理解自然语言而不是填表格。

Jsonify是网站爬虫的演化，可以从相对无结构的上下文中提取数据。这样做已经很久了，但提取信息的引擎从来不是那么聪明。对于大型且扁平的文档，它们表现不错 — 如果是在网站选项卡或一些编码不良的视觉列表中，通常它们会失败。Jsonify利用了今天视觉AI模型的进步理解，以更好地解析和排序可能对简单爬虫无法访问的数据。

因此，您可以搜索某个地区的Airbnb选项，然后让Jsonify将它们全部转储到结构化列表中，列出价格、距离机场的距离、评分、隐藏费用等列。然后您可以在Vacasa做同样的事情 — 也许是同样的地方（我这样做了，节省了大约150美元，但我希望可以自动化这个过程）。或者，您知道，做专业的事情。

但LLM的固有不精确性难道不使其成为一个可疑的工具吗？创始人Paul Hunkin说：“我们已经构建了一个相当强大的护框和交叉检查系统。我们在运行时使用几种不同的模型来理解页面，这提供了一些验证 — 我们所使用的LLM已经针对我们的用例进行了微调，所以即使没有护框层，它们通常也很可靠。通常我们看到95% 以上的提取准确度，具体取决于用例。”

我可以看到这些任何一种可能在任何领先技术公司中都是有用的。该队伍中的其他公司有一些更具技术性或情境性 — 以下是剩下的六个：

Resolvd AI — 云工作流程的代理自动化。感觉很实用，直到定制化集成赶上它。
Floode — 一个能够阅读您的电子邮件并找到重要内容的AI收件箱整理程序，同时准备适当的回复和操作。
Extensible AI — 您的AI是否在退化？询问您的医生是否Extensible是您部署的正确测试和日志记录基础设施。
Opponent — 一个为儿童设计、用于进行广泛互动和游玩的虚拟角色。在伦理和法律方面感觉像一个雷区，但有人必须走过去。
High Dimensional Research — 基础设施玩法。一个针对基于Web的AI代理的框架，具有按使用量付费的模式，因此如果您公司的实验失败，您只需要支付几美元。
Mbodi — 机器人生成AI，一个训练数据相对稀缺的领域。我原以为这是一个非洲词，但原来只是“体现”。

毫无疑问，AI代理将在不久的将来越来越自动化的软件工作流程中发挥一定作用，但这一作用的性质和程度尚未确定。显然，即使有些产品尚未完全准备好面向大众市场露面，Betaworks仍旨在尽早进入市场。

您将能够在5月7日看到这些公司展示他们的代理产品。

更正：本故事已更新，以反映Jsonify的创始人是Paul Hunkin，而不是Ananth Manivannan。

玛诗北欧