Sociology

Betaworks最新的“Camp”项目中押注AI代理

Betaworks并没有选择推出又一个LLM来跟随AI的潮流,而是选择了一批代理型模型,这些模型自动化了日常任务,然而这些任务并不是那么简单定义的。投资者最新的“Camp”孵化器培训并资助了九家AI代理初创公司,希望他们能够承担当今更为繁琐的任务。

许多这些公司的使用案例听起来很有前景,但是AI往往难以实现其承诺。您会相信一个全新的AI来为您整理电子邮件吗?从网页中提取和结构化信息呢?有人愿意让AI在任何可行的地方安排会议吗?

对于这些服务尚需建立信任,这是大多数改变我们行为的技术都会出现的情况。询问MapQuest获取方向感觉很奇怪,直到不再感觉奇怪 — 现在GPS导航是日常工具。但是AI代理是否也到了这个阶段?Betaworks首席执行官兼创始人John Borthwick认为是的。(披露:前TechCrunch编辑和Disrupt主持人Jordan Crook离开TC加入了该公司)。

“您正在涉及我们花费大量时间思考的内容,”他告诉TechCrunch。“虽然代理AI处于初期阶段 — 并且存在着关于代理成功率等问题 — 自Camp开始以来我们已经看到了巨大进展。”

尽管技术将继续改进,Borthwick解释说一些客户已经准备接受目前的状态。

“历史上,我们看到客户即使涉及高风险任务,也愿意‘冒险’,只要产品是‘足够好的’。最初的 Bill.com,尽管在OCR和电子邮件抓取方面做了一些有趣的事情,但并不总是正确,用户仍然相信它进行了价值数千美元的交易,因为它使一个糟糕的任务变得不那么糟糕。随着时间的推移,通过高度沟通式的界面设计,反馈循环从这些客户那里创造了一个更好、更可靠的产品,”他说。

“目前,Camp产品的早期用户大多是开发人员、创始人和早期技术采用者,这些用户总是愿意耐心测试并对这些产品提供反馈,最终这些产品会转向主流市场。”

Betaworks在最新的“Camp”项目中全力投入增强型AI:‘我们非常感兴趣’

Betaworks Camp是一个为期三个月的加速器,选定的公司在选择的主题中得到产品、战略和关系方面的实践帮助,然后获得一张价值50万美元的支票 — 由Betaworks、Mozilla Ventures、Differential Ventures和Stem AI提供。但这些初创公司在5月7日的演示日前会展示自己的优势。

我们提前看到了阵容,以下是我认为最突出的三个。

Twin使用“行动模型”自动化任务,我们前几个月像Rabbit谈论过。通过对代表软件界面的大量数据进行训练,它可以(这些公司声称)学会如何完成常见任务,这些任务比API可以处理的更复杂,但不至于无法委托给“聪明实习生”。我们在一月份写过他们的介绍。

图片来源:Twin

因此,您不必让后端工程师构建自定义脚本来执行特定任务,您只需用普通语言展示或描述它。比如“将今天收到的所有简历放入Dropbox文件夹,并根据申请人重新命名,然后在Slack中向我发送分享链接”。一旦您调整了工作流程(“糟糕,这次将申请日期添加到文件名中”),它可能就成了该流程运行的新方式。公司的目标是自动化占用我们时间80%的20%任务 — 它能以负担得起的方式做到这一点才是真正的问题(Twin拒绝对其模型和训练过程的性质进行详细说明)。

Skej旨在改善找到适合两个(或三个,或四个…)人的会议时间的过程。您只需在电子邮件或Slack线程中抄送机器人,它将开始协调每个人的可用性和偏好。如果它有时间表的访问权限,它将检查时间表;如果有人说他们更喜欢周四下午,它将考虑这一点;您可以说某些人有优先级;等等。每个与熟练执行助理合作的人都知道他们是不可替代的,但很有可能每个执行助理都希望花更少的时间在“如何呢?不行?这样呢?”这些任务上。

图片来源:Skej

作为一个厌恶社交的人,我没有这个时间表问题,但我欣赏其他人有,并且也愿意使用“设定并忘记”类型的解决方案,他们只需接受结果。并且这是今天的AI代理能力范围之内,主要任务是理解自然语言而不是填表格。

Jsonify是网站爬虫的演化,可以从相对无结构的上下文中提取数据。这样做已经很久了,但提取信息的引擎从来不是那么聪明。对于大型且扁平的文档,它们表现不错 — 如果是在网站选项卡或一些编码不良的视觉列表中,通常它们会失败。Jsonify利用了今天视觉AI模型的进步理解,以更好地解析和排序可能对简单爬虫无法访问的数据。

图片来源:Jsonify

因此,您可以搜索某个地区的Airbnb选项,然后让Jsonify将它们全部转储到结构化列表中,列出价格、距离机场的距离、评分、隐藏费用等列。然后您可以在Vacasa做同样的事情 — 也许是同样的地方(我这样做了,节省了大约150美元,但我希望可以自动化这个过程)。或者,您知道,做专业的事情。

但LLM的固有不精确性难道不使其成为一个可疑的工具吗?创始人Paul Hunkin说:“我们已经构建了一个相当强大的护框和交叉检查系统。我们在运行时使用几种不同的模型来理解页面,这提供了一些验证 — 我们所使用的LLM已经针对我们的用例进行了微调,所以即使没有护框层,它们通常也很可靠。通常我们看到95% 以上的提取准确度,具体取决于用例。”

我可以看到这些任何一种可能在任何领先技术公司中都是有用的。该队伍中的其他公司有一些更具技术性或情境性 — 以下是剩下的六个:

  • Resolvd AI — 云工作流程的代理自动化。感觉很实用,直到定制化集成赶上它。
  • Floode — 一个能够阅读您的电子邮件并找到重要内容的AI收件箱整理程序,同时准备适当的回复和操作。
  • Extensible AI — 您的AI是否在退化?询问您的医生是否Extensible是您部署的正确测试和日志记录基础设施。
  • Opponent — 一个为儿童设计、用于进行广泛互动和游玩的虚拟角色。在伦理和法律方面感觉像一个雷区,但有人必须走过去。
  • High Dimensional Research — 基础设施玩法。一个针对基于Web的AI代理的框架,具有按使用量付费的模式,因此如果您公司的实验失败,您只需要支付几美元。
  • Mbodi — 机器人生成AI,一个训练数据相对稀缺的领域。我原以为这是一个非洲词,但原来只是“体现”。

毫无疑问,AI代理将在不久的将来越来越自动化的软件工作流程中发挥一定作用,但这一作用的性质和程度尚未确定。显然,即使有些产品尚未完全准备好面向大众市场露面,Betaworks仍旨在尽早进入市场。

您将能够在5月7日看到这些公司展示他们的代理产品。

更正:本故事已更新,以反映Jsonify的创始人是Paul Hunkin,而不是Ananth Manivannan。

Related Articles

Back to top button Back to top button