Windows 11
微软最新的操作系统

Anthropic推出Claude Instant 1.2,提供更高的准确性和更少的幻觉

Anthropic是一家为各种应用程序开发大型语言模型(LLM)的公司,它宣布推出其入门级LLM的新版本,称为Claude Instant 1.2。新模型可通过API提供给企业,并提供了比其前身更高的性能,更低的价格和更高的安全性。

Claude Instant 1.2是一个非常有能力的模型,可以执行一系列任务,如随意对话,文本分析,摘要和文档理解。它还可以处理多达 100,000 个代币的输入,这意味着它可以一次处理数百页的内容。它可以一次性输出多达几千个令牌的文本,例如备忘录、信件、故事和其他内容。

Claude Instant 1.2 的一个很酷的功能是,它在自动红队评估中在所有 Claude 模型中得分最高。这意味着它提供了更高的安全性,更少的幻觉,并且更能抵抗越狱。越狱是试图诱骗模型泄露敏感信息或产生有害输出的尝试。

Claude Instant 1.2优于以前版本的另一个领域是编码和数学。在一个名为Codex HumanEval的Python编码测试中,Claude Instant 1.2得分为71.2%,高于旧版本的56.0%。在GSM8K小学数学问题基准测试中,Claude Instant 1.2得分为88.0%,高于之前版本的85.2%。

Claude-Instant-12-Benchmarks.jpg.webp

虽然“幻觉”一词可能看起来很戏剧化,但它在人工智能开发中意味着人工智能模型可以偏离事实、逻辑,有时两者兼而有之。从本质上讲,这是当人工智能提供虚假信息并在受到挑战时可能会继续延续自己的谎言时。幻觉可能看起来似是而非,使读者感到困惑,或者完全是狂野和荒谬的。

Anthropic表示,它有一个“令人兴奋的路线图”,计划为Claude Instant 1.2进行功能改进,并将在未来几个月内缓慢而迭代地部署它们。

克劳德即时和克劳德2之间的区别

该公司还有一个旗舰型号Claude 2,可以通过API和Anthropic网站上的beta聊天体验获得。Claude Instant目前仅作为企业的API提供。

Claude 2 与 Claude Instant 1.2 类似,但具有更多特性和功能。例如,它可以解析 PDF 等文档,并根据内容提供反馈或建议。它还可以生成更长的响应,并且比Claude Instant 1.2更好地编码。

Claude 2 于 2 月推出,与其前身相比,它在编码、数学和推理方面取得了重大改进。事实上,它提供了与Claude Instant 3.<>相同的性能功能。

人工智能模型在律师考试的多项选择部分也获得了76.5%的分数,高于克劳德73.0的1.3%。在编码技能方面,Claude 2的得分从Codex HumanEval的71.2%上升到56.0%。Claude 2在数学和文档理解方面也表现出更好的表现。它在GSM88K小学数学问题基准测试中的得分为0.8%,高于先前版本的85.2%。它还可以解析PDF等文档,并根据内容提供反馈或建议。

赞(0) 打赏
未经允许不得转载:Win 11系统之家 » Anthropic推出Claude Instant 1.2,提供更高的准确性和更少的幻觉

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏