
TAPIR:使用每帧初始化和时间细化跟踪任何点
该论文提出了一种新颖的模型,名为TAP,可以在视频序列中有效地跟踪任何查询点在任何物理表面上的位置。该模型采用两个阶段:匹配阶段和细化阶段。该模型在TAP-Vid基准测试中表现优异,平均Jaccard(AJ)的改进幅度约为20%。该模型可以...

该论文提出了一种新颖的模型,名为TAP,可以在视频序列中有效地跟踪任何查询点在任何物理表面上的位置。该模型采用两个阶段:匹配阶段和细化阶段。该模型在TAP-Vid基准测试中表现优异,平均Jaccard(AJ)的改进幅度约为20%。该模型可以...
2017年至2022年提出的Transformer模型进行广泛调查,概述了Transformer在自然语言处理、计算机视觉、多模态、音频和语音处理以及信号处理等五个领域中的应用,并对高影响力的Transformer模型进行了分析和分类。本文...

探讨了开源社区发展语言模型的可能性和前景。在 ChatGPT 推出之前,大多数语言模型被视为主要是研究项目,因此模型的易用性和成本扩展性方面的问题并不太重要。然而,开源社区正在探索一系列不同的语言模型,包括前期成本、预测能力、控制程度等。因...
Obviously AI:无需编写代码即可构建AI模型的工具 Obviously AI是一款无需编写代码即可构建AI模型的工具,可以在几分钟内从原始数据到行业领先的预测模型,无需几个月的时间。该工具可以实现分类、回归和时间序列等多种预测功能...

谷歌的AI试衣模型 谷歌前两天发了一个AI试衣模型 TryOnDiffusion,想解决的是用户提供一张自己的全身照,就可以获得自己穿上对应服装的样子。 需要一张用户的全身照和服装模特穿着的照片,效果看起来非常好。 他们主要解决了两个问题:...

Meta 推出 Voicebox,一个全能语音生成模型 Meta 最近瞄准了除了大语言模型之外的其他媒体生成式模型开始发力,比如上周推出了 Voicebox,一个全能语音生成模型,这是一个支持六种语言和多种语音处理功能的模型,可惜的是暂时不...

Open AI 上周三发布了一大批模型相关的更新,包括了GPT-4和3.5的新版本模型,模型都支持函数调用以及关于模型 费用的调整。 模型更新 gpt-4-0613 包括一个更新和改进的模型,带有函数调用。 gpt-4-32k-0613 包...
王小川组建的百川智能公司正式发布了70亿参数的中英文开源大模型——baichuan-7B。目前,baichuan-7B大模型已在Hugging Face、Github和Model Scope等平台上发布。 baichuan-7B是由百川智能...
今年4月,三星发生一连串机密信息泄露事件后,该公司决不再使用ChatGPT。 反而选择自行研发的 AI 协助员工完成如翻译、知识搜索以及摘要等任务。 Samsung 表示,这款 AI 模型将超越最近才推出的 GPT-3.5。 该公司的 De...
OpenAI 今天宣布为 ChatGPT 带来一系列的更新与改进。 gpt-4 和 gpt-3.5-turbo 这两款模型推出了更新版本,令功能更强大,并进一步将开发者成本下降。 GPT 3.5 Turbo 16k Model 新的聊天完成...