如何仅使用最近的记录获得新的解决方案版本?

0

【以下的问题经过翻译处理】 如何在增量导入记录时仅使用最近记录生成解决方案版本(USER_PERSONALIZATION recipes)?

我正在增量导入记录(interactions, items),因为每次都会创建新项目。由于增量导入记录会使训练时间(成本)非常高,并且集成记录包含不必要的旧项目,我希望仅使用最近记录(interactions, items)生成新的解决方案版本。是否有任何方法可以做到这一点?

据我所知,在生成新的解决方案版本时,没有办法删除旧记录。

目前,我正在所有项目(旧的和新的)上生成新的解决方案版本,并在推荐项目时使用过滤器删除旧项目。

Q1.如果我想仅使用最近记录获得新的解决方案版本,我是否需要创建新的DatasetGroup?

Q2.如果每次都创建新项目并且旧项目是不必要的(例如新闻文章推荐),什么是适当的个性化架构?

(“架构”指管理最近数据集的管道)

谢谢阅读。

profile picture
专家
已提问 8 个月前30 查看次数
1 回答
0

【以下的回答经过翻译处理】 我在这方面有一些经验,我们有一个类似的问题。

Q1.如果我想只使用最近的记录获取新的解决方案版本,我是否需要创建一个新的DatasetGroup?:根据我们的经验,是的。您需要重新导入包含新数据的数据集。

Q2.如果每次创建新项目并且旧项目不必要(例如新闻文章推荐),那么怎样的个性化架构是合适的?:正确的做法是您所描述的,通过仅重新导入包含相关数据的数据集。

我们发现,没有办法删除旧记录而不导入完全新的数据集。仅通过使用过滤表达式将其筛选出来(但仍在模型中),那么删除旧项的“快速”方法就是使用过滤表达式将其从推荐中筛选出(它们仍然在模型中)。基本上,你可以为你的每个项/用户创建一个状态字段,并使用putItems或putUsers调用更新它,并将状态设置为已删除或非活动状态,然后使用过滤器表达式将这些筛选出来(例如,筛选出STATUS = INACTIVE的项)。

这实际上并没有从数据集中删除该项,只是将其过滤掉了。这对我们而言是一个重大问题,因为模型仍然在尝试向用户推荐这些现在无关的项目,但只是从推荐中被过滤掉了。

这就是我对此的理解,可能不准确。如果添加了新功能以实际从模型中删除项目,那将会很棒,希望它很快就会出现。

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则