1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 嗨,Janice,
考虑到Canvas是一个无代码工具,它抽象和自动化了大部分模型训练过程。当你训练模型时,模型调整和训练性能大多受限于数据量和特征选择。
尽管如此,在预处理阶段(即特征工程)中可以采取一个关键操作来改善你的表现。假设你不是技术开发人员,你可以探索使用AWS Data Brew。
AWS Glue DataBrew是一个无代码的可视化数据准备工具,它使数据分析师和数据科学家轻松清理和规范化数据,以用于进行分析和机器学习。你可以选择超过250个预构建转换函数来自动化数据准备任务,而不需要编写任何代码。你可以自动过滤异常,将数据转换为标准格式,纠正无效值,以及其他任务。在你的数据准备好后,你可以立即将它用于分析和机器学习项目中。
在你的场景中,你可以将你的初始数据存储在S3中,并在将数据写回S3之前,让DataBrew对其进行特征工程。从那你就可以将处理后的数据导入Canvas,并从中构建你的模型。相比直接使用原始数据构建模型,这会给你一个更好的性能表现。
Data Brew入门指南:链接
祝好!
Vincent
相关内容
- AWS 官方已更新 2 年前
- AWS 官方已更新 1 年前
- AWS 官方已更新 1 年前
- AWS 官方已更新 1 年前