Deployment

ML模型部署和预测系统

部署ML模型困难，存在几个常见误区：
1. 误区一：认为只需要部署一两个模型，而实际上可能需要部署上百个。
2. 误区二：认为模型性能不会变化，但实际上会因为数据分布的变化等因素导致性能下降。
3. 误区三：认为不需要经常更新模型，但更新越快，效果可能越好。
4. 误区四：许多ML工程师认为不需考虑规模问题，但即使是小公司也需要考虑。
预测方式分为两种：
1. 批量预测（Batch Prediction）：服务从数据仓库接收批量特征进行预测，应用程序获取预先计算的结果。
2. 在线预测（Online Prediction）：应用直接向预测服务请求结果，服务实时更新特征。
流式在线预测：应用将日志作为流特征发送到预测服务，数据仓库也会提供批量特征。

目的是减少延迟，方法包括：