景行数科 - 文档平台

如果Source 或者 Transform 指定 cached 为 true，则 storage_level 默认为 MOMERY_ONLY。即全部放入内存，开发者应评估数据集是否能全部放入内存。否则应该考虑 Storage_level 为其它选项。该特性可用于 Spark SQL Flow 的优化手段。

Storage_level 和 Spark RDD/DataFrame 的 Persist 方法传入的参数是一致的。可选的几个值如下：