登录/注册
下载豆瓣客户端
豆瓣 6.0 全新发布 ×

豆瓣

扫码直接下载

iPhone · Android
  • 豆瓣
  • 读书
  • 电影
  • 音乐
  • 播客
  • 同城
  • 小组
  • 阅读
  • FM
  • 时间
  • 豆品
豆瓣读书
搜索:
  • 购书单
  • 电子图书
  • 2024年度榜单
  • 2024年度报告

建议

123 2022-05-06 18:12:11

宽窄依赖那部分的认识有点问题,如果窄依赖里有多对多依赖,那么就说不通物理执行计划生成的stage划分,因为多对多依赖也会引入task重复执行的问题。还是推荐使用父RDD的分区是否被多个子RDD的分区所依赖来判断宽窄依赖,更符合物理执行计划的生成。


赞
转发
回应 只看楼主

> 我来回应

> 去大数据处理框架Apache Spark设计与实现(全彩)的论坛

最新讨论 · · · · · · (全部)

此书就像一个担心自己学生通不过考试的教授(汐刃)

© 2005-2025 douban.com, all rights reserved 北京豆网科技有限公司 关于豆瓣 · 在豆瓣工作 · 联系我们 · 法律声明 · 帮助中心 · 图书馆合作 · 移动应用