av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術(shù)文章
文章詳情頁

Spark臨時表tempView的注冊/使用/注銷/注意事項(推薦)

瀏覽:36日期:2023-03-06 14:25:34
目錄
  • createTempView運作原理
  • 低效做法
  • 緩存臨時表方式:
    • 方式1 創(chuàng)建
    • 方式2
    • 方式3
  • 臨時表生命周期

    createTempView運作原理

    先說一個眾人皆知的知識:
    Spark中的算子包含transformation算子和action算子,transformation是根據(jù)原有RDD創(chuàng)建一個新的RDD,而action則把RDD操作后的結(jié)果返回給driver。Spark對transformation的抽象可以大大提高性能,這是因為在Spark中,所有transformation操作都是lazy模式,即Spark不會立即計算結(jié)果,而只是簡單地記住所有對數(shù)據(jù)集的轉(zhuǎn)換操作邏輯。這些轉(zhuǎn)換只有遇到action操作的時候才會開始計算。這樣的設(shè)計使得Spark更加高效。

    低效做法

    sql("select a,b from table where xxx").createTempView("view1")
    sql("select a from view1 where xxx").show()
    sql("select b from view1 where xxx").show()

    使用createTempView后,查詢這個視圖每次都很耗時了,正是因為createTempView操作是lazy模式,在沒有action算子觸發(fā)之前,它并沒有什么實質(zhì)性的運作,僅僅記錄了一個創(chuàng)建視圖的邏輯
    Spark每次遇到action算子show()方法的時候,才開始真正計算,上面代碼中兩次用到視圖view1,那么意味著創(chuàng)建視圖的方法會執(zhí)行兩次,因此非常的耗時,所以需要對view1進行緩存處理

    緩存臨時表方式:

    方式1 創(chuàng)建

    // 創(chuàng)建它的SparkSession對象終止前有效
    df.createOrReplaceTempView("tempViewName")  
    // spark應(yīng)用程序終止前有效
    df.createOrReplaceGlobalTempView("tempViewName") 

    注銷

    spark.catalog.dropTempView("tempViewName")
    spark.catalog.dropGlobalTempView("tempViewName")

    方式2

    創(chuàng)建

    session.table("tempViewName").cache()

    注銷

    session.table("tempViewName").unpersist()

    方式3

    創(chuàng)建

    commonDF.cahe() 或 commonDF.persist(StorageLevel.MEMORY_AND_DISK)
    commonDF.createOrReplaceTempView("tempViewName")

    注銷

    commonDF.unpersist()

    臨時表生命周期

    源碼

    createOrReplaceTempView

      /**
       * 使用給定名稱創(chuàng)建本地臨時視圖。此臨時視圖的生命周期與用于創(chuàng)建此數(shù)據(jù)集的 SparkSession 相關(guān)聯(lián)。
       *
       * @group basic
       * @since 2.0.0
       */
      def createOrReplaceTempView(viewName: String): Unit = withPlan {
        createTempViewCommand(viewName, replace = true, global = false)
      }
    

    也就是說,當(dāng)一下代碼中spark stop(),之后 創(chuàng)建的臨時視圖表才失效

    createGlobalTempView

    /**
       * 使用給定名稱創(chuàng)建一個全局臨時視圖。此臨時視圖的生命周期與此 Spark 應(yīng)用程序相關(guān)聯(lián)。全局臨時視圖是跨會話的。它的生命周期是 Spark 應(yīng)用程序的生命周期,即當(dāng)應(yīng)用程序終止時它會被自動刪除。它與系統(tǒng)保留的數(shù)據(jù)庫 global_temp 相關(guān)聯(lián),我們必須使用限定名稱來引用全局臨時視圖,例如從 global_temp.view1 中選擇。
       *
       * @throws AnalysisException if the view name is invalid or already exists
       *
       * @group basic
       * @since 2.1.0
       */
      @throws[AnalysisException]
      def createGlobalTempView(viewName: String): Unit = withPlan {
        createTempViewCommand(viewName, replace = false, global = true)
      }

    到此這篇關(guān)于Spark臨時表tempView的注冊/使用/注銷/注意事項的文章就介紹到這了,更多相關(guān)Spark臨時表tempView內(nèi)容請搜索以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持!

    標(biāo)簽: MsSQL
    主站蜘蛛池模板: 国产在线对白 | 亚洲狠狠爱 | 中文精品视频 | 亚洲性视频网站 | 狼色网 | 亚洲精品在线视频 | 天天艹日日干 | 亚洲在线日韩 | 中文字幕 在线观看 | 成人三级在线播放 | 欧美激情在线播放 | 免费精品 | 欧美一级片久久 | 日韩国产精品一区二区三区 | 国产免费自拍 | 草久久久| 日韩中文一区二区三区 | 亚洲成av| 综合网视频 | 久久久91精品国产一区二区三区 | 99精品一区二区 | 一级看片免费视频囗交动图 | 97视频免费 | 国产成人精品一区二 | 精品九九九 | 精品视频一区二区三区四区 | 婷婷国产一区二区三区 | 艹逼网 | 午夜电影日韩 | 日本一区二区三区四区 | 国产日韩精品一区 | 国产精品1区2区 | 日韩欧美国产一区二区三区 | 老外黄色一级片 | 成人在线播放网站 | 农村真人裸体丰满少妇毛片 | 久久久网| 国产日韩精品视频 | 欧美精品久久 | 色婷婷婷婷色 | 不卡av在线 |