想方涉法 - 量瓶外的天空 M-Y-Oceane - 想方涉法, France, Taiwan, Health, Information Technology

[AWS] curl 上傳檔案至 AWS S3

Posted on 2024-07-062024-07-06 by 檸檬爸

在導入 AWS 作為後端雲平台的時候，遇到了需要透過 curl 指令將檔案直接上傳到 S3 的需求，一開始以為一定要透過 presigned URL 的方式才能夠進行，但是後來參考了幾篇網路的文章並且經過實作驗證之後，發現也可以直接用 bash shell 配合 AWS credentials 進行，由於 AWS 的 credentials 有分成有時效性與無時效性兩種，本篇針對兩種不同的憑證放上不同的程式碼。

詳細內容

Azure Ubuntu 20.04 VM 安裝 Nvidia T4 GPU Driver 紀錄

Posted on 2024-03-262024-03-26 by 檸檬爸

本篇想要記錄一下在 Azure Ubuntu 20.04 x64 VM 上面使用 GPU 的安裝過程，首先需要安裝相關 Nvidia GPU 的 Driver，不過究竟要安裝多少套件各方說法不一，由於之前已經有一組可以使用 GPU 的安裝指令，所以本篇以嘗試使用這組指令為基礎紀錄解決問題的方法，鳥哥的教學告訴我們可以利用 dpkg -l ‘nvidia*’ 的指令得知目前安裝所有 Nvidia GPU 相關的套件總覽，配合這個指令我們可以了解究竟安裝了什麼？

詳細內容

[GPU] Native Rapids UDF – Compilation Environment

Posted on 2024-01-162024-01-18 by 檸檬爸

上一篇我們介紹了如何利用 cudf C++ 創建自己可以跑在 GPU 上面的 UDF，本篇我們想要紀錄如何利用 Spark Rapids Examples 提供的編譯環境建造出屬於自己的 jar 可以跑在有 GPU 的 Spark 叢集運算之上。

詳細內容

[GPU] Native Rapids UDF – Create Custom UDF

Posted on 2024-01-082024-02-20 by 檸檬爸

在上一篇我們成功實作了 HiveUDF，為了要進一步利用 GPU 加速，我們需要去實作 evaluateColumnar 這一個函數，參考 Spark Rapids 的 Github 與 ColumnView 裡面的範例，針對我們想做到的 UDF 我們沒有發現適合的函數去實作針對一個 Array[String] 的過濾程式，所以我們需要自己去實作 Tutorial 裡面所謂的 Native Code Examples，Tutorial 裡面針對 HiveUDF 只有提供一個範例是 StringWordCount，本篇我們紀錄藉由這個範例去實作一個支援 GPU 的 HiveUDF。

詳細內容

[法國租屋] Chèque Energie 能源補助支票

Posted on 2023-12-242023-12-24 by 檸檬爸

檸檬爸前一陣子收到一個有關 Chèque Energie 的 Email，以為是詐騙就放著沒有管，直到連檸檬媽也收到相關的 Email 之後，決定要來好好研究怎麼使用這張 Chèque Energie，在使用上面也遇到了一些問題，所以想說利用本篇記錄一下整個過程。

詳細內容

[Spark] Define and Register Hive UDF with Spark Rapids

Posted on 2023-12-242023-12-28 by 檸檬爸

在上一篇我們介紹如何透過 Spark Rapids 去利用 GPU 加速執行 SQL，我們遇到了幾個問題並一一解決，最後我們成功在 Spark Thrift Server 上面啟動了 Spark Rapids 的功能，並且使用 pyHive 將 SQL 的 Request 送進 Spark Cluster 裡面，為了要更進一步完全使用 GPU 的資源，在執行 SQL command 的時候如果遇到沒有支援 Spark Rapids 的 UDF (User-Defined Function) 的時候，會拖慢整體的速度，讓使用 GPU 的效果沒有發揮出來，因此本篇想要紀錄如何實作並定義一個 Hive UDF。

詳細內容

[租屋] Charge Récupérables 房客負擔管理費

Posted on 2023-11-212023-11-21 by 檸檬爸

檸檬爸最近收到了過去一年社區管委會 (Syndicat des Copropriétaires) 寄過來的管理費補繳帳單 (Répartition des Charges)，與台灣不同的是法國的管理費或是物業費 (Charges) 其實是有包含熱水 (Eau Chaudes) 與暖氣的 (Chauffage)，所以你的物業費會根據你的使用量來跟你計費，由於目前檸檬家有出租的關係，究竟要如何跟房客一起分擔這筆費用，其實法國政府有明文規定，房東即便沒有實際住在房子裡面，還是有需要分擔的部分，一開始檸檬爸也是搞錯狀況，所以趕緊補上這篇，算是一個紀錄。

詳細內容

[法文筆記] 10 個讓你聽起來像當地人的法文語詞

Posted on 2023-10-092023-10-09 by 檸檬媽

要怎麼讓口說變得更有法國當地人的韻味呢？在句子中加入一些小小的法文語詞，就能讓你的口說變得很道地喔！來看看十個常用的法文語詞～

詳細內容

[微軟認證] Microsoft Certification DP-100

Posted on 2023-09-242024-01-01 by 檸檬爸

檸檬爸在考完 Microsoft AZ-104 之後，又有新的需求針對的是 Microsoft DP-100，這個為想要成為 Azure Data Scientist 的人設計的，與 AZ-104 考試相同，微軟有提供免費的教材，如果有需要進一步的教學也有相對應的課程可以購買。

詳細內容

[Rapids] Support Spark SQL with Spark Rapids

Posted on 2023-09-232023-12-24 by 檸檬爸

Spark SQL 是很多公司提供給商業智慧 BI (Business Intelligence) 的大數據介面，🍋爸在介紹完 Spark Thrift Server 之後，使用者可以透過 Spark SQL 對自己的資料做操作，Spark SQL 的好處是可以很容易去滿足使用者的需求，但是往往容易遇到因為使用者執行複雜 Query 導致的效能低落，本篇想要透過導入 Spark Rapids 配合 Spark Thrift Server 引入 GPU 的資源看看是否能夠加速 Spark SQL 的運算效率？

詳細內容

想方涉法 – 量瓶外的天空 M-Y-Oceane

[AWS] curl 上傳檔案至 AWS S3

Azure Ubuntu 20.04 VM 安裝 Nvidia T4 GPU Driver 紀錄

[GPU] Native Rapids UDF – Compilation Environment

[GPU] Native Rapids UDF – Create Custom UDF

[法國租屋] Chèque Energie 能源補助支票

[Spark] Define and Register Hive UDF with Spark Rapids

[租屋] Charge Récupérables 房客負擔管理費

[法文筆記] 10 個讓你聽起來像當地人的法文語詞

[微軟認證] Microsoft Certification DP-100

[Rapids] Support Spark SQL with Spark Rapids

Most Viewed Posts

Categories

Recent Posts

Archives

Facebook Page Widget

Contact Us

檸檬媽

檸檬爸