[微軟認證] Microsoft Certification DP-100
檸檬爸在考完 Microsoft AZ-104 之後,又有新的需求針對的是 Microsoft DP-100,這個為想要成為 Azure Data Scientist 的人設計的,與 AZ-104 考試相同,微軟有提供免費的教材,如果有需要進一步的教學也有相對應的課程可以購買。
詳細內容想方涉法, France, Taiwan, Health, Information Technology
檸檬爸在考完 Microsoft AZ-104 之後,又有新的需求針對的是 Microsoft DP-100,這個為想要成為 Azure Data Scientist 的人設計的,與 AZ-104 考試相同,微軟有提供免費的教材,如果有需要進一步的教學也有相對應的課程可以購買。
詳細內容Spark SQL 是很多公司提供給商業智慧 BI (Business Intelligence) 的大數據介面,🍋爸在介紹完 Spark Thrift Server 之後,使用者可以透過 Spark SQL 對自己的資料做操作,Spark SQL 的好處是可以很容易去滿足使用者的需求,但是往往容易遇到因為使用者執行複雜 Query 導致的效能低落,本篇想要透過導入 Spark Rapids 配合 Spark Thrift Server 引入 GPU 的資源看看是否能夠加速 Spark SQL 的運算效率?
詳細內容檸檬爸在前面幾篇介紹了有關 Hive Metastore, Hive on Spark 和 Spark Thrift Server 等等的觀念,本篇想要紀錄一個花了不少時間的除錯過程,錯誤發生的環境是在 Spark Standalone 的叢集上啟動的 Spark Thrift Server 嘗試去連接在 MySQL 上的 Hive Metastore,成功使用一段時間之後會時不時地遇到這個 Bug,後來的解決方法是重新創建 MySQL 的使用者。
詳細內容使用 Spark NLP 去執行 Question Answering 的範例,可以參考 JohnSnowLabs 裡面很多的 Question Answering 模型,例如 Roberta QA Model,至於要怎麼去 Fine Tune QA 模型?在 Spark NLP 裡面並沒有講解得很清楚,本篇想要記錄如何 Fine Tune 一個自己的 QA 模型供 Spark NLP 來使用?
詳細內容為了進一步了解並統計法國的房屋使用情況,2023 年開始法國稅務機關在報稅網站上面提供一個線上申報的方法,具有房產的屋主開始有義務申報房屋使用狀況,其實政府這樣做的另一個目的就是作為逐步取消住房稅的配套,2023 年是每個人主要居所 100% 永久免除的第一年,這包括富裕家庭。但事實上,住房稅並沒有消失,它繼續適用於業主出租的所有第二套住房和出租,透過這個機制稅務機關也取得空置住房徵稅的信息,作為閒置房屋資源徵稅的依據,本篇想要記錄並介紹法國房屋使用申報的過程,參考 BFM 新聞
詳細內容本篇想要記錄在實作安裝 Apache Superset 並且配合後端 HIVE 的資料庫進行資料呈現,一開始以為是要在 superset_config.py 內部設定SQLALCHEMY_DATABASE_URI 到指定的 Hive Server,後來了解到那是 Superset 內部 Database, Dataset 與 Charts 設定的儲存位置,本篇參考 Apache Superset 的網站實作安裝 Superset,希望對讀者有所幫助。
詳細內容在上一篇我們介紹了如何利用 MySQL 服務建立屬於自己的 Hive Metastore 資料庫,並且利用 Spark SQL 的方式對 Metastore 裡面的資料做存取,根據上方圖示,我們可以理解除了 Spark 可以對 Hive Metastore 做存儲之外,我們也可以利用 Hive, Impala, Presto, Apache Hudi 甚至是最近出來的 Apache Superset 來做資料串接,本篇想要紀錄並且比較這幾種技術的優缺點是什麼?
詳細內容最近需要用到 VPN,因為某些網站有擋台灣的 IP,所以有需要遠端桌面的需求,Microsoft Azure 的 VM 可以開在世界不同的資料中心裡面,本篇紀錄一下實作在 Azure 上開出一台 Ubuntu 的 VM 安裝遠端桌面伺服器,然後利用 Microsoft Remote Desktop 遠端登入進去操作,實作方法參考的是技術文件 Install and configure xrdp to use Remote Desktop with Ubuntu。
詳細內容Django 是一個以 Python 為基底開發網站服務的框架,近年來越來越多開發人員使用 Python 語言,所以要切入網站或者是 API 的開發,Django 會是一個很好的選擇,之前檸檬爸初學 Django 寫過一篇初淺的介紹文,後來,真正在進入 Production 階段的時候遇到一些問題,本篇紀錄在部署 Django 到 Apache Server 上的時候遇到的挑戰。
詳細內容擁有一個自己的 Hive Metastore 的好處是方便管理自己的資料,利用 Hive Metastore 可以把資料表與大數據平台上面的資料關連起來。Hive Metastore 可以部署在不同的資料庫上面,例如 MySQL 或是 Microsoft SQL Database。
詳細內容