[Hive/HBase] 如何串接 Hive/HBase 資料庫
一般來說在視覺化資料庫的方法一般來說如果是 Hive 資料庫可以透過 DBeaver 等等類似 SQL Client 的程式來顯現,但是如果是像是 HBase 的資料庫的話基本上很難快速了解 HBase 裡面存取的檔案全貌,如果可以利用 Hive 用表格的方式呈現的話會比較好理解,本篇想要介紹如何將 HBase 利用 Hive 呈現出來!
詳細內容想方涉法, France, Taiwan, Health, Information Technology
一般來說在視覺化資料庫的方法一般來說如果是 Hive 資料庫可以透過 DBeaver 等等類似 SQL Client 的程式來顯現,但是如果是像是 HBase 的資料庫的話基本上很難快速了解 HBase 裡面存取的檔案全貌,如果可以利用 Hive 用表格的方式呈現的話會比較好理解,本篇想要介紹如何將 HBase 利用 Hive 呈現出來!
詳細內容本篇想要簡單的紀錄並且回答一個學習統計的人會遇到的問題,其實有不少統計的老師有討論過這個問題例如連結,但是並不是經過一個比較嚴謹的數學推導,本篇取材的來源是由 Michael J. Evans and Jeffrey S.Rosenthal 著作的機率與統計,不確定性的科學一書,點擊即可以下載。
詳細內容在開發 Java Spark 的時候,常常會需要轉換 Dataset 或是 DataFrame,對於比較大的表格格式變換 (Schema Change),通常會使用到 JavaRDD 與 Row,開發時用到比較複雜的資料結構像是 List 或是 Map 等等的時候,有時候發生錯誤並不知道要如何除錯?本篇想要展示類別 Row: getList() 的隱藏錯誤在使用的時候發生無法理解的 NullPointerException 現象並且其解決的方法!
詳細內容在內網向外網的 API 溝通的時候,有時候因為特別的安全層級要求,需要透過內網的 Proxy 與在外網的 API 溝通,此時會傾向透過 Proxy 扮演類似 DNS 的角色!本篇想要整理並記錄兩個可以使用的方法!分別是利用 Curl 與 Spring-boot 中的 RestTemplate。
詳細內容在大數據的平台上開發大數據應用的時候,如果想要自動化執行不同的 Spark 腳本的話,很常會使用 Apache Oozie 這個軟體,如果想要配合一些 Continuous Delivery 的工具如 Jenkins 和 TeamCity 來使用的時候,需要透過 Oozie 的 WebAPI 來使用,有兩種主要的使用方法,一種是利用 Shell Script 下達 Curl 的指令快速溝通,另一種方式則是利用 Oozie 專案開發的 OozieClient 配合 groovy 或是 Java 的指令運行。
詳細內容檸檬爸在申請 Adsense 廣告這一條路上其實花了蠻多的時間的,再將網站建置完成之後想要申請 Adsense 的廣告帳號,但是一直沒有成功,反而一直出現了高價值廣告空間:無內容 (Valuable Inventory: No Content) 這一個訊息提醒,如以下圖片所示。本篇提供給受到這錯誤訊息困擾的用戶一點點成功經驗的分享。在尋找出現無內容錯誤訊息的原因的時候,筆者參考了以下的網站,提到了原因應該是 robots.txt 設定的問題,所以我們自己創建了一個 robots.txt 檔,然後成功讓 Google Adsense 開始審查。
詳細內容在開發 Android 程式的時候,有需要用到 WebView 直接連結特定的網頁,但是很多時候網頁並沒有 HTTP SSL 的保護, 基本上 Android 9 以後 WebView 在顯示沒有 SSL 的網頁會直接顯示設成 Disable,詳情可以參考。本篇想要紀錄如何利用 Android WebView 連結 without HTTPS 的網站。
詳細內容介紹了如何利用 Jenkins + Fastlane 來編譯並且發佈 Android 的程式,但是在介紹中我們只使用了單一個 Master Jenkins,本篇想要紀錄如何使用 Jenkins Master/Slave 的架構,如此一來可以 Master 的伺服器只需要負責管理與分配工作,也比較不容易會資源枯竭!本篇參考連結
詳細內容般在研究質譜儀產生出來的資訊會使用 R 的 package,從質譜儀出來的資料格式主要是 RAW 的檔案,根據連結的介紹,一般會經過一些轉檔變成 MS1/MS2, MGF 或者是 mzXML. 本篇想要紀錄在使用 library MSnbase 的時候一些實用的指令!
詳細內容Join 是一個在關聯性資料庫裡面很常使用的一個運算元,在大數據資料庫慢慢普及的今天,Join 還是一個幫助我們了解資料關係不可或缺的角色,今天想要討論的是在 Spark 裡面 Join 背後執行的運算原理,筆者在執行 Spark 工作的時候,有時候需要優化資料的運算過程以降低運算所需要的時間,本篇的資料來源可以參考連結,另外筆者也很建議大家觀看以下這一個 Youtube 影片。
詳細內容