
【基本介紹】
Kettle Spoon是一款國外開源的ETL工具,可以幫助用戶輕松連接數(shù)據(jù)庫的工具,它是由純java編寫,可以在Window、Linux、Unix上運(yùn)行,所以本程序需要JAVA支持,要先安裝JRE虛擬機(jī)后才能運(yùn)行,Kettle Spoon內(nèi)置創(chuàng)建數(shù)據(jù)庫連接向?qū)Ш蛷?fù)制拷貝表向?qū)А?br />
【官方介紹】
Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運(yùn)行,數(shù)據(jù)抽取高效穩(wěn)定。Kettle 中文名稱叫水壺,該項目的主程序員MATT 希望把各種數(shù)據(jù)放到一個壺里,然后以一種指定的格式流出。Kettle這個ETL工具集,它允許你管理來自不同數(shù)據(jù)庫的數(shù)據(jù),通過提供一個圖形化的用戶環(huán)境來描述你想做什么,而不是你想怎么做。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,job則完成整個工作流的控制。
【特色介紹】
整體性能增強(qiáng)新的錯誤處理代碼(重播)閱讀文本文件和Excel文件
新步驟:刪除值映射,設(shè)置變量,把變量,得到的文件名,把文件
從結(jié)果中,在結(jié)果和阻塞步驟中設(shè)置文件
搜索元數(shù)據(jù)的功能在Spoon:尋找一個值或參數(shù)
各種參數(shù)的轉(zhuǎn)換和工作功能
可能進(jìn)出庫,即使在批量備份
定位的代碼轉(zhuǎn)換成英語,中文,法語,德語和荷蘭語
許多增強(qiáng)現(xiàn)有的步驟和工作項
測井能力
容易固定目標(biāo)表映射
改進(jìn)的外觀和感覺的所有平臺

【功能介紹】
同時設(shè)計和編輯多個轉(zhuǎn)換存儲庫改進(jìn)包括名稱、用戶、對象類型排序內(nèi)容的能力和修改日期
變量增強(qiáng)包括在許多步驟類型和視覺指標(biāo)上增加支持支持變量的所有字段強(qiáng)大的新步驟
高性能,基于表達(dá)式的JavaScript步驟
添加xml步驟,用于從流字段生成復(fù)雜的xml結(jié)構(gòu)為內(nèi)部、左外、右外、滿的高級連接合并連接步驟外
快速排序合并連接合并在同一密鑰上的多個流使用Web服務(wù)動態(tài)檢索參數(shù)的HTTP客戶端查找
其他
遠(yuǎn)程監(jiān)控轉(zhuǎn)換和工作執(zhí)行
使用xml而不必使用存儲庫共享數(shù)據(jù)庫連接的能力
能夠回滾整個轉(zhuǎn)換錯誤(獨(dú)特的連接)

【安裝步驟】
該軟件必須在java下運(yùn)行,所以我們需要先安裝java,步驟如下:點(diǎn)擊執(zhí)行文件后,默認(rèn)繼續(xù)點(diǎn)擊【下一步】

默認(rèn)選擇開發(fā)工具,安裝目錄可以默認(rèn),也是選擇安裝到其他磁盤下,繼續(xù)點(diǎn)擊下一步

正在進(jìn)行安裝狀態(tài),需要耐心等待幾分鐘

默認(rèn)安裝jre,之錢jdk路徑?jīng)]有更改的話,就默認(rèn)即可,繼續(xù)點(diǎn)擊下一步

安裝狀態(tài)顯示安裝進(jìn)度條,需要等待一會,如果安裝完成,提示已安裝成功,點(diǎn)擊關(guān)閉按鈕即可


系統(tǒng)計算機(jī)右鍵菜單中點(diǎn)擊屬性--->彈出窗口高級--->點(diǎn)擊環(huán)境變量

點(diǎn)擊新建,彈出窗口輸入:JAVA_HOME,值:輸入JDK安裝路徑【C:\Program Files\Java\Jdk1.8.0_60】,點(diǎn)擊確定


在系統(tǒng)變量中找到Path,把JAVA_HOME配置到path中,選擇中path后,點(diǎn)擊編輯,把JAVA_HOME\bin;配置到最前面

檢驗JDK是否配置成功,運(yùn)行CDM后,輸入java -version后,回車就是現(xiàn)實(shí)jdk版本信息說明成功了。
或者輸出java回車,輸出信息后,在輸入javac,如果輸出正常說明成功


配置kettle環(huán)境變量,找到kettle存放路徑,KETTLE_HOME:D:\...(存放路徑)

部署kettle,把下載好的kettle解壓到指定目錄中即可

在kettle跟目錄中找到spoon.bat文件,找到后,并雙擊運(yùn)行即可
因為kettle是免安裝的,所以可以直接運(yùn)行即可

如果配置完成后,運(yùn)行啟動界面和啟動后界面,如圖所示

【使用方法】
打開kettle首先解壓下載下來的壓縮包如:pdice320stable.zip
然后打開Spoon.bat,如圖所示:
打開后請耐心等待一會兒時間。

建立轉(zhuǎn)換
在文件-》新建裝換。
新建轉(zhuǎn)換后在左邊的主對象樹中建立DB連接用以連接數(shù)據(jù)庫。如圖所示:
建立數(shù)據(jù)庫連接的過程與其他數(shù)據(jù)庫管理軟件連接數(shù)據(jù)庫類似。
注意:在數(shù)據(jù)庫鏈接的過程中,可能會報某個數(shù)據(jù)庫連接找不到的異常。那是因為你沒有對應(yīng)的數(shù)據(jù)庫鏈接驅(qū)動,請下載對應(yīng)驅(qū)動后,放入kettle的lib文件夾。

簡單的數(shù)據(jù)表插入\更新
(1)新建表插入
在左邊的面板中選擇“核心對象”,在核心對象里面選擇“輸入-》表輸入”,用鼠標(biāo)拖動到右邊面板。如圖所示:

雙擊拖過來的表,可以編輯表輸入。
選擇數(shù)據(jù)庫連接和編輯sql語句,在這一步可以點(diǎn)擊預(yù)覽,查看自己是否連接正確。

(2)通過插入\更新輸出到表。
在左邊面板中選擇核心對象、選擇“輸出-》插入\更新”如圖所示:

編輯插入更新:
首先:表輸入連接插入更新。
選中表輸入,按住shift鍵,拖向插入更新。

然后:雙擊插入更新,編輯它。
到這里基本上,這個轉(zhuǎn)換就要做完了,可以點(diǎn)擊運(yùn)行查看效果,看是否有誤,這個要先保存了才能運(yùn)行,可以隨意保存到任何一個地方。

使用作業(yè)控制上面裝換執(zhí)行。
使用作業(yè)可以定時或周期性的執(zhí)行轉(zhuǎn)換,新建一個作業(yè)。并從左邊面板拖入start 和轉(zhuǎn)換。

雙擊start可以編輯,可以設(shè)置執(zhí)行時間等等

點(diǎn)開裝換,可以設(shè)置需要執(zhí)行的轉(zhuǎn)換任務(wù),比如可以執(zhí)行上面我們做的轉(zhuǎn)換,XXX.ktr
最后點(diǎn)擊運(yùn)行即可。

【更新日志】
改進(jìn)的性能和可擴(kuò)展性遠(yuǎn)程監(jiān)控和執(zhí)行轉(zhuǎn)換
集群支持(MPP)
數(shù)據(jù)庫分區(qū)支持(不與表劃分混淆)
大量的內(nèi)存和性能改進(jìn)
增強(qiáng)的數(shù)據(jù)庫支持
改進(jìn)的報價算法
在步驟中分離架構(gòu)/所有者和表名
數(shù)據(jù)庫連接池支持





































