
【軟件特色】
以起點為樣本,多站點多線程爬取校對支持導(dǎo)出txt,以兼容大多數(shù)閱讀器
支持導(dǎo)出markdown,可以用pandoc轉(zhuǎn)換成epub,保留書本信息、卷結(jié)構(gòu)、作者信息
內(nèi)置簡單的廣告過濾(現(xiàn)在還不完善)
用Golang編寫,安裝部署方便,外部依賴只有PhantomJS
【使用方法】
輸入起點鏈接獲取到書本信息,開始爬取每章內(nèi)容,遇到vip章節(jié)放入Example中作為校對樣本
手動設(shè)置筆趣閣等盜版小說的對應(yīng)鏈接,tamp字段
再次啟動,開始爬取,只爬取VIP部分,并跟Example進行校對
手動編輯對應(yīng)的緩存文件,手動刪除廣告和某些隨機字符(有部分是關(guān)鍵字,可能會導(dǎo)致pandoc內(nèi)存溢出或者樣式錯誤)
d -f md生成markwown
用pandoc轉(zhuǎn)換成epub,pandoc -o xxxx.epub xxxx.md
【功能介紹】
未實現(xiàn)功能爬取起點的時候帶上Cookie,用于爬取已購買章節(jié)
支持刺猬貓(即“歡樂書客”)
支持直接輸出epub,不需要pandoc
支持小說站內(nèi)搜索
多線程轉(zhuǎn)換md
整理main包中的面條邏輯
整理命令行參數(shù)風格
在windows下,md轉(zhuǎn)換到epub時有路徑問題
完善廣告過濾
簡化使用步驟
優(yōu)化log輸出
書本簡介也應(yīng)該為HTML。即<p>??</p>而不是現(xiàn)在的用\t和\n
【更新日志】
小說站內(nèi)搜索命令行整理
修改站點匹配結(jié)構(gòu)
各個輸出格式略作整理


































