java是什么 為什么很少人討論或者使用java爬蟲(chóng)?
為什么很少人討論或者使用java爬蟲(chóng)?1. 爬行動(dòng)物的經(jīng)濟(jì)價(jià)值是什么?只有在有經(jīng)濟(jì)價(jià)值的情況下,才有必要開(kāi)發(fā)這種爬行動(dòng)物。不幸的是,在今天的許多情況下,爬行動(dòng)物并沒(méi)有太大的價(jià)值。僅:采用比價(jià)、數(shù)據(jù)統(tǒng)計(jì)
為什么很少人討論或者使用java爬蟲(chóng)?
1. 爬行動(dòng)物的經(jīng)濟(jì)價(jià)值是什么?只有在有經(jīng)濟(jì)價(jià)值的情況下,才有必要開(kāi)發(fā)這種爬行動(dòng)物。不幸的是,在今天的許多情況下,爬行動(dòng)物并沒(méi)有太大的價(jià)值。僅:采用比價(jià)、數(shù)據(jù)統(tǒng)計(jì)、搜索引擎、信用爬蟲(chóng)等有限的場(chǎng)合,這些場(chǎng)合基本被大公司壟斷。現(xiàn)在很少有人寫(xiě)爬行動(dòng)物。
2. 寫(xiě)爬行動(dòng)物有多難?一天早上,就這樣。所以沒(méi)有什么困難。最多,設(shè)置useragent,設(shè)置refer,首先獲取cookie,設(shè)置延遲等等。從錢(qián)的角度看,估計(jì)值三四百元左右?;ㄙM(fèi)不多。
3. 爬行動(dòng)物能活多久?長(zhǎng)期以來(lái),只要爬網(wǎng)系統(tǒng)不升級(jí),就可以一直使用。換句話說(shuō),寫(xiě)爬蟲(chóng)半年是很常見(jiàn)的。Stackoverflow在國(guó)外是一個(gè)非常好的技術(shù)問(wèn)答社區(qū)。importnew的許多翻譯都是關(guān)于Java框架的原理、規(guī)范等。我非常喜歡InfoQ。我不怎么談?wù)揋itHub這有點(diǎn)離題,但是很多優(yōu)秀的開(kāi)源框架都托管在Apache社區(qū)中。在這里你會(huì)發(fā)現(xiàn)很多你沒(méi)聽(tīng)說(shuō)過(guò)的好東西。Ifeve是一個(gè)并發(fā)編程網(wǎng)絡(luò),它對(duì)并發(fā)事物有全面的描述。老虎嗅探可以獲取尖端科技信息