橫瓜html網(wǎng)頁(yè)文章信息抽取器是一款網(wǎng)頁(yè)文章信息抽取器,該軟件是制作搜索引擎、網(wǎng)絡(luò)蜘蛛、網(wǎng)絡(luò)爬蟲(chóng)、分詞索引的核心組件。
【基本簡(jiǎn)介】 橫瓜html網(wǎng)頁(yè)文章信息抽取器采用人工智能啟發(fā)式算法、高斯積分去噪算法,對(duì)html格式的源代碼網(wǎng)頁(yè)進(jìn)行抽取,通過(guò)過(guò)濾無(wú)用的htm標(biāo)簽、主題相悖信息,抽取出核心正文信息。
dll及ocx調(diào)用請(qǐng)聯(lián)系qq(601069289)。
軟件截圖: