• <s id="1jjov"><bdo id="1jjov"></bdo></s>
    <s id="1jjov"></s>

    
    

      <sup id="1jjov"></sup>
        1. <s id="1jjov"><nobr id="1jjov"><ins id="1jjov"></ins></nobr></s>
          位置:采集 > 管理節(jié)點(diǎn) > 修改節(jié)點(diǎn)
          基本信息
          節(jié)點(diǎn)名稱: (如:體育,娛樂(lè)等)
          父節(jié)點(diǎn):
          采集頁(yè)面地址:
          (一行為一個(gè)列表)


          采集頁(yè)面為直接內(nèi)容頁(yè)
          采集頁(yè)面地址方式二:
          (此方式,系統(tǒng)自動(dòng)生成頁(yè)面地址)
          地址: (分頁(yè)變量用 替換)
          頁(yè)碼從 之間,間隔倍數(shù) 倒序 補(bǔ)零
          (如:http://m.newskycloth.com/index.php?page=[page])
          內(nèi)容頁(yè)地址前綴:
          (如地址前面沒(méi)域名的話,系統(tǒng)會(huì)加上此前綴)
          圖片/FLASH地址前綴(內(nèi)容): (圖片地址為相對(duì)地址時(shí)使用)
          入庫(kù)欄目: (如本節(jié)點(diǎn)不是采集節(jié)點(diǎn),請(qǐng)不選)
          入庫(kù)專題:
          開始時(shí)間: (格式:2007-11-01)
          結(jié)束時(shí)間: (格式:2007-11-01)
          備注:
          選項(xiàng)
          默認(rèn)相關(guān)關(guān)鍵字: 截取標(biāo)題前 個(gè)字

          采集記錄數(shù):

          采集前 條記錄("0"為不限,系統(tǒng)會(huì)從頭采到頁(yè)面尾)
          遠(yuǎn)程保存圖片到本地(內(nèi)容): (入庫(kù)時(shí)才會(huì)保存, 加水印)
          遠(yuǎn)程保存FLASH到本地(內(nèi)容): (入庫(kù)時(shí)才會(huì)保存)
          標(biāo)題圖片設(shè)置: 取第 張圖片為標(biāo)題圖片( 生成縮略圖:寬度 ×高度 )
          每組列表采集個(gè)數(shù): 每組采集 個(gè)列表頁(yè)(防止采集超時(shí))
          每組信息采集個(gè)數(shù): 每組采集 個(gè)信息頁(yè)(防止采集超時(shí))
          每組入庫(kù)數(shù): 每組入 條記錄(防止入庫(kù)超時(shí))
          每組采集時(shí)間間隔 (0為連續(xù)采集)
          附加選項(xiàng)
          頁(yè)面編碼轉(zhuǎn)換
          正常編碼 UTF8->GB2312 BIG5->GB2312 UNICODE->GB2312
          是否重復(fù)采集同一鏈接 重復(fù)采集(不選為不重復(fù)采集)

          是否隱藏已導(dǎo)入的信息

          采集后自動(dòng)入庫(kù) 是, 直接審核(不推薦選擇,因?yàn)榭赡苋霂?kù)超時(shí))
            入庫(kù)后自動(dòng)刪除已導(dǎo)入的信息記錄
          整體頁(yè)面過(guò)濾正則
          格式:廣告開始[!--pad--]廣告結(jié)束
          IFRAME TABLE FORM
          OBJECT TR TBODY
          SCRIPT TD  
          STYLE A  
          DIV FONT  
          SPAN IMG  
          (多個(gè)請(qǐng)用","格開)  
          整體頁(yè)面替換 替換成
          (原字符多個(gè)請(qǐng)用","格開,如果是新字符是多個(gè),可以用","格開,系統(tǒng)會(huì)對(duì)應(yīng)替換)
          過(guò)濾選項(xiàng)
          采集關(guān)鍵字(包含關(guān)鍵字才會(huì)采): (只針對(duì)標(biāo)題。如不限制,請(qǐng)留空。多個(gè)請(qǐng)用","格開)
          替換:
          (針對(duì)標(biāo)題與內(nèi)容)
          替換成
          (原字符多個(gè)請(qǐng)用","格開,如果是新字符是多個(gè),可以用","格開,系統(tǒng)會(huì)對(duì)應(yīng)替換)
          過(guò)濾廣告正則:
          格式:廣告開始[!--ad--]廣告結(jié)束
          (針對(duì)內(nèi)容)
          IFRAME TABLE FORM
          OBJECT TR TBODY
          SCRIPT TD  
          STYLE A  
          DIV FONT  
          SPAN IMG  
          (多個(gè)請(qǐng)用","格開)  
          內(nèi)容為空不采集 (newstext字段)
          過(guò)濾相似: 不采集標(biāo)題相似超過(guò) 字的信息[與入庫(kù)信息比較](如不限制請(qǐng)?zhí)?quot;0")
            不采集標(biāo)題完全相同的信息(與入庫(kù)信息比較)
          截取內(nèi)容簡(jiǎn)介:

          截取信息內(nèi)容 個(gè)字(在沒(méi)有設(shè)置“內(nèi)容簡(jiǎn)介”正則,系統(tǒng)采取的措施)

          采集內(nèi)容正則(不采集項(xiàng),請(qǐng)留空)
          列表頁(yè)  
          信息鏈接區(qū)域正則:
          (如不限,請(qǐng)為空)
          截取的地方加上
          如:<tr><td>鏈接區(qū)域</td></tr>
          正則就是:
          <tr><td>[!--smallurl--]</td></tr>
          信息頁(yè)鏈接正則:
          截取的地方加上
          如:<a href="信息鏈接">標(biāo)題</a>
          正則就是:
          <a href="[!--newsurl--]">*</a>

          標(biāo)題圖片正則:
          (如圖片在內(nèi)容頁(yè),請(qǐng)留空)

          圖片地址前綴: 保存本地
          (如填這里,將為此字段值)
          內(nèi)容頁(yè)(文件過(guò)大的請(qǐng)不要選擇保存本地)
          標(biāo)題正則:
          ()
          (如填寫這里,將為字段的值)
          副標(biāo)題正則:
          ()
          (如填寫這里,將為字段的值)
          發(fā)布時(shí)間正則:
          ()
          (如填寫這里,將為字段的值)
          標(biāo)題圖片正則:
          ( )
          附件前綴 遠(yuǎn)程保存
          (如填寫這里,這就是字段的值)
          內(nèi)容簡(jiǎn)介正則:
          ()
          (如填寫這里,將為字段的值)
          作者正則:
          ()
          (如填寫這里,將為字段的值)
          信息來(lái)源正則:
          ()
          (如填寫這里,將為字段的值)
          新聞?wù)恼齽t:
          ()
          (如填寫這里,將為字段的值)
          內(nèi)容頁(yè)分頁(yè)采集設(shè)置:(如沒(méi)有分頁(yè)請(qǐng)留空,只對(duì)newstext有效)
          入庫(kù)是否保留原分頁(yè): 保留分頁(yè) 不保留分頁(yè)
          分頁(yè)形式: 上下頁(yè)導(dǎo)航式 全部列出式
          "全部列出"式正則設(shè)置:
          分頁(yè)區(qū)域正則([!--smallpageallzz--]) 分頁(yè)鏈接正則([!--pageallzz--])
          "上下頁(yè)導(dǎo)航"式正則設(shè)置:
          分頁(yè)區(qū)域正則([!--smallpagezz--]) 分頁(yè)鏈接正則([!--pagezz--])
           

          注意事項(xiàng):
          1.*:表示不限制內(nèi)容。行與行之間的間隔最好用*格開
          2.增加節(jié)點(diǎn)后,最好先“預(yù)覽”。
          3.對(duì)于特殊字符請(qǐng)?jiān)谇懊婕由稀癨\”,當(dāng)然直接將特殊字符改為“*”最合適了。特殊字符如下:
          ),(,{,},[,],\,?
          4.同一信息鏈接系統(tǒng)不會(huì)重復(fù)采集。
        2. <s id="1jjov"><bdo id="1jjov"></bdo></s>
          <s id="1jjov"></s>

          
          

            <sup id="1jjov"></sup>
              1. <s id="1jjov"><nobr id="1jjov"><ins id="1jjov"></ins></nobr></s>
                欧美一级 片内射欧美AA99 | 操泥马网 | 吴梦梦无码一区二区三区首发新作 | 444av| 人人操人人吻人人干 | 婷婷丁香亚洲日韩 | 在线观看日韩黄色电影 | 五月丁香六月 | 亚洲婷婷六月天 | 精品五月丁香婷婷一区 |