北京網(wǎng)站設(shè)計(jì)
公司
丁丁貓:昨天,一個百度不正常的一天,很多的網(wǎng)站百度快照不更新了,還是保留在24日的快照。今天百度對有些網(wǎng)站的收錄發(fā)展了一些變化,有部分網(wǎng)站的收錄減少到只有幾頁。那么百度為何收錄頁面有放棄呢?是什么原因?qū)е轮挥械膯栴}出現(xiàn)呢?
頁面收錄后消失的方式有兩種:第一種是收錄后第二天即從百度消失;第二種是收錄一段時(shí)間后從百度消失。
第一種情況比較好解釋,這種情況往往出現(xiàn)在采集站,由于采集來的內(nèi)容相似性比較高,百度收錄后會對比比較后扔掉一些質(zhì)量較差的網(wǎng)站頁面,也就是權(quán)重較低的網(wǎng)站頁面。除此之外
服務(wù)器原因還有同
服務(wù)網(wǎng)站被K也會出現(xiàn)這樣的問題。
第二種情況是今天要說的重點(diǎn),站長朋友在用站長工具查詢自己網(wǎng)站的時(shí)候會經(jīng)常發(fā)現(xiàn)網(wǎng)站的百度收錄數(shù)量減少,但是網(wǎng)站每天都會收錄新的頁面為什么反而會減少呢,下邊來詳細(xì)講解這個情況的原因。
既然說到百度收錄頁面變化我們就先說說百度收錄頁面的原理,百度收錄共有4步:爬行和抓取——索引——搜索詞處理——排序,經(jīng)過這四步后在我們搜索的時(shí)候搜索引擎將這些展現(xiàn)在我們面前。我們能夠控制的是爬行和抓取,做外鏈不但可以增加網(wǎng)站權(quán)重而且可以增加百度蜘蛛爬行次數(shù),次數(shù)越多自然抓取的幾率也就更高。之后是百度根據(jù)抓取的頁面里關(guān)鍵詞出現(xiàn)的位置、字體、顏色、加粗、斜體等相關(guān)信息做相應(yīng)記錄,然后是進(jìn)行分詞處理,最后是排序,對搜索詞處理后,搜索引擎程序便開始工作,從索引數(shù)據(jù)庫中找出所有包含搜索詞的網(wǎng)頁,并且根據(jù)排名算法計(jì)算出哪些網(wǎng)頁應(yīng)該排在前面,然后按照一定格式返回到“搜索”頁面。
百度收錄頁面也就是抓取網(wǎng)站的頁面,百度會根據(jù)自己的一套策略來分辨這個頁面對用戶是否有用,并且對其評分,每爬取一次會做一次評分,當(dāng)分?jǐn)?shù)達(dá)到要求了百度就會收錄,其中評分受網(wǎng)站權(quán)重的影響比較大,這也就是網(wǎng)站權(quán)重高的網(wǎng)站頁面比較容易收錄,就像A5站長網(wǎng),你發(fā)文章之后幾分鐘就會被百度收錄,這就是網(wǎng)站賦予新頁面的權(quán)重讓其快速收錄。如果一個站權(quán)重不是很高,當(dāng)頁面鏈接出現(xiàn)在首頁的時(shí)候,傳遞給頁面的權(quán)重比較多,百度評分滿足收錄要求對其收錄了,由于網(wǎng)站不斷更新,等頁面離開網(wǎng)站首頁后權(quán)重降低,評分無法滿足百度收錄要求,這樣收錄頁面就會從百度消失,由于網(wǎng)站權(quán)重是不斷提升的,頁面的權(quán)重也會得到提升,最后滿足收錄評分要求被重新收錄,這就是網(wǎng)站的百度收錄數(shù)量會出現(xiàn)S型波動變化的原因。
轉(zhuǎn)發(fā)請注明:丁丁貓