SEO教程提供SEO基礎入門教程
微笑SEO優化教程網:關注本站讓你的SEO不斷進步!

如何做一個有排名的內容頁

您現在的位置:SEO教程 > SEO優化教程 > 時間:2018-06-27 10:19:08 > 作者:smiseo
這一部分內容應該是搜索引擎原理中非常重要的一部分,并且網絡上和其他SEO相關書籍中已經把這部分內容分析得很透徹,筆者并不能夠對這些原理性的內容寫出多么新的內容,所以在此只對重點內容進行簡單分析。很多站長和SEO人員在對SEO書籍和網絡文章中的這部分內容進行閱讀時,都會一掃而過,其實這部分內容中有不少東西值得仔細研究思考,并運用到日常的SEO工作中。不論是白帽SEO還是黑帽SEO,在這一部分都有很多技術和邏輯上的操作空間。在以下的內容中,筆者會把對SEO工作比較有指導意義、篇幅比較大、需要詳細介紹的模塊抽離出來進行獨立介紹。
 
內容處理:
內容處理即搜索引擎對Spider抓取回來的頁面進行處理。處理步驟簡單介紹如下。
1.要判斷該頁面的類型:首先要判斷該頁面的類型是普通網頁,還是PDF, Word, Excel等特殊文件文檔。如果是普通網頁還要判斷該網頁的類型是普通文本內容、視頻內容,還是圖片內容。甚至還會對網頁是普通文章頁還是論壇帖子進行判斷,然后有針對性地進行內容處理。
 
2.提取網頁的文本信息:當下搜索引擎雖然在努力讀取JavaScript, Flash、圖片和視頻,但是對于普通網頁“的索引還是以文本為主。此時還會提取頁面的Title, Keywords, Description等標簽中的內容,雖然一直有信息說Keywords標簽已經被主流大型搜索引擎拋棄了,但是經過多人實際測試,至少百度多多少少還是會參考Keywords標簽的。
 
 
3.去除頁面噪聲:如果該網頁是普通網頁,則搜索引擎會把與該網頁內容無關的廣告、導航、鏈接、圖片、登入框、網站版權信息等內容全部剔除掉,只提取出該網頁的主體內容。其實目前在這一步中,百度并不會把主體內容之外的東西全部拋棄,相關推薦的內容在一定程度上也會被算作本頁的內容,或者是對本頁主體內容的補充,也會在搜索排名中有直觀的體現。甚至與頁面不相干的鏈接文本也會被保留索引,比如,百度搜索“復制本文鏈接”向后翻幾頁,就會看到如圖2-7所示的結果。其實“復制本文鏈接”只存在于這些頁面按鈕上,但是也被索引了,如圖2-8所示。所以搜索引擎的去除噪聲,并不是很嚴格。因此SEO人員對于網頁主體內容外的推薦內容、鏈接、鏈接錨文本等一切元素也要善于利用,而不是隨便堆一些不相干的內容。很多人都說SEO需要注重細節,但是這些細節又有多少站長和SEO人員真正地重視、研究和利用了呢?
復制本文鏈接
 
復制本文鏈接
 
4.去除內容中的停止詞:
接下來應該是對剩余文本內容的分詞處理(會在下一章詳說),然后搜索引擎會剔除掉諸如“得”“的”“啊”“地”“呀”“卻”之類的停止詞。其實此步驟是存在疑問的,對于普通文章來說,去除這些停止詞會有利于搜索引擎對內容進行分詞和理解,并且可以減少搜索引擎的計算量。但是在搜索引擎中單獨搜索這些詞也是有豐富的搜索結果的,如圖2-9所示;當搜索包含這些詞的關鍵詞時,也會有比較豐富的搜索結果,不過會弱化這些停止詞對搜索結果的影響,如圖2-10所示。所以搜索引擎在對普通文章的處理中應該會有此步驟,但并不是機械嚴格去除的,也要看這些詞在頁面上的作用(搜索引擎在分詞的時候也會進行詞性識別,同一個詞在不同位置詞性可能不同)。此處對SEO人員的工作并沒有太多影響,所以不必深究。經過這些處理后,Spider抓取回來的網頁內容就被“洗”干凈了,再經過2.2.2中獨立介紹的分詞處理及2.3中獨立介紹的去重處理后,搜索引擎就會對已經被初步處理過且有索引價值的網頁內容進行正向索引和倒排索引處理了。
去除內容中的停止詞
 
 
去除內容中的停止詞
 

分詞算法會在下一章詳說!
本文出自微笑SEO優化教程網,未經允許不得轉載:如何做一個有排名的內容頁 http://www.dklwl.com/seoyhjc/246.html
? 亚洲视频在线不卡免费