濟南網站優化公司,為您提供專業的網站優化,排名優化,關鍵詞優化服務,seo優化師一對一對接,助您快速提升網站關鍵詞排名.

濟南網站優化

幫助企業快速提升網站排名和流量

專注網站優化,SEO關鍵詞排名,一切用數據說話!

整站優化業務咨詢

野外技術搜索引擎優化:現實問題和修復

點擊次數: 發布時間:2020-01-09 11:30文章來源:搜索引擎優化

關于技術搜索引擎優化的很多內容都是純粹的理論; 網站應如何與搜索引擎抓取工具和索引系統進行交互的理想世界場景。

在現實世界中,事情變得混亂。網站不是原始的內容傳送系統,搜索引擎不是絕對可靠的人工智能領域,而且編碼網站的人會犯很多無意的錯誤。

多年來,我已經分析了無數網站的技術搜索引擎優化問題,我遇到了許多問題,純粹的seo理論不容易解釋。相反,這些問題需要一些實用的方法來解決,有時問題的根本原因仍然無法解釋。

在這里,我將概述其中的一些問題,并希望能給你一些想法,如果碰巧碰到它們,就自己排除故障并解決類似的問題。

結構化數據和豐富的代碼段我的一位客戶最近將他們的網站遷移到了一個新的技術堆棧,無論如何,這個技術堆棧比他們網站的先前版本更快,更優化。在遷移之前,此客戶在google的搜索結果中享有大量豐富的摘要。具體來說,他們在大多數關鍵頁面上都有星級評分片段。

然而,在他們遷移后,他們很快失去了所有這些星級評級。我們無法弄清楚原因。

谷歌的結構化數據測試工具(sdtt)沒有提供任何幫助。該工具正確識別了網站上的結構化數據,似乎是完全有效的標記。那么為什么谷歌會忽略該標記并從該客戶的頁面中刪除星級評分片段?

###

我們決定嘗試一些我們認為不會產生太大影響的東西,但最終解決了整個問題:我們將結構化數據片段移動到頁面源代碼的<head>部分。

這對sdtt沒有任何影響,因為它不會以任何方式影響標記的有效性。看看html源代碼中出現的內容的順序是否會影響google處理它的方式,這是最后的努力。

在我們進行此更改后不久,該網站的豐富網頁摘要迅速開始回歸。幾天之內,所有丟失的星級評分片段都已歸還。

###

結構化數據標記的位置對google處理它的方式產生了巨大的影響。

雖然從理論上講,它應該在標記所在的位置沒有任何區別 - 只要它存在于原始html源代碼中 - 實際上,該片段應位于<head>部分,以便網站在搜索中實現豐富的片段引擎結果頁面。

google的文檔并未立即顯示這一點。沒有明確提到必須將標記放在頁面的<head>部分而不是<body>中。

然而,在這個問題的背后,我建議我始終將結構化數據標記放在頁面的html源代碼的<head>部分。這似乎可以讓google更輕松地處理結構化數據,并有助于為更多客戶實現豐富的代碼段。

hreflang元標簽和iframe我最近遇到了類似的問題。客戶的網站在其主頁上實施了hreflang元標記,以指示針對不同國家/地區的替代版本。這些hreflang標簽完全有效并且存在于所有版本的主頁中,但google無法識別它們。

###

客戶的開發人員絞盡腦汁試圖弄清楚什么可能阻止谷歌處理這些hreflang元標記。標簽存在于<head>部分的頁面的html源代碼中,因為它們應該是,并且它們與所有其他主頁完全互惠。這些標簽應該沒有任何問題。

然而,google并沒有在search console中報告這些內容,而是傾向于在其國際搜索結果中顯示錯誤的國家/地區版本。

當我接手這個客戶端時,我做的第一件事就是將頁面的html源代碼與完成的dom進行比較。前者是您在頁面上執行“查看源”時看到的內容,后者是瀏覽器在執行所有客戶端代碼(如javascript)時向最終用戶顯示頁面的內容。

在這里我發現了一些非常有趣的東西:在原始html代碼中,有一段javascript位于hreflang元標記之上。當頁面完全呈現并且所有客戶端代碼都已執行時,javascript 在頁面中插入了<iframe>。

###

這個iframe然后坐在hreflang元標記之上。事實證明,這是一個問題。

你看,iframe不屬于網頁的<head>部分。根據官方html5標準,iframe只應存在于頁面的<body>部分中。將iframe放在網頁代碼的<head>部分是違反官方w3c標準的。

當google為網頁編制索引時,它會嘗試解決許多此類標準問題。找到一個完全符合w3c標準的網頁是非常罕見的。幸運的是,html是一種非常寬容的標記語言。即使這些頁面具有無效標記,web瀏覽器和搜索引擎也能很好地處理大多數網頁。

然而,這個例子被證明是有問題的,它與谷歌的兩階段索引過程有關。索引的第一階段基于網頁的html源代碼,并且在此索引過程中不會執行任何客戶端腳本。然后google還對同一頁面進行第二階段索引,其中加載了客戶端腳本,并且頁面完全呈現為web瀏覽器。

###

在索引的第二階段,執行位于hreflang標記上方的頁面html源代碼中的javascript,并將iframe插入到頁面代碼中。

在我分析這個問題時,我記得jamie alberico和google的john mueller之間最近發生的關于這一點的談話:iframe在頁面的渲染代碼的<head>部分:

###

簡而言之,iframe不屬于頁面代碼的<head> ; 它們應該在頁面的<body>部分中。當google在<head>中看到iframe時,它會假定<head>已經結束并且頁面的<body>已經開始。

相反,hreflang標簽僅在頁面的<head>部分中存在時才有效。頁面的<body>中的任何hreflang標記都被視為無效,并且被google正式忽略。

似乎google將hreflang元標記作為索引第二階段的一部分進行處理。這為我的客戶創造了一個完美的風暴,谷歌渲染頁面并將iframe插入到代碼中。這導致google過早地處理其余代碼作為<body>的一部分,因此忽略了hreflang標簽的存在。

同樣,一旦我們找到了潛在的問題,解決方案就很簡單了。我們將有問題的javascript移動到<head>部分的末尾,其中iframe的任何插入都不會造成任何損害。

###

幾天之內,google就識別了該頁面的hreflang元標記,并開始在search console中報告它們的存在。

googlebot和自動ip重定向幾年前,我遇到了一個問題,當時,我真的很困惑。客戶剛剛推出了他們網站的新版本,作為其擴展戰略的一部分,他們擁有不同國家版本的網站; 一個針對美國,一個針對英國,一個針對世界其他地區。

該網站的美國版本很快開始排名并且似乎表現良好。然而,英國和世界其他地區的部分幾乎沒有從谷歌獲得任何流量。從歷史上看,英國一直是客戶的最大受眾,新網站在英國市場上表現不佳。

查看網站站長工具中的數據也沒有幫助。這是谷歌將其重命名為search console并為我們提供更多有用數據的方法。那時,我所要做的只是索引狀態報告,它顯示了索引頁面的數量相當少。sitemaps報告也沒有多大幫助 - 我們提交了一個包含所有網站頁面的xml站點地圖,在這里我們也只看到了一個低級別的索引,沒有真正暗示導致問題的原因。

在網站發布一兩周后,我在半夜醒來時帶著“尤里卡”時刻醒來。我突然知道根本問題是什么。

您看,這個新站點使用基于用戶ip地址的自動重定向。該網站將確定訪問者的ip地址與哪個國家/地區相關聯,然后自動將訪問者重定向到網站內容的正確版本。

###

當googlebot抓取網站時,它主要來自美國的ip地址。如果有的話,很少從國際ip地址抓取網站。

由于網站的所有頁面都存在自動ip重定向,因此每次查看與當前國家/地區不一致的頁面的嘗試都意味著您將被重定向到正確的國家/地區。

對于googlebot,這意味著除了美國部分之外,它無法看到該網站的任何其他部分。

每當googlebot嘗試抓取英國和世界其他地區的網頁時,網站都會將其重定向到美國部分。因此,雖然googlebot在美國網頁上具有完全可見性,但它無法看到 - 因此無法索引 - 該網站的其他部分。

一旦我們理解了問題,解決方案很簡單:我們更改了自動ip重定向,以便為googlebot訪問設置例外。這樣,googlebot從未被重定向到任何特定國家/地區,并且可以自由地抓取整個網站。

在我們進行此更改后,網站上的索引級別大幅提升,英國部門在很短的時間內從google獲得了大量流量,以使其恢復到遷移前的水平。

現實世界中的技術seo我希望這些例子表明,在現實世界中,技術搜索引擎優化問題可能非常難以識別。一個網站有很多相互影響的活動部分,有時一點點變化都可能導致一個巨大的問題。

分析網站時,并不總是擁有您想要的所有數據。例如,如果我們為每個國家/地區版本提供不同的xml站點地圖,那么ip重定向問題會更容易識別,但事實并非如此,因此我們不得不根據我們所擁有的少量信息進行推斷。

一般來說,它需要很好地理解seo,特別是技術seo,能夠識別,分析和修復這些問題。充分了解搜索引擎如何抓取和索引網頁是必須的 - 這是所有技術搜索引擎優化的根源。

日韩av色综合