了解你的網(wǎng)站結(jié)構(gòu)和外部鏈接權(quán)重
直觀地了解你的網(wǎng)站結(jié)構(gòu)和外部鏈接的權(quán)重的影響
尋找的見(jiàn)解不容易從電子表格和原始數(shù)據(jù)?專(zhuān)欄作家Dave Davies解釋了如何使用網(wǎng)絡(luò),數(shù)據(jù)可視化工具,創(chuàng)建一個(gè)視覺(jué)表現(xiàn)你的網(wǎng)站結(jié)構(gòu)方面的入站鏈接強(qiáng)度。
他們說(shuō),一張圖片勝過(guò)一千個(gè)字,哇,他們是正確的!
今天,我要說(shuō)明強(qiáng)大的方式來(lái)可視化你的網(wǎng)站結(jié)構(gòu),特別是因?yàn)樗婕暗巾?yè)面,獲得導(dǎo)入鏈接;然而,我們也會(huì)討論其他的應(yīng)用程序中使用的分析指標(biāo)或其他第三方數(shù)據(jù)這一技術(shù)。
有許多原因,你想這么做,其中的數(shù)據(jù)提供了一個(gè)可視化的語(yǔ)境。我們將在下面看到的,數(shù)據(jù)的可視化表示可以幫助快速識(shí)別網(wǎng)站的結(jié)構(gòu),可能不是很明顯,當(dāng)作為一個(gè)電子表格或原始數(shù)據(jù)模式。你也可以使用這些視頻,解釋給客戶(hù)和其他利益相關(guān)者什么的在網(wǎng)站結(jié)構(gòu)上。
建立一個(gè)視覺(jué)表現(xiàn)我們網(wǎng)站的結(jié)構(gòu),因?yàn)樗婕暗降逆溄?,我們將?br />•運(yùn)行尖叫青蛙收集數(shù)據(jù)和內(nèi)部頁(yè)面鏈接結(jié)構(gòu)。
•增加反向鏈接的數(shù)量,每一頁(yè)都有對(duì)頁(yè)面的度量。
•利用網(wǎng)絡(luò)創(chuàng)建一個(gè)可視化表示這個(gè)數(shù)據(jù)。
對(duì)于那些不熟悉Gephi,它是一個(gè)開(kāi)源的數(shù)據(jù)可視化工具-基本上,它把數(shù)據(jù)變成一個(gè)互動(dòng)的圖片。
讓你的核心數(shù)據(jù)
無(wú)論你想看到你的網(wǎng)站結(jié)構(gòu)與你的網(wǎng)站流量或另一個(gè)度量,這個(gè)過(guò)程基本上是相同的。所以,讓我們開(kāi)始…
收集你的內(nèi)部鏈接結(jié)構(gòu)
第一步是下載尖叫的青蛙如果你沒(méi)有已安裝。在500的網(wǎng)址網(wǎng)站,免費(fèi)版就足夠了;那些大的網(wǎng)站可能需要購(gòu)買(mǎi)高級(jí)版本,雖然他們?nèi)匀豢梢允褂妹赓M(fèi)版得到一些粗略的想法是什么,他們的網(wǎng)站結(jié)構(gòu)做。
現(xiàn)在,使用尖叫的青蛙爬你想地圖網(wǎng)站。你不需要采集圖像、CSS、JavaScript等,因此蜘蛛配置應(yīng)該看起來(lái)像下面的截圖。(不過(guò),你會(huì)想讓你自己決定是否你想爬子等,根據(jù)您的需求和網(wǎng)站的結(jié)構(gòu)。)
輸入您想查詢(xún)點(diǎn)擊“啟動(dòng)域 。” 一旦抓取完成后,它的時(shí)間將數(shù)據(jù)導(dǎo)出和清潔一下。要做到這一點(diǎn),簡(jiǎn)單地去:
大宗出口> >成功響應(yīng)代碼(2xx)鏈
下載完成后,打開(kāi)文件并做如下:
• 刪除含有“All Inlinks第一排。”
•刪除第一列,“型”。
•重命名“目的地”一欄的“目標(biāo)”。
•刪除其他所有列在“源”和“目標(biāo)”。
•保存編輯過(guò)的文件。你可以叫它任何你想要的,但我會(huì)在我的整個(gè)文章作為<strong>working.csv</strong>。
我高度推薦通過(guò)掃描你的源和目標(biāo)列中查找異常。例如,我的網(wǎng)站爬下面的屏幕快照包含錨鏈接了大量的頁(yè)面。我沒(méi)有在目標(biāo)列標(biāo)簽快速搜索和刪除那些他們不反對(duì)我的鏈路流量信息。
這樣,留給我們的是一個(gè)電子表格,應(yīng)該是這個(gè)樣子:
這個(gè)數(shù)據(jù)就可以很酷的分析,為此,我推薦閱讀Patrick Stox的文章,”Gephi PageRank和網(wǎng)頁(yè)組易于可視化”。
在他的文章中,Stox用Gephi可視化頁(yè)面之間的關(guān)系在一個(gè)網(wǎng)站上,看到哪些頁(yè)面是最強(qiáng)的(基于網(wǎng)站的內(nèi)部鏈接圖)。
你可以閱讀他的文章的方向和描述,但總之,我們看到的是不同的“集群”頁(yè)面(基于頁(yè)面的鏈接在一起,最經(jīng)常不完美但不壞),按顏色和大小的內(nèi)部鏈接(與大多數(shù)與出現(xiàn)較大)頁(yè)。
這個(gè)信息是有用的,可以肯定。但如果我們想要更多的嗎?如果我們想真正的彩色頁(yè)面根據(jù)他們網(wǎng)站的部分,如果我們希望他們的大小由數(shù)入站<em>外</em>鏈接?
要做到這一點(diǎn),首先你需要下載你的頂部鏈接的網(wǎng)頁(yè)從谷歌搜索控制臺(tái)。如果你還沒(méi)有這樣做之前,你只需登錄到您的帳戶(hù)并做以下搜索控制臺(tái):
•點(diǎn)擊“搜索流量”在左側(cè)導(dǎo)航。
•單擊“鏈接到你的網(wǎng)站”,打開(kāi)菜單。
•點(diǎn)擊“更多> >“柱”下你最鏈接的內(nèi)容。”
•“下載此表。”
唯一的問(wèn)題是它的下載數(shù)據(jù),對(duì)于我們的目的,我們需要在一個(gè)域的URL的形式,和表只顯示路徑。 處理這很容易,你可以簡(jiǎn)單地:
•打開(kāi)電子表格。
•在URL路徑中插入新列。
•把你的域名https://www.yourdomain.com/單元格A3中(假設(shè)B2包含您的域的奇怪的是充分展示了唯一的URL),你沒(méi)有創(chuàng)建HTTPS:/ / www.yourdomain。COM / HTTPS:/ / www.yourdomain。COM /。
•雙擊你最近添加的域復(fù)制域到電子表格底部的單元格的右下角。
•選擇列A和B的數(shù)據(jù)(域和路徑)并將其復(fù)制到記事本。
•“查找和替換”/“/”(不包括引號(hào))。
•選擇所有的記事本。
•過(guò)去,在B列和列刪除A.
•現(xiàn)在你有相同的列表,但完整的URL。
得到的數(shù)據(jù)為Gephi
在這里,我們將上傳的源/目標(biāo)的CSV文件之前創(chuàng)建和命名working.csv。這將創(chuàng)建的邊和節(jié)點(diǎn)網(wǎng)絡(luò)的需要?jiǎng)?chuàng)建圖表。(對(duì)于我們而言,在這里,一個(gè)<strong>節(jié)點(diǎn)</strong>是一個(gè)頁(yè)面,和一個(gè)邊緣代表聯(lián)系頁(yè)。)導(dǎo)入電子表格,只需打開(kāi)Gephi去:文件>導(dǎo)入電子表格。
一個(gè)新的窗口就會(huì)打開(kāi),你會(huì)選擇你的working.csv文件并選擇“邊表”(因?yàn)槲覀冞M(jìn)口頁(yè)面之間的連接)。它看起來(lái)像:
在下一個(gè)屏幕中,你會(huì)發(fā)現(xiàn)一對(duì)夫婦的選擇(在這個(gè)例子中是非常有限的)。只需確保“創(chuàng)建缺少的節(jié)點(diǎn)”復(fù)選框被選中,然后單擊“下一步”。
假設(shè)它打開(kāi)標(biāo)簽(它應(yīng)該在首次使用時(shí)),你將會(huì)看到一些看起來(lái)像:
有點(diǎn)亂,我們也不會(huì)把它清理干凈呢。首先,我們要去數(shù)據(jù)實(shí)驗(yàn)室和出口節(jié)點(diǎn)(閱讀:頁(yè))。
本次數(shù)據(jù)的實(shí)驗(yàn)室,確保你點(diǎn)擊按鈕在左上方的節(jié)點(diǎn)的節(jié)點(diǎn)。曾經(jīng)有一次,只導(dǎo)出表讓你有一個(gè)CSV你所有的節(jié)點(diǎn)。
當(dāng)你打開(kāi)CSV文件,它應(yīng)該有以下列:
•身份證件
•標(biāo)簽
•時(shí)間設(shè)定
你會(huì)添加第四列命名任何度量你想拉。在這里,我要拉的結(jié)合結(jié)構(gòu)域在搜索控制臺(tái)報(bào)告,所以我會(huì)把第四欄(D)”指域。“第五會(huì)”modularity_class。”
你會(huì)想暫時(shí)添加第二張數(shù)據(jù)表,命名為“搜索平臺(tái)”。
在D2單元格(右下方的D列標(biāo)題),輸入以下公式:
=誤差(指數(shù)(搜查控制臺(tái)!C 2 C <strong>136</strong>,匹配(A2,搜查控制臺(tái)!美元:美元136, 0美元2美元),1),“0″)
在我的例子里,有136排在我搜索控制臺(tái)數(shù)據(jù)。你可能會(huì)有所不同,在這種情況下,在上面的公式中的136應(yīng)改為您的列表中的列數(shù)。另外,如果你想列出你的鏈接數(shù),不是指域,你會(huì)改變CS BS這樣的搜索是在代替C B柱
一旦完成,你會(huì)想要復(fù)制引用域柱和使用“粘貼值”命令,將開(kāi)關(guān)細(xì)胞含有公式包含的價(jià)值量指域?yàn)檎麛?shù)。
這個(gè)過(guò)程看起來(lái)像:
現(xiàn)在,終于,你想添加一個(gè)第五列的標(biāo)題是“modularity_class。”盡管Gephi<strong>模塊</strong>內(nèi)置,將聚類(lèi)相似頁(yè)面的內(nèi)部鏈接結(jié)構(gòu)的基礎(chǔ)上,我更喜歡手動(dòng)的方法,明確了網(wǎng)頁(yè)的類(lèi)別。
以我為例,我要指定以下值之一,每個(gè)頁(yè)面中的modularity_class柱,基于網(wǎng)頁(yè)的類(lèi)別:
•0–雜項(xiàng)/其他
•1–博客
•2–資源頁(yè)
•3–公司信息
•4–服務(wù)
•5–主頁(yè)
你如何打破你的類(lèi)別,當(dāng)然,取決于你的網(wǎng)站(例如,你可能會(huì)把你的電子商務(wù)網(wǎng)站的產(chǎn)品類(lèi)型,或者你的旅游網(wǎng)站的位置)。
一旦你保存為CSV命名nodes.csv,你只需要導(dǎo)入電子表格到當(dāng)前項(xiàng)目中使用的數(shù)據(jù)gelphi實(shí)驗(yàn)室屏幕你出口從導(dǎo)入電子表格按鈕。
在下一個(gè)屏幕上,你一定會(huì)“指域”和“modularity_class”設(shè)置為浮動(dòng),確保“力節(jié)點(diǎn)被創(chuàng)建為新的“框選中。然后單擊“下一個(gè)”。一旦進(jìn)口,你會(huì)看到一個(gè)網(wǎng)頁(yè):
然后你就可以點(diǎn)擊返回到概述在Gephi上。在這一點(diǎn)上,你會(huì)發(fā)現(xiàn)不是很多了…但這是關(guān)于。
有很多你可以做Gephi。我建議運(yùn)行PageRank模擬,你會(huì)發(fā)現(xiàn)在設(shè)置在右邊。默認(rèn)的設(shè)置工作?,F(xiàn)在是時(shí)候利用所有這些數(shù)據(jù)。
首先,我們將顏色根據(jù)頁(yè)類(lèi)型的節(jié)點(diǎn)(modularity_class)。在左上角,選擇”節(jié)點(diǎn),然后從下拉菜單的“屬性”,選擇“模塊課”,選擇你喜歡的顏色代表每個(gè)。在我的例子中,我選擇了下面的顏色:
•雜項(xiàng)/橙色
•博客-淡紫色
•資源頁(yè)-亮綠
•公司信息-深綠色
•服務(wù)-藍(lán)色
•首頁(yè)-粉色
這會(huì)給你一些接近:
現(xiàn)在,讓我們使用這些參考節(jié)點(diǎn)域的大小。這個(gè)時(shí)候,我們需要選擇尺寸屬性”指域。”為此,選擇大小的圖標(biāo);然后,在屬性中,選擇“引用域”并設(shè)置最大和最小尺寸。我喜歡用10和50,但每個(gè)圖都是獨(dú)特的,所以找到適合你。
如果你發(fā)現(xiàn)“引用域”列表中沒(méi)有(這有時(shí)會(huì)發(fā)生),這是一個(gè)奇怪的解決方法-同樣奇怪的問(wèn)題和信貸rbsam在GitHub它:
外表上的顏色/屬性可以設(shè)置屬性來(lái)劃分排名在左下方的窗口。如果該屬性設(shè)置為分區(qū),它不會(huì)出現(xiàn)在大小屬性。如果它被設(shè)置為它的排名將出現(xiàn)在大小屬性。
這是什么意思…
好了,現(xiàn)在我們已經(jīng)得到的東西的顏色編碼的網(wǎng)站的各個(gè)部分,通過(guò)對(duì)網(wǎng)頁(yè)鏈接的水平尺寸。它仍然看起來(lái)有點(diǎn)混亂,但是我們還沒(méi)有完成!
下一步是選擇一個(gè)在底部的布局左。他們看起來(lái)都有點(diǎn)不同,具有不同的功能。我最喜歡的是Fruchterman Reingold(如下所示),迫使阿特拉斯2。你也可以玩弄重力(即多少邊緣拉結(jié)在一起)。目前網(wǎng)站出現(xiàn):
只是這個(gè)信息可以給你一個(gè)很有趣的你的網(wǎng)站去查看。重要的是知道,當(dāng)你右鍵點(diǎn)擊任何一個(gè)節(jié)點(diǎn),你可以選擇在數(shù)據(jù)實(shí)驗(yàn)室選擇它。要知道,孤獨(dú)的頁(yè)面頂部的和為什么它只有一個(gè)孤獨(dú)的鏈接嗎?右鍵單擊并查看它在數(shù)據(jù)實(shí)驗(yàn)室(這是一個(gè)網(wǎng)站,僅供參考)。你也可以反過(guò)來(lái)做同樣的。如果你沒(méi)有看到一個(gè)人的頁(yè)面出現(xiàn),你可以找到它的數(shù)據(jù)實(shí)驗(yàn)室,右擊它,選擇它的概述。
這顯示給我們是一個(gè)能夠快速定位異常的網(wǎng)站,找出哪些頁(yè)面是在特定的分組方式,并尋找機(jī)會(huì)提高PageRank和內(nèi)部鏈接權(quán)重的流動(dòng)。
你不該限制
在這篇文章中,我們只看一個(gè)應(yīng)用程序,但有許多人-我們只需要使用我們的想象力。
為什么不把你的MOZ頁(yè)面權(quán)威或谷歌分析傳入的有機(jī)流量和使用的尺寸度量瀏覽你的網(wǎng)站的哪些部分得到最多的交通和幫助發(fā)現(xiàn)問(wèn)題在你的內(nèi)部鏈接結(jié)構(gòu)呢?
為什么不把頁(yè)面權(quán)重度量 Patrick Stox正在與在他的文章和合并大小頁(yè)面的傳入流量?用正確的調(diào)整,你可以得到一個(gè)內(nèi)頁(yè)的強(qiáng)度計(jì)算和流量之間的關(guān)系感到。
如果有一個(gè)度量,可以分配到一個(gè)頁(yè)面或一個(gè)鏈接,它可以用在這里。想想有意義的可視化顯示,并按照上述步驟做。
這只是冰山一角。一個(gè)我用這個(gè)工具最強(qiáng)大的東西是有助于預(yù)測(cè)其內(nèi)部連接結(jié)構(gòu)的重大變化后,網(wǎng)站會(huì)發(fā)生什么。但那是下個(gè)月的文章的主題!